17. Описания.

Описания используются для указания интерпретации, которую язык "C" будет давать каждому идентификатору; они не обязательно резервируют память, соответствующую идентификатору. Описания имеют форму

Описание:
спецификаторы-описания список-описателейнеоб;
Описатели в списке описателей содержат описываемые идентификаторы. Спецификаторы описания представляют собой последовательность спецификаторов типа и спецификаторов класса памяти.

Спецификаторы-описания:
спецификатор-типа спецификаторы-описаниянеоб
спецификатор-класса-памяти спецификатор-описаниянеоб

Список должен быть самосогласованным в смысле, описываемом ниже.

Содержание

17.1. Спецификаторы класса памяти.
17.2. Спецификаторы типа.
17.3. Описатели.
17.4. Смысл описателей.
17.5. Описание структур и об'единений.
17.6. Инициализация.
17.7. Имена типов.
17.8. Typedef.


17.1. Спецификаторы класса памяти.

ниже перечисляются спецификаторы класса памяти:

Спецификатор-класса-памяти:
auto
static
extern
register
typedef

Спецификатор typedef не резервирует памяти и называется "спецификатором класса памяти" только по синтаксическим соображениям; это обсуждается в п. 17.8. Смысл различных классов памяти был обсужден в п. 13.

Описания auto, static и register служат также в качестве определений в том смысле, что они вызывают резервирование нужного количества памяти. В случае extern должно присутствовать внешнее определение (п. 19) указываемых идентификаторов гдe-то вне функции, в которой они описаны.

Описание register лучше всего представлять себе как описание auto вместе с намеком компилятору, что описанные таким образом переменные будут часто использоваться. Эффективны только несколько первых таких описаний. Кроме того, в регистрах могут храниться только переменные определенных типов; на pdp-11 это int, char или указатель. Существует и другое ограничение на использование регистровых переменных: к ним нельзя применять операцию взятия адреса &. При разумном использовании регистровых описаний можно ожидать получения меньших по размеру и более быстрых программ, но в будующем улучшение генерирования кодов может сделать их ненужными.

Описание может содержать не более одного спецификатора класса памяти. Если описание не содержит спецификатора класса памяти, то считается, что он имеет значение auto, если описание находится внутри некоторой функции, и extern в противном случае. Исключение: функции никогда не бывает автоматическими.


17.2. Спецификаторы типа.

Ниже перечисляются спецификаторы типа.

Спецификатор-типа:
char
short
int
long
unsigned
float
double
спецификатор-структуры-или-об'единения
определяющеe-тип-имя

Слова long, short и usigned можно рассматривать как прилагательные; допустимы следующие комбинации:


  short int
  long int
  usigned int
  long float
Последняя комбинация означает то же, что и double. В остальном описание может содержать не более одного спецификатора типа. Если описание не содержит спецификатора типа, то считается, что он имеет значение int.

Спецификаторы структур и об'единений обсуждаются в п. 17.5; описания с определяющими тип именами typedef обсуждаются в п. 17.8.


17.3. Описатели.

Входящий в описание список описателей представляет собой последовательность разделенных запятыми описателей, каждый из которых может иметь инициализатор.

Список-описателей:
инициализируемый-описатель
инициализируемый-описатель, список-описателей
инициализируемый-описатель:
описатель-инициализаторнеоб

Инициализаторы описываются в п. 17.6. Спецификаторы и описания указывают тип и класс памяти об'ектов, на которые ссылаются описатели. Описатели имеют следующий синтаксис:

Описатель:
идентификатор
( описатель )
* описатель
описатель ()
описатель [константноe-выражениенеоб]

Группирование такое же, как и в выражениях.


17.4. Смысл описателей.

Каждый описатель рассматривается как утверждение того, что когда конструкция той же самой формы, что и описатель, появляется в выражении, то она выдает об'ект указанного типа и указанного класса памяти. Каждый описатель содержит ровно один идентификатор; это именно тот идентификатор, который и описывается.

Если в качестве описателя появляется просто идентификатор, то он имеет тип, указываемый в специфицирующем заголовке описания.

Описатель в круглых скобках идентичен описателю без круглых скобок, но круглые скобки могут изменять связи в составных описателях. Примеры смотри ниже.

Представим себе описание


 t di
где t - спецификатор типа (подобный int и т.д.), а di - описатель. Предположим, что это описание приводит к тому, что соответствующий идентификатор имеет тип "...t", где "..." пусто, если di просто отдельный идентификатор (так что тип х в "int х" просто int). Тогда, если di имеет форму

 *d
то содержащийся идентификатор будет иметь тип "... Указатель на t".

Если di имеет форму


 d()
то содержащийся идентификатор имеет тип "... Функция, возвращающая t".

Если di имеет форму


 d[константноe-выражение]
или

 d[ ]
то содержащийся идентификатор имеет тип "...массив t". В первом случае константным выражением является выражение, значение которого можно определить во время компиляции и которое имеет тип int. (точное определение константного выражения дано в п. 24). Когда несколько спецификаций вида "массив из" оказываются примыкающими, то создается многомерный массив; константное выражение, задающее границы массивов, может отсутствовать только у первого члена этой последовательности. Такое опускание полезно, когда массив является внешним и его фактическое определение, которое выделяет память, приводится в другом месте. Первое константное выражение может быть опущено также тогда, когда за описателем следует инициализация. В этом случае размер определяется по числу приведенных инициализируемых элементов.

Массив может быть образован из элементов одного из основных типов, из указателей, из структур или об'единений или из других массивов (чтобы образовать многомерный массив).

Не все возможности, которые разрешены с точки зрения указанного выше синтаксиса, фактически допустимы. Имеются следующие ограничения: функции не могут возвращать массивы, структуры, об'единения или функции, хотя они могут возвращать указатели на такие вещи; не существует массивов функций, хотя могут быть массивы указателей на функции. Аналогично, структуры или об'единения не могут содержать функцию, но они могут содержать указатель на функцию.

В качестве примера рассмотрим описание


 int i, *ip, f(), *fip(), (*pfi)();
в котором описывается целое i, указатель ip на целое, функция f, возвращающая целое, функция fip, возвращающая указатель на целое, и указатель pfi на функцию, которая возвращает целое. Особенно полезно сравнить два последних описателя. Связь в *fip() можно представить в виде *(fip()), так что описанием предполагается, а такой же конструкцией в выражении требуется обращение к функции fip и последующее использование косвенной адресации для выдачи с помощью полученного результата (указателя) целого. В описателе (*pfi)() дополнительные скобки необходимы, поскольку они точно так же, как и в выражении, указывают, что косвенная адресация через указатель на функцию выдает функцию, которая затем вызывается; эта вызванная функция возвращает целое.

В качестве другого примера приведем описание


  float fa[17], *afp[17];
в котором описывается массив чисел типа float и массив указателей на числа типа float. Наконец,

 static int x3d[3][5][7];
описывает статический трехмерный массив целых размером 3*5*7. Более подробно, x3d является массивом из трех элементов; каждый элемент является массивом пяти массивов; каждый последний массив является массивом из семи целых. Каждое из выражений x3d, x3d[i], x3d[i][j] и x3d[i][j][k] может разумным образом появляться в выражениях. Первые три имеют тип "массив", последнее имеет тип int.


17.5. Описание структур и об'единений.

Структура - это об'ект, состоящий из последовательности именованных членов. Каждый член может быть произвольного типа. Об'единение - это об'ект, который в данный момент может содержать любой из нескольких членов. Спецификаторы и об'единения имеют одинаковую форму.

Спецификатор структуры-или-об'единения:
структура-или-об'единение { список-описаний-структуры }
идентификатор-структуры-или-об'единения { список-описаний-структуры }
идентификатор-структуры-или-об'единения

Структура-или-об'единение:
struct
union

Список-описаний-структуры является последовательностью описаний членов структуры или об'единения:

Список-описаний-структуры:
описаниe-структуры
описаниe-структуры список-описаний-структуры

Описаниe-структуры:
спецификатор-типа список-описателей-структуры

Список-описателей-структуры:
описатель-структуры
описатель-структуры, список-описателей-структуры

В обычном случае описатель структуры является просто описателем члена структуры или об'единения. Член структуры может также состоять из специфицированного числа битов. Такой член называется также полем; его длина отделяется от имени поля двоеточием.

Описатель-структуры:
описатель
описатель: константное выражение
: константное выражение

Внутри структуры описанные в ней об'екты имеют адреса, которые увеличиваются в соответствии с чтением их описаний слева направо. Каждый член структуры, который не является полем, начинается с адресной границы, соответствующей его типу; следовательно в структуре могут оказаться неименованные дыры. Члены, являющиеся полями, помещаются в машинные целые; они не перекрывают границы слова. Поле, которое не умещается в оставшемся в данном слове пространстве, помещается в следующее слово. Поля выделяются справа налево на pdp-11 и слева направо на других машинах.

Описатель структуры, который не содержит описателя, а только двоеточие и ширину, указывает неименованное поле, полезное для заполнения свободного пространства с целью соответствия задаваемых извне схемам. Специальный случай неименованного поля с шириной 0 используется для указания о выравнивании следующего поля на границу слова. При этом предполагается, что "следующее поле" действительно является полем, а не обычным членом структуры, поскольку в последнем случае выравнивание осуществляется автоматически.

Сам язык не накладывает ограничений на типы об'ектов, описанных как поля, но от реализаций не требуется обеспечивать что-либо отличное от целых полей. Более того, даже поля типа int могут рассматриваться как неимеющие знака. На pdp-11 поля не имеют знака и могут принимать только целые значения. Во всех реализациях отсутствуют массивы полей и к полям не применима операция взятия адреса &, так что не существует и указателей на поля.

Об'единение можно представить себе как структуру, все члены которой начинаются со смещения 0 и размер которой достаточен, чтобы содержать любой из ее членов. В каждый момент об'единение может содержать не более одного из своих членов.

Спецификатор структуры или об'единения во второй форме, т.е. один из

описывает идентификатор в качестве ярлыка структуры (или ярлыка об'единения) структуры, специфицированной этим списком. Последующее описание может затем использовать третью форму спецификатора, один из Ярлыки структур дают возможность определения структур, которые ссылаются на самих себя; они также позволяют неоднократно использовать приведенную только один раз длинную часть описания. Запрещается описывать структуру или об'единение, которые содержат образец самого себя, но структура или об'единение могут содержать указатель на структуру или об'единение такого же вида, как они сами.

Имена членов и ярлыков могут совпадать с именами обычных переменных. Однако имена ярлыков и членов должны быть взаимно различными.

Две структуры могут иметь общую начальную последовательность членов; это означает, что тот же самый член может появиться в двух различных структурах, если он имеет одинаковый тип в обеих структурах и если все предыдущие члены обеих структур одинаковы. (фактически компилятор только проверяет, что имя в двух различных структурах имеет одинаковый тип и одинаковое смещение, но если предшествующие члены отличаются, то конструкция оказывается непереносимой).

Вот простой пример описания структуры:


 struct tnode {
        char tword[20];
        int count;
        struct tnode *left;
        struct tnode *right;
 };
Такая структура содержит массив из 20 символов, целое и два указателя на подобные структуры. Как только приведено такое описание, описание

 struct tnode s, *sp;
говорит о том, что s является структурой указанного вида, а sp является указателем на структуру указанного вида. При наличии этих описаний выражение

 sp->count
ссылается к полю count структуры, на которую указывает sp; выражение

 s.left
ссылается на указатель левого поддерева в структуре s, а выражение

 s.right->tword[0]
ссылается на первый символ члена tword правого поддерева из s.


17.6. Инициализация.

Описатель может указывать начальное значение описываемого идентификатора. Инициализатор состоит из выражения или заключенного в фигурные скобки списка значений, перед которыми ставится знак =.

Инициализатор:
= выражение
= {список-инициализатора}
= {список-инициализатора,}

Список-инициализатора:
выражение
список-инициализатора, список-инициализатора
{список-инициализатора}

Все выражения, входящие в инициализатор статической или внешней переменной, должны быть либо константными выражениями, описываемыми в п. 24, либо выражениями, которые сводятся к адресу ранее описанной переменной, возможно смещенному на константное выражение. Автоматические и регистровые переменные могут быть инициализированы произвольными выражениями, включающими константы и ранее описанные переменные и функции.

Гарантируется, что неинициализированные статические и внешние переменные получают в качестве начальных значений 0;неинициализированные автоматические и регистровые переменные в качестве начальных значений содержат мусор.

Когда инициализатор применяется к скаляру (указателю или об'екту арифметического типа), то он состоит из одного выражения, возможно заключенного в фигурные скобки. Начальное значение об'екта находится из выражения; выполняются те же самые преобразования, что и при присваивании.

Когда описываемая переменная является агрегатом (структурой или массивом), то инициализатор состоит из заключенного в фигурные скобки и разделенного запятыми списка инициализаторов для членов агрегата. Этот список составляется в порядке возрастания индекса или в соответствии с порядком членов. Если агрегат содержит подагрегаты, то это правило применяется рекурсивно к членам агрегата. Если количество инициализаторов в списке оказывается меньше числа членов агрегата, то оставшиеся члены агрегата заполняются нулями. Запрещается инициализировать об'единения или автоматические агрегаты.

Фигурные скобки могут быть опущены следующим образом. Если инициализатор начинается с левой фигурной скобки, то последующий разделенный запятыми список инициализаторов инициализирует члены агрегата; будет ошибкой, если в списке окажется больше инициализаторов, чем членов агрегата. Если однако инициализатор не начинается с левой фигурной скобки, то из списка берется только нужное для членов данного агрегата число элементов; оставшиеся элементы используются для инициализации следующего члена агрегата, частью которого является настоящий агрегат.

Последнее сокращение допускает возможность инициализации массива типа char с помощью строки. В этом случае члены массива последовательно инициализируются символами строки.

Например,


 int x[] = {1,3,5};
описывает и инициализирует х как одномерный массив; поскольку размер массива не специфицирован, а список инициализитора содержит три элемента, считается, что массив состоит из трех членов.

Вот пример инициализации с полным использованием фигурных скобок:


 float *y[4][3] = {
 { 1, 3, 5 },
 { 2, 4, 6 },
 { 3, 5, 7 },
 };
Здесь 1, 3 и 5 инициализируют первую строку массива y[0], а именно y[0][0], y[0][1] и y[0][2]. Аналогичным образом следующие две строчки инициализируют y[1] и y[2]. Инициализатор заканчивается преждевременно, и, следовательно массив y[3] инициализируется нулями. В точности такого же эффекта можно было бы достичь, написав

 float y[4][3] = {
 1, 3, 5, 2, 4, 6, 3, 5, 7
 };
Инициализатор для y начинается с левой фигурной скобки, но инициализатора для y[0] нет. Поэтому используется 3 элемента из списка. Аналогично следующие три элемента используются последовательно для y[1] и y[2]. Следующее описание

 float y[4][3] = {
 {1}, {2}, {3}, {4}
 };
инициализирует первый столбец y (если его рассматривать как двумерный массив), а остальные элементы заполняются нулями.

И наконец, описание


  char msg[] = "syntax error on line %s\n";
демонстрирует инициализацию элементов символьного массива с помощью строки.


17.7. Имена типов.

В двух случаях (для явного указания типа преобразования в конструкции перевода и для аргументов операции sizeof) желательно иметь возможность задавать имя типа данных. Это осуществляется с помощью "имени типа", которое по существу является описанием об'екта такого типа, в котором опущено имя самого об'екта.

Имя типа:
спецификатор-типа абстрактный-описатель

Абстрактный-описатель:
пусто
(абстрактный-описатель)
* абстрактный описатель
абстрактный-описатель ()
абстрактный-описатель [константное выражениенеоб]

Во избежании двусмысленности в конструкции


 (абстрактный описатель)
требуется, чтобы абстрактный-описатель был непуст. При этом ограничении возможно однозначено определить то место в абстрактном-описателе, где должен появиться идентификатор, если бы эта конструкция была описателем в описании. Именованный тип совпадает тогда с типом гипотетического идентификатора. Например, имена типов

 int
 int *
 int *[3]
 int (*)[3]
 int *()
 int (*)()
именуют соответственно типы "целый", "указатель на целое", "массив из трех указателей на целое", "указатель на массив из трех целых", " функция, возвращающая указатель на целое" и "указатель на функцию, возвращающую целое".


17.8. Typedef.

Описания, в которых "класс памяти" специфицирован как typedef, не вызывают выделения памяти. Вместо этого они определяют идентификаторы ,которые позднее можно использовать так, словно они являются ключевыми словами, имеющими основные или производные типы.


 Определяющее-тип-имя
  идентификатор
В пределах области действия описания со спецификатором typedef каждый идентификатор, являющийся частью любого описателя в этом описании, становится синтаксически эквивалентным ключевому слову, имеющему тот тип, который ассоциирует с идентификатором в описанном в п. 17.4 смысле. Например, после описаний

 typedef int miles, *klicksp;
 typedef struct { double re, im; } complex;
конструкции

 miles distance;
 extern klicksp metricp;
 complex z, *zp;
становятся законными описаниями; при этом типом distance является int, типом metricp - "указатель на int", типом z - специфицированная структура и типом zp - указатель на такую структуру.

Спецификатор typedef не вводит каких-либо совершенно новых типов, а только определяет синонимы для типов, которые можно было бы специфицировать и другим способом. Так в приведенном выше примере переменная distance считается имеющей точно такой же тип, что и любой другой об'ект, описанный в int.