Моя попытка инициализации значения интерпретируется как объявление функции, и почему не A a (()); реши это? - PullRequest
152 голосов
/ 15 сентября 2009

Среди многих вещей, которым научил меня переполнение стека, является то, что известно как «самый неприятный синтаксический анализ», что классически демонстрируется такой строкой, как

A a(B()); //declares a function

Хотя для большинства это интуитивно кажется объявлением объекта a типа A, принимая временный объект B в качестве параметра конструктора, на самом деле это объявление функции a, возвращающей A, принимая указатель на функцию, которая возвращает B и сама не принимает параметров. Аналогично линия

A a(); //declares a function

также подпадает под ту же категорию, поскольку вместо объекта объявляет функцию. Теперь, в первом случае, обычным решением этой проблемы является добавление дополнительного набора скобок / круглых скобок вокруг B(), так как компилятор будет интерпретировать его как объявление объекта

A a((B())); //declares an object

Однако, во втором случае, то же самое приводит к ошибке компиляции

A a(()); //compile error

Мой вопрос: почему? Да, я очень хорошо знаю, что правильный «обходной путь» - это изменить его на A a;, но мне любопытно узнать, что делает дополнительная () для компилятора в первом примере, который затем не ' не работает при повторном применении во втором примере. Является ли обходной путь A a((B())); конкретным исключением, записанным в стандарте?

Ответы [ 5 ]

70 голосов
/ 15 сентября 2009

Просветленного ответа нет, просто потому, что он не определен как допустимый синтаксис языком C ++ ... Так оно и есть, по определению языка.

Если у вас есть выражение внутри, тогда оно действительно. Например:

 ((0));//compiles

Еще проще: потому что (x) является допустимым выражением C ++, а () - нет.

Чтобы узнать больше о том, как определяются языки и как работают компиляторы, вы должны узнать о Формальной теории языков или, более конкретно, Контекстно-свободные грамматики (CFG) и связанных материалах, таких как конечный конечные автоматы. Если вам это интересно, хотя страниц википедии будет недостаточно, вам нужно будет получить книгу.

36 голосов
/ 21 июля 2011

Окончательное решение этой проблемы - перейти на единый синтаксис инициализации C + 11, если можете.

A a{};

http://www.stroustrup.com/C++11FAQ.html#uniform-init

28 голосов
/ 18 мая 2014

C функции объявления

Прежде всего, есть C. В C, A a() - это объявление функции. Например, putchar имеет следующую декларацию. Обычно такие объявления хранятся в заголовочных файлах, однако ничто не мешает вам писать их вручную, если вы знаете, как выглядит объявление функции. Имена аргументов являются необязательными в объявлениях, поэтому в этом примере я опустил их.

int putchar(int);

Это позволяет вам написать код следующим образом.

int puts(const char *);
int main() {
    puts("Hello, world!");
}

C также позволяет вам определять функции, которые принимают функции в качестве аргументов, с приятным читаемым синтаксисом, который выглядит как вызов функции (ну, это читабельно, пока вы не вернете указатель на функцию).

#include <stdio.h>

int eighty_four() {
    return 84;
}

int output_result(int callback()) {
    printf("Returned: %d\n", callback());
    return 0;
}

int main() {
    return output_result(eighty_four);
}

Как я уже говорил, C позволяет опускать имена аргументов в заголовочных файлах, поэтому output_result будет выглядеть так в заголовочном файле.

int output_result(int());

Один аргумент в конструкторе

Разве вы не узнаете это? Что ж, позвольте мне напомнить вам.

A a(B());

Да, это точно такое же объявление функции. A равно int, a равно output_result, а B равно int.

Вы можете легко заметить конфликт C с новыми функциями C ++. Точнее, конструкторы, представляющие имя класса и круглые скобки, и альтернативный синтаксис объявления с () вместо =. По своей природе C ++ пытается быть совместимым с кодом C, и поэтому ему приходится иметь дело с этим случаем - даже если это практически никого не волнует. Поэтому старые функции C имеют приоритет над новыми функциями C ++. Грамматика объявлений пытается сопоставить имя как функцию, прежде чем вернуться к новому синтаксису с () в случае сбоя.

Если бы одна из этих функций не существовала или имела другой синтаксис (например, {} в C ++ 11), эта проблема никогда бы не возникла для синтаксиса с одним аргументом.

Теперь вы можете спросить, почему A a((B())) работает. Хорошо, давайте объявим output_result с бесполезными скобками.

int output_result((int()));

Это не сработает. Грамматика требует, чтобы переменная не была в скобках.

<stdin>:1:19: error: expected declaration specifiers or ‘...’ before ‘(’ token

Однако C ++ ожидает стандартного выражения здесь. В C ++ вы можете написать следующий код.

int value = int();

И следующий код.

int value = ((((int()))));

C ++ ожидает, что выражение внутри скобок будет ... ну ... выражением, в отличие от типа C, ожидаемого. Скобки здесь ничего не значат. Однако, вставляя бесполезные скобки, объявление функции C не совпадает, и новый синтаксис может быть сопоставлен должным образом (который просто ожидает выражение, такое как 2 + 2).

Дополнительные аргументы в конструкторе

Конечно, один аргумент хорош, но как насчет двух? Дело не в том, что конструкторы могут иметь только один аргумент. Один из встроенных классов, который принимает два аргумента: std::string

std::string hundred_dots(100, '.');

Это все хорошо (технически, у него будет самый неприятный синтаксический анализ, если он будет записан как std::string wat(int(), char()), но давайте будем честными - кто бы это написал? Но давайте предположим, что у этого кода есть неприятная проблема. Предположим, что вы должны поместить все в скобки.

std::string hundred_dots((100, '.'));

Не совсем так.

<stdin>:2:36: error: invalid conversion from ‘char’ to ‘const char*’ [-fpermissive]
In file included from /usr/include/c++/4.8/string:53:0,
                 from <stdin>:1:
/usr/include/c++/4.8/bits/basic_string.tcc:212:5: error:   initializing argument 1 of ‘std::basic_string<_CharT, _Traits, _Alloc>::basic_string(const _CharT*, const _Alloc&) [with _CharT = char; _Traits = std::char_traits<char>; _Alloc = std::allocator<char>]’ [-fpermissive]
     basic_string<_CharT, _Traits, _Alloc>::
     ^

Я не уверен, почему g ++ пытается конвертировать char в const char *. В любом случае, конструктор вызывался только с одним значением типа char. Перегрузка с одним аргументом типа char отсутствует, поэтому компилятор запутан. Вы можете спросить - почему аргумент имеет тип char?

(100, '.')

Да, , вот оператор запятой. Оператор запятой принимает два аргумента и дает аргумент справа. Это не очень полезно, но это то, что нужно знать по моим объяснениям.

Вместо этого, чтобы решить самый неприятный синтаксический анализ, необходим следующий код.

std::string hundred_dots((100), ('.'));

Аргументы приведены в скобках, а не во всем выражении. Фактически, только одно из выражений должно быть в скобках, так как достаточно немного отойти от грамматики C, чтобы использовать функцию C ++. Все сводит нас к нулю аргументов.

Нулевые аргументы в конструкторе

Возможно, вы заметили функцию eighty_four в моем объяснении.

int eighty_four();

Да, на это также влияет самый неприятный анализ. Это правильное определение, которое вы, скорее всего, видели, если создавали заголовочные файлы (и вам следует). Добавление скобок не исправляет это.

int eighty_four(());

Почему это так? Ну, () это не выражение. В C ++ вы должны поместить выражение в скобки. Вы не можете написать auto value = () на C ++, потому что () ничего не значит (и даже если бы сделал, как пустой кортеж (см. Python), это был бы один аргумент, а не ноль). Практически это означает, что вы не можете использовать сокращенный синтаксис без использования синтаксиса {} в C ++ 11, так как в скобках нет выражений, а грамматика C для объявлений функций всегда применяется.

12 голосов
/ 03 февраля 2010

Вы могли бы вместо

A a(());

использование

A a=A();
6 голосов
/ 15 сентября 2009

Самым внутренним пареном в вашем примере будет выражение, а в C ++ грамматика определяет expression как assignment-expression или другой expression, за которым следует запятая и еще один assignment-expression (Приложение A.4 - Грамматическое резюме / Выражения).

Грамматика далее определяет assignment-expression как один из нескольких других типов выражений, ни один из которых не может быть ничем (или только пробелом).

Так что причина, по которой вы не можете получить A a(()), заключается просто в том, что грамматика не позволяет этого. Тем не менее, я не могу ответить, почему люди, создавшие C ++, не допускали такого особого использования пустых паренов в качестве какого-то особого случая - я предполагаю, что они бы не стали помещать такой особый случай, если бы был разумная альтернатива.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...