В синтаксическом разборе вопроса правильная структура будет иметь вид:
(SBARQ (WH+ (W+) ...)
(SQ ...*
(V+) ...*)
(?))
Итак, используя любой из доступных синтаксических анализаторов, дерево с узлом SBARQ имеет встроенный SQ.(опционально) будет индикатором ввода является вопрос.Узел WH + (WHNP / WHADVP / WHADJP) содержит основание вопроса (кто / что / когда / где / почему / как), а SQ содержит перевернутую фразу.
, то есть:
(SBARQ
(WHNP
(WP What))
(SQ
(VBZ is)
(NP
(DT the)
(NN question)))
(. ?))
Конечно, наличие множества предыдущих пунктов приведет к ошибкам при разборе (которые можно обойти), так же как и к действительно плохо написанным вопросам.Например, заголовок этого поста "Как узнать, является ли предложение вопросом?"будет иметь SBARQ, но не SQ.