Чтобы определить начальные слова в предложениях вопроса, вы должны пройти через большой текстовый корпус в поисках предложений, заканчивающихся на ?
, и найти наиболее часто встречающиеся начальные слова, которые вы найдете в них.
Некоторые из тех, которые вы пропустили, которые приходят на ум, включают в себя то, что, AM, ARE, WAS, WERE, MAY, MIGHT, CAN, COULD, WILL, SHALL, WALLD, SHULD, HAS, HAVE, HAD и DID.Возможно также, ЕСЛИ идти с КОГДА.Также рассмотрите IN, AT, TO, FROM и ON, а также, возможно, UNDER и OVER.Все зависит от типа системы запросов, которую вы имеете, и от того, сколько широты в запросах на естественном языке вы надеетесь предоставить своим пользователям.
Точно так же вы должны проверить все свои собственные запросы, которые люди уже сделали в том же свете.выяснение, какие из их вопросов на самом деле заканчиваются оканчиваются на ?
, чтобы помочь идентифицировать аналогичные вопросы, которые этого не делают.
Это должно найти множество вопросов;Являются ли императивы также возможностью?
В зависимости от того, насколько вы хотите, вы можете подумать об использовании чего-то вроде Wordnet в качестве начала пометки части речи.В основном это наборы синонимов, в том числе гипернимый, гипонимный, голонимный и меронимный, но я думаю, что он также будет содержать другую информацию, которую вы ищете.
В Википедии есть пара статей по ответы на вопросы и поисковые системы на естественном языке .У обоих есть ссылки, которые вы можете использовать.Вы также можете просмотреть следующие документы в формате PDF:
Наконец, система ответов на вопросы на естественном языке START от MIT кажется интересной.