Я хочу знать, есть ли какие-либо общедоступные наборы данных, которые содержат вопросы и другие предложения.Мне нужно, чтобы построить классификатор вопросов -> классификатор, который говорит, является ли данное предложение вопросом или нет.Если такого набора данных нет, каков наилучший способ его создания?
Я пытался искать в Интернете, но смог найти только наборы данных, которые имеют разные категории для вопроса или другой классификации текста.
РЕДАКТИРОВАТЬ В итоге я использовал набор данных CoQA.Я разбил предложения на истории как не вопросы и использовал стандартные вопросы как вопросы.