Итак, немного предыстории: я пытаюсь обучить систему ML отвечать на вопросы о событиях, где описания событий и вопросы задаются на естественном языке; описания событий ограничены тем, чтобы быть отдельными предложениями.
До сих пор главной проблемой было обнаружение корпуса, описывающего события с достаточно ограниченным словарным запасом, чтобы задавать подобные вопросы по всем событиям (например, если все события касались шахмат, я мог бы разумно спросить «какая часть сдвинулась»). ? 'и ответ может быть получен из приличного процента предложений с описанием события).
Имея это в виду, я надеюсь найти текстовый источник, который тесно сфокусирован на описании событий в какой-то довольно ограниченной теме (например, больше по шахматным комментариям, чем по шахматному форуму).
Хотя мне немного повезло с корпусом диалоговых окон авиадиспетчера , большинство предложений не являются типичными английскими (в них много Чарли, Танго и т. Д.). Однако, если формат такой, как я описал, актуальная тема фокуса не имеет значения, если она есть.
Поскольку я планирую построить свой собственный корпус из этого текста, пометки не требуются.