Давайте предположим, что у меня есть набор данных автомобильных аварий. Каждая авария имеет текстовое описание, сделанное с использованием набора камер и других датчиков.
Предположим, теперь у меня есть данные только одной камеры (например, фронтальной), и я хочу удалить все предложения описания, которые не связаны с ним. Я думаю, что базовое и простое решение могло бы заключаться в использовании логической системы поиска, использующей набор специфических c ключевых слов для удаления нежелательных предложений, но я не знаю, является ли это хорошей идеей, если она могла бы работать ; кто-то может предложить мне какую-нибудь идею? Какие статистические данные могут быть полезны для изучения этой проблемы? Спасибо