У меня есть задание для вычисления одних и тех же фраз в двух текстах для расчета точности системы прогнозирования паузы.
Например:
- исходное предложение: I / 1 завтракаю / 1 до /1 посещение / 1 школа.
- предложение из системы прогнозирования паузы: я / 1 имею / 1 завтрак / 1 перед / 1 посещением / 1 в / 1 школу.
Вывод, который мне нужноget:
- релевантная_фокусная_фраза: 3
- релевантная_потоковая_фраза: 2
- нерелевантная: 4
Объяснение того, как получить выходной номер:
- для релевантной_пика_фокусной фразы: проверить и сосчитатьодни и те же фразы между 2 предложениями (I, before, school = 3)
- для релевантного_предоставления_фразы: проверьте и сосчитайте разные фразы между 2 предложениями в исходном предложении (завтракайте, переходя к = 2)
- для not_relevant:проверить и сосчитать разные фразы между двумя предложениями в предложении из системы прогнозирования паузы (есть, завтракает, собирается, = 4)
Какмы можем написать код на python, чтобы вычислить фразы, чтобы получить этот вывод?Я пытался, но не могу найти точный расчет.