API-интерфейс транскрипта youtube python проверяет немного разговорные немецкие числа.
В Германии все немного иначе, как мы произносили числа.
например, число: 15505 Мы говорим 15.000 500 5 (пробелы важны как короткие перерывы)
Например, число: 15515 Мы говорим 15.000 500 15 (пробелы важны как короткие перерывы)
Если у меня есть текст из API Transscript Youtube, он иногда говорит мне правильное число, иногда нет:
Дано: В 2000 году 19 на 6 ноября число 15000 500 15 было больше, чем 15,5005 лучше выберите более высокое значение для вашей корзины. Но число 13 100 гораздо меньше.
Требуется: в 2019 году в 6. В ноябре число 15515 было больше, чем 15505, лучше выберите более высокое значение для своей корзины. Но число 13100 намного меньше.
Итак, я не уверен, как его проверить - с помощью регулярного выражения, NLTK?
-Все, что разделено пустой строкой - без точек
Есть идеи?