Теперь это сложная проблема, для которой я не могу найти хорошее решение. Предположим, у нас есть строка в Java: «Он съел 3 яблока сегодня». Теперь цифра 3 может быть легко идентифицирована в Java с помощью функции isNumeric или с помощью регулярных выражений. Но что, если у меня есть Строка типа: «Он съел три яблока сегодня»? Как я могу определить, что три на самом деле число? Я использовал OpenNlp и использовал его POS-тегер, но время, которое требуется, действительно слишком много! Кто-нибудь может предложить лучшее решение для этого? Также среди «.bin» OpenNlp есть один файл - «num.bin», но я не знаю, как использовать этот файл. Документация OpenNlp также ничего не говорит об этом. Может кто-нибудь сказать мне, если это именно то, что я искал, и если да, то как его использовать.
/ ************* ***************** ***************** ***************** ***************** ************************************************ /
У меня на самом деле мало времени, поэтому я остановился на временном решении здесь. Создайте файл / словарь и возьмите все записи в хеш-таблице. Затем я размечу свое предложение и проверим слово за словом числа, аналогично тому, что вы, ребята, предложили. Я буду обновлять файл по мере необходимости. Спасибо за ваши ценные предложения, ребята, и если у вас есть что-то лучшее, чем это, я был бы очень рад. OpenNlp реализует это очень хорошо, единственная проблема - сложность времени, и я хочу сделать это в минимально возможное время.