Java: как проверить текст на естественном языке - PullRequest
0 голосов
/ 10 октября 2019

Я использую OCR для распознавания (немецкого) текста на изображении. Это работает хорошо, но не идеально. Иногда слово путается. Поэтому я хочу реализовать какую-то проверку. Конечно, я могу просто использовать список слов и найти слова, которые похожи на испорченное слово, но есть ли способ проверить, является ли предложение правдоподобным с этими словами?

В конце концов, мой смартфон может дать мне хорошие советы о том, как завершить предложение.

1 Ответ

1 голос
/ 10 октября 2019

Вам нужно искать решения для обработки естественного языка (NLP). С их помощью вы можете синтаксически проверять лексическое (либо весь текст, что может быть лучше, поскольку некоторые из них могут принимать во внимание контекст, либо фразу за фразой).

Я не являюсь экспертом в этой области, но эта статья может помочь вам выбрать инструмент для начала попыток.

Кроме того, обратите внимание: ваша клавиатура на вашем мобильном телефоне разрабатывается и поддерживается специализированными группами, либо в Apple, Googleили любая другая компания, которую вы используете их приложение. Поэтому, пожалуйста, не стоит недооценивать эту задачу: есть десятки областей исследований по этому вопросу, которые включают инженеров-программистов и лингвистов для достижения правильных результатов.

Редактировать: хорошо, два дня спустя, ятолько что пришел по этой ссылке: https://medium.com/quick-code/12-best-natural-language-processing-courses-2019-updated-2a6c28aebd48

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...