Более эффективный подход заключается в загрузке словаря, который затем можно загрузить локально. Это дает вам локальный файл или базу данных, которые легко доступны для поиска.
Этот подход не только эффективен в вычислительном отношении, но и гарантирует, что вы используете информацию правильно по ее лицензии. То, что вы предлагаете, обычно называется «очисткой» и может go противоречить различным лицензиям и условиям обслуживания.
В этом сообщении перечислены несколько свободно доступных и свободно лицензируемых словарей.
Этот вопрос AskUbuntu.SE описывает еще некоторые технические работы, необходимые для получения бесплатного словаря и ссылки на него из командной строки. Вы хотели бы скопировать эти шаблоны чтения, чтобы загрузить данные в Java.
. Еще одним подходом было бы использование свободно доступного и надлежащим образом лицензированного API, такого как https://dictionaryapi.com/. При этом все равно используются HTTP-вызовы, но он явно лицензирован и также является явным API для поиска определений слов на человеческом языке. Это преимущество перед чисткой Google, потому что вам не придется анализировать HTML, и у вас есть соответствующая лицензия на его использование.
Наконец, есть некоторые похожие, если не повторяющиеся, вопросы о StackOverflow и StackExchange. например, такой: Как реализовать словарь Engli sh в Java?