Черри выбрать австралийский адрес со страницы текста - PullRequest
1 голос
/ 31 декабря 2010

Я пытаюсь разобрать абзац прозы для всего, что может напоминать адрес. У меня есть база данных адресов, с которыми я сопоставляюсь, и это единственные адреса, которые меня интересуют. Я использую ламповый сервер, но ответы на конкретные вопросы по технологиям мне не нужны. Еще вопрос о том, как.

Кто-нибудь может дать идеи? Может быть, Regex? или, может быть, я должен использовать базу данных городов / штатов и т. д.

Спасибо.

1 Ответ

0 голосов
/ 24 февраля 2011

Похоже, что этот вопрос не получил ответа, потому что совершенно неясно, каковы параметры проблемы. Если вы хотите получить более конкретный ответ на проблему, опишите ее более подробно.

В общем, я бы посоветовал подойти к проблеме, подобной этой, с использованием некоторого фрагмента известных данных ... небольшого набора слов или форматов, которые сочувствуют и адресуют, а затем сопоставить контекст этих слов, чтобы увидеть, действительно ли они раскрываются полный адрес.

...