Разбор адреса - PullRequest
       13

Разбор адреса

1 голос
/ 15 февраля 2012

Мне нужно разобрать адрес в Индии, как в Google, мне нужно несколько примеров того, как разобрать адрес. Есть ли примеры разбора адресов? Существуют ли бесплатные словари индийского города, местности, штатов, пин-кодов и т. Д.

например

5/802, общество Ведвихар, около Чандни Чоук, Пуна, 411038

будет анализировать до

здание / улица = 5
дом № = 802
местонахождение / общество = vedvihar
Ориентир = Чандни Чоук
город = Пуна
контактный = 411038

Ответы [ 5 ]

3 голосов
/ 15 февраля 2012

Итак, вот несколько ссылок, которые могут помочь в разборе почтовых адресов:

Разбор пригодного адреса улицы, города, штата, почтового индекса из строки и почтовый адрес Javaпарсер

1 голос
/ 15 февраля 2012

Существуют ли бесплатные словари индийского города, местности, штатов, пин-кодов и т. Д.

geonames.org имеет загружаемую базу данных городов, включая почтовые индексыи административное деление.

1 голос
/ 15 февраля 2012

Вы можете использовать StringTokenizer (http://docs.oracle.com/javase/6/docs/api/java/util/StringTokenizer.html), для которого вы можете найти учебник здесь: http://www.devdaily.com/blog/post/java/java-faq-stringtokenizer-example.

В этом примере строка разбита на границы пространства, в вашем случае вы захотите заменить " " на "," в строке: StringTokenizer st = new StringTokenizer(tags," ");.

Убедитесь, что aString.trim() ваши подстроки.

Скажите, пожалуйста, нужна ли вам дополнительная информация

0 голосов
/ 23 мая 2019

Если вы избавитесь от html-тегов, есть мощная библиотека с открытым исходным кодом libpostal , которая очень хорошо подходит для этого варианта использования. Есть привязки к разным языкам программирования. Libpostal - это библиотека C для синтаксического анализа / нормализации уличных адресов по всему миру с использованием статистических НЛП и открытых данных. Цель этого проекта - понять строки на основе местоположения на любом языке, везде.

Для Java есть jpostal

Я создал простой образ Docker с Python для привязки Python, который вы можете быстро раскрутить и попробовать его pypostal-docker

0 голосов
/ 15 февраля 2012

Я не знаю контекста вашего вопроса, так что, возможно, это совершенно не по теме, но здесь я это сделал несколько месяцев назад: Я работаю над очень сложной частью обработки естественного языка с помощью API геокодирования Google.

API позволяет отправлять полнотекстовый адрес и возвращать хорошо отформатированный XML-файл, из которого можно легко извлечь улицу, город или любую другую информацию, которая вам нужна.

Возможно, это не то решение, которое вы ищете, но если вы сможете использовать API Карт, вы сэкономите много времени и усилий: http://code.google.com/apis/maps/documentation/geocoding/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...