Как определить язык документа - в PHP? - PullRequest
1 голос
/ 14 ноября 2008

На основы уже дан ответ здесь . Но есть ли готовая PHP-библиотека, выполняющая то же самое, что и Lingua :: Identify из CPAN?

Ответы [ 2 ]

3 голосов
/ 14 ноября 2008

Есть пакет PEAR Text_LanguageDetect, который я использовал раньше. Сделай свою работу достаточно хорошо. Я не уверен ни в каких других зрелых людях.

0 голосов
/ 14 ноября 2008

1 - Вы можете сделать это самостоятельно (трудный путь) - обнаружение как языка, так и кодовой страницы по частотам символов и n-грамм Вам понадобится много «обучающих» данных, но это выполнимо.

2 - Вы можете запустить Perl-скрипт для обнаружения (намного проще).

...