Как заставить функцию PHP Similar_text () работать для японских символов (кандзи, катакана и хирагана)? - PullRequest
0 голосов
/ 22 января 2019

Я хочу использовать функцию Similar_text (), предоставляемую PHP для японских символов.Но, к сожалению, это дает неправильный ответ.Как я могу заставить это работать?

Например: similar_text('土橋勇樹', '東日刷株式') дает результат 3, но мы можем ясно видеть, что это должно быть 0

1 Ответ

0 голосов
/ 22 января 2019

Вы захотите обработать возможные многобайтовые символы, образующие символы кандзи. Я не уверен на 100%, но я подозреваю, что Similar_text не поддерживает MB, и вам нужно подобное решение, которое может.

По этим ссылкам показаны попытки людей обработать mb char, аналогичные функции php.

https://gist.github.com/soderlind/74a06f9408306cfc5de9

https://github.com/antalaron/mb-similar-text

Я лично не проверял это, но подход может быть правильным или вдохновить вас на написание пользовательской функции.

Также рассматривается в этом другом посте:

как использовать подобный текстовый php-код на арабском языке

...