Question

Есть ли способ определения языка данных, вводимых через поле ввода?

The Surrican · Answer 1 · 22 августа 2010

хм, я могу предложить улучшенную версию функции ДимаКрасуна:

functoin is_arabic($string) {
    if($string === 'arabic') {
         return true;
    }
    return false;
}

хорошо, хватит шутить!

Предложение Pekkas использовать API Google Translate является хорошим! но вы полагаетесь на внешний сервис, который всегда более сложен и т. д.

я думаю, что подход Rushyos хорош! это просто не так просто. я написал следующую функцию для вас, но она не проверена, но она должна работать ...

    <?
function uniord($u) {
    // i just copied this function fron the php.net comments, but it should work fine!
    $k = mb_convert_encoding($u, 'UCS-2LE', 'UTF-8');
    $k1 = ord(substr($k, 0, 1));
    $k2 = ord(substr($k, 1, 1));
    return $k2 * 256 + $k1;
}
function is_arabic($str) {
    if(mb_detect_encoding($str) !== 'UTF-8') {
        $str = mb_convert_encoding($str,mb_detect_encoding($str),'UTF-8');
    }

    /*
    $str = str_split($str); <- this function is not mb safe, it splits by bytes, not characters. we cannot use it
    $str = preg_split('//u',$str); <- this function woulrd probably work fine but there was a bug reported in some php version so it pslits by bytes and not chars as well
    */
    preg_match_all('/.|\n/u', $str, $matches);
    $chars = $matches[0];
    $arabic_count = 0;
    $latin_count = 0;
    $total_count = 0;
    foreach($chars as $char) {
        //$pos = ord($char); we cant use that, its not binary safe 
        $pos = uniord($char);
        echo $char ." --> ".$pos.PHP_EOL;

        if($pos >= 1536 && $pos <= 1791) {
            $arabic_count++;
        } else if($pos > 123 && $pos < 123) {
            $latin_count++;
        }
        $total_count++;
    }
    if(($arabic_count/$total_count) > 0.6) {
        // 60% arabic chars, its probably arabic
        return true;
    }
    return false;
}
$arabic = is_arabic('عربية إخبارية تعمل على مدار اليوم. يمكنك مشاهدة بث القناة من خلال الموقع'); 
var_dump($arabic);
?>

последние мысли: как вы видите, я добавил, например, латинский счетчик, диапазон - это просто фиктивное число, но таким образом вы можете обнаружить кодировки (иврит, латинский, арабский, хинди, китайский и т. д.)

вы также можете сначала удалить некоторые символы ... может быть, @, пробел, переносы строк, слэши и т. Д. ... флаг PREG_SPLIT_NO_EMPTY для функции preg_split был бы полезен, но из-за ошибки я не использовал его здесь.

вы также можете иметь счетчик для всех наборов символов и посмотреть, какой из них, конечно, самый ...

и, наконец, вы должны подумать о том, чтобы отрезать свою строку после 200 символов или чего-то еще. этого должно быть достаточно, чтобы сказать, какой набор символов используется.

и вам нужно выполнить обработку ошибок! как деление на ноль, пустая строка и т. д. и т. д.! не забудь это, пожалуйста ... есть вопросы? комментарий!

Если вы хотите определить ЯЗЫК строки, вам следует разбить ее на слова и проверить наличие слов в некоторых заранее определенных таблицах. вам не нужен полный словарь, только самые распространенные слова, и он должен работать нормально. токенизация / нормализация также необходима! В любом случае, для этого есть библиотеки, и это не то, о чем вы просили :) просто хотел упомянуть об этом

Mohammed Ahmed · Answer 2 · 07 ноября 2013

это проверит, является ли строка арабской или имеет арабский текст

текст должен быть UNICODE, например, UTF-8

$str = "بسم الله";
if (preg_match('/[اأإء-ي]/ui', $str)) {
    echo "A match was found.";
} else {
    echo "A match was not found.";
}

Dmytro Krasun · Answer 3 · 22 августа 2010

Вы можете использовать функцию, которую я написал для вас:

<?php
/**
 * Return`s true if string contains only arabic letters.
 *
 * @param string $string
 * @return bool
 */
function is_arabic($string)
{
    return (preg_match("/^\p{Arabic}/i", $string) > 0);
}

Но, пожалуйста, проверьте ее перед использованием.

[EDIT 1]

Ваш вопрос: «Как определить, является ли входная строка арабской?»И я ответил на это, что не так?

[РЕДАКТИРОВАТЬ 2]

Читать это - Определить язык из строки в PHP

[РЕДАКТИРОВАТЬ 3]

Извините, я переписал функцию, попробуйте:

function is_arabic($subject)
{
    return (preg_match("/^[\x0600-\x06FF]/i", $subject) > 0);
}

Affan · Answer 4 · 16 мая 2018

Используйте регулярное выражение для короткого и простого ответа

 $is_arabic = preg_match('/\p{Arabic}/u', $text);

Это вернет true (1) для арабской строки и 0 для не арабской строки

cweiske · Answer 5 · 02 марта 2017

Библиотека PHP Text_LanguageDetect способна распознавать 52 языка.Он протестирован модулем и устанавливается через композитор и PEAR.

Mohammad Anini · Answer 6 · 08 ноября 2013

public static function isArabic($string){
    if(preg_match('/\p{Arabic}/u', $string))
        return true;
    return false;
}

Rushyo · Answer 7 · 22 августа 2010

Я предполагаю, что вы имеете в виду строку Unicode ... в этом случае просто посмотрите на наличие любого символа с кодом между U + 0600 – U + 06FF (1536–1791) в строке.

Pekka 웃 · Answer 8 · 22 августа 2010

Мне неизвестно о PHP-решении для этого, нет.

API-интерфейсы Google Translate Ajax могут быть для вас, однако.

Проверьте этот фрагмент Javascript из документации API: Пример: определение языка

HaWei · Answer 9 · 13 июня 2019

Я бы использовал регулярные выражения, чтобы получить количество арабских символов и сравнить его с общей длиной строки. Если текст, например, содержит не менее 60% арабских символов, я считаю его главным образом арабским и применяю форматирование RTL.

/**
 * Is the given text mainly Arabic language? 
 *
 * @param string $text string to be tested if it is arabic. :-)
 * @return bool 
 */
function ct_is_arabic_text($text) {
    $text = preg_replace('/[ 0-9\(\)\.\,\-\:\n\r_]/', '', $text); // Remove spaces, numbers, punctuation.
    $total_count = mb_strlen($text); // Length of text
    if ($total_count==0)
        return false;
    $arabic_count = preg_match_all("/[اأإء-ي]/ui", $text, $matches); // Number of Arabic characters
    if(($arabic_count/$total_count) > 0.6) { // >60% Arabic chars, its probably Arabic languages
        return true;
    }
    return false;
}

Для встроенного форматирования RTL используйте CSS. Пример класса:

.embed-rtl {
 direction: rtl;
 unicode-bidi: normal;
 text-align: right;
}

Yasir Tahir · Answer 10 · 30 сентября 2015

Эта функция проверяет, является ли введенная строка / предложение арабским или нет.Сначала я обрезал его, а затем проверял слово за словом, вычисляя общее количество для обоих.

function isArabic($string){
        // Initializing count variables with zero
        $arabicCount = 0;
        $englishCount = 0;
        // Getting the cleanest String without any number or Brackets or Hyphen
        $noNumbers = preg_replace('/[0-9]+/', '', $string);
        $noBracketsHyphen = array('(', ')', '-');
        $clean = trim(str_replace($noBracketsHyphen , '', $noNumbers));
        // After Getting the clean string, splitting it by space to get the total entered words 
        $array = explode(" ", $clean); // $array contain the words that was entered by the user
        for ($i=0; $i <= count($array) ; $i++) {
            // Checking either word is Arabic or not
            $checkLang = preg_match('/\p{Arabic}/u', $array[$i]);
            if($checkLang == 1){
                ++$arabicCount;
            } else{
                ++$englishCount;
            }
        }
        if($arabicCount >= $englishCount){
            // Return 1 means TRUE i-e Arabic
            return 1;
        } else{
            // Return 0 means FALSE i-e English
            return 0;
        }
    }

PHP: как определить, является ли строка ввода арабской

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

PHP: как определить, является ли строка ввода арабской

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы