«Расстояние» между переменными данных в PHP - PullRequest
0 голосов
/ 30 апреля 2018

Есть ли способ (используя библиотеки, если это необходимо) нормализовать любую переменную PHP (целое число, строки, файлы, bytarray и т. Д.), Поэтому эти данные можно измерить по расстоянию между ними?

С расстоянием, которое я имею в виду, F ("привет") должно быть близко к F ("ад").

Однако, не только для строковых, но и СРЕДНЕГО вида данных.

Я думал о том, чтобы сначала передать все в двоичный файл, но управление битами PHP не так просто. В C ++ это можно сделать намного проще.

Например, я должен быть в состоянии рассчитать расстояние между f ("привет") и f (3333). (разные типы данных).

Может быть, выгрузить все в байтовый массив?

Спасибо

1 Ответ

0 голосов
/ 30 апреля 2018

Функция Левенштейна может быть чем-то, на что можно обратить внимание.

со страницы php.net:

<?php
// input misspelled word
$input = 'carrrot';

// array of words to check against
$words  = array('apple','pineapple','banana','orange',
                'radish','carrot','pea','bean','potato');

// no shortest distance found, yet
$shortest = -1;

// loop through words to find the closest
foreach ($words as $word) {

    // calculate the distance between the input word,
    // and the current word
    $lev = levenshtein($input, $word);

    // check for an exact match
    if ($lev == 0) {

        // closest word is this one (exact match)
        $closest = $word;
        $shortest = 0;

        // break out of the loop; we've found an exact match
        break;
    }

    // if this distance is less than the next found shortest
    // distance, OR if a next shortest word has not yet been found
    if ($lev <= $shortest || $shortest < 0) {
        // set the closest match, and shortest distance
        $closest  = $word;
        $shortest = $lev;
    }
}

echo "Input word: $input\n";
if ($shortest == 0) {
    echo "Exact match found: $closest\n";
} else {
    echo "Did you mean: $closest?\n";
}

?>

Приведенный выше пример выдаст:

Вводимое слово: морковь

Вы имели в виду морковь?

...