Разделяйте слова пробелами и удаляйте повторяющиеся слова - PullRequest
0 голосов
/ 11 мая 2011

Я обнаружил, preg_split и взрывают функции в php для разбиения разделенной пробелами строки на слова.это тоже весьма полезно.но следующий шаг, над которым я хотел бы поработать, это удалить дублирующиеся слова и [",", "."и несколько других знаков препинания] тоже ...

как если бы
" Я люблю Непала. Непал не имеет выхода к морю. Непал находится в Азии. "

Я хотел бы, чтобы в послании были только уникальные слова, такие как:
Я, любовь, Непал, страна, не имеющая выхода к морю, страна, в Азии

Ответы [ 2 ]

1 голос
/ 11 мая 2011
0 голосов
/ 11 мая 2011

Это должно почти закончить работу:

$string = "I love nepal. Nepal is a landlocked country. Nepal is in Asia.";
$string = preg_replace( "/[^\w\s]/", "", $string );

$words = array();
foreach ( explode( " ", $string ) AS $word ) {
    $word = strtolower($word);
    $words[$word] = 1;
}

$unique_words = array_keys( $words );
...