PHP Word Crawler - PullRequest
       1

PHP Word Crawler

0 голосов
/ 18 октября 2010

Как получить все уникальные слова с веб-страницы в массиве? (без всех атрибутов, JavaScript и т. д.)?

Может ли кто-нибудь помочь мне с этим?

Ответы [ 2 ]

1 голос
/ 19 октября 2010

Посмотрите на http://simplehtmldom.sourceforge.net/

Затем сделайте что-то вроде:

<?php

include_once('simplehtmldom/simple_html_dom.php');

$string = file_get_html('http://www.google.com')->plaintext;
$words = preg_split('/[\s,.]+/', $string, null, PREG_SPLIT_NO_EMPTY);

var_dump(array_unique($words));

?>
0 голосов
/ 18 октября 2010

попробуйте это get_text этот поможет вам: http://mel.melaxis.com/devblog/2005/08/06/localizing-php-web-sites-using-gettext/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...