Для выполнения домашнего задания мне нужно получить все файлы .htm и .html в текущем и всех подкаталогах, и я должен проиндексировать их, посчитав все слова, которые появляются в файлах по отдельности.
Вот как я могу посчитать файл, если найду html-файл в каталоге:
<code>$file = '.html';
$index = indexer($file);
echo '<pre>'.print_r($index,true).'
';индексатор функций ($ file) {$ index = array ();$ find = array ('/ \ r /', '/ \ n /', '/ \ t /', '!', ',', '.', '"', ';', ':'); $ replace = array ('', '', '', '', '', '', '', '', ''); $ string = file_get_contents ($ file); $ string = strip_tags ($ string); $ string = strtolower ($ string); $ string = str_replace ($ find, $ replace, $ string); $ string = trim ($ string); $ string = explode ('', $ string); natcasesort ($string); $ i = 0; foreach ($ string как $ word) {$ word = trim ($ word); $ ignore = preg_match ('/ [^ a-zA-Z] /', $ word); if ($ ignore == 1) {$ word = '';} if ((! empty ($ word)) && ($ word! = '')) {if (! isset ($ index [$ i] ['word')])) {$ index [$ i] ['word'] = $ word; $ index [$ i] ['count'] = 1;} elseif ($ index [$ i] ['word'] == $word) {$ index [$ i] ['count'] + = 1;} else {$ i ++; $ index [$ i] ['word'] = $ word; $ index [$ i] ['count']= 1;}}} unset ($ work); return ($ index);}
Мне просто нужно сначала выяснить, как найти все htm или html файлы в каталогах, а затем запуститьиспользуя приведенный выше код для каждого файла htm / html. Любая помощь будет оценена, спасибо!