Как я могу получить итоговую строку вокруг поискового запроса в более длинной строке? - PullRequest
0 голосов
/ 21 февраля 2012

При представлении результатов поиска мне нужно предоставить строку предварительного просмотра, которая содержит поисковый термин, аналогично тому, как Google отображает результаты.

Как получить контекст поискового запроса в более длинной строке, не разделяя какие-либослова?

Пример:

Учитывая длинную строку:

Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim ad minim veniam, quis nostrud exerci tation ullamcorper suscipit lobortis nisl ut aliquip ex ea commodo consequat. Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Nam liber tempor cum soluta nobis eleifend option congue nihil imperdiet doming id quod mazim placerat facer possim assum. Typi non habent claritatem insitam; est usus legentis in iis qui facit eorum claritatem. Investigationes demonstraverunt lectores legere me lius quod ii legunt saepius. Claritas est etiam processus dynamicus, qui sequitur mutationem consuetudium lectorum. Mirum est notare quam littera gothica, quam nunc putamus parum claram, anteposuerit litterarum formas humanitatis per seacula quarta decima et quinta decima. Eodem modo typi, qui nunc nobis videntur parum clari, fiant sollemnes in futurum.

И условие поиска: sed diam nonummy

Как программно вернутьрезультат:

... элитист, отвечающий за элиту, sed diam nonummy nibh euismod tincidunt ...

Я использую три слова вокругпоисковый запрос выше.

Ответы [ 2 ]

0 голосов
/ 22 февраля 2012

Следующее сработало для меня, с помощью Тима Пицкера по этому вопросу .

<?php
function summarize($haystack,$needle,$wordLimit = 5) {

    // first get summary of text around key word (needle)
    $preg_safe = str_replace(" ", "\s", preg_quote($needle));
    $pattern = "/(\w*\S\s+){0,$wordLimit}\S*\b($preg_safe)\b\S*(\s\S+){0,$wordLimit}/ix";
    if (preg_match_all($pattern, $haystack, $matches)) {
        $summary = str_replace(strtolower($needle), "<strong>$needle</strong>", $matches[0][0]) . '...';
    } else {
        $summary = false;
    }

    return $summary;
}
$haystack = 'Lorem ipsum dolor sit amet, consectetuer adipiscing elit, sed diam nonummy nibh euismod tincidunt ut laoreet dolore magna aliquam erat volutpat. Ut wisi enim ad minim veniam, quis nostrud exerci tation ullamcorper suscipit lobortis nisl ut aliquip ex ea commodo consequat. Duis autem vel eum iriure dolor in hendrerit in vulputate velit esse molestie consequat, vel illum dolore eu feugiat nulla facilisis at vero eros et accumsan et iusto odio dignissim qui blandit praesent luptatum zzril delenit augue duis dolore te feugait nulla facilisi. Nam liber tempor cum soluta nobis eleifend option congue nihil imperdiet doming id quod mazim placerat facer possim assum. Typi non habent claritatem insitam; est usus legentis in iis qui facit eorum claritatem. Investigationes demonstraverunt lectores legere me lius quod ii legunt saepius. Claritas est etiam processus dynamicus, qui sequitur mutationem consuetudium lectorum. Mirum est notare quam littera gothica, quam nunc putamus parum claram, anteposuerit litterarum formas humanitatis per seacula quarta decima et quinta decima. Eodem modo typi, qui nunc nobis videntur parum clari, fiant sollemnes in futurum.';
$needle = 'dolor sit amet';
echo summarize($haystack,$needle);
?>
0 голосов
/ 21 февраля 2012

Насколько велики ваши струны?

Вы можете сохранить каждое слово и его позицию в строке.

Затем запросите и получите позицию, верните строку [position - offset, position + offset].

Вы можете использовать strpos, чтобы найти позицию искомого термина.

http://php.net/manual/en/function.strpos.php

Затем используйте идею смещения, или, если вы хотите вернуть полные слова, переходите от символа к символу назад, пока не найдете пробел или начало строки, в которой хранится эта позиция. Тогда идите вперед, эту же идею сохраните в этой позиции. Затем используйте substr ($ string, int $ leftpos, $ rightpos - $ leftpos)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...