Когда вы ищете что-то в Stackoverflow, оно обрезает часть описания вопроса, которая лучше всего соответствует вашим критериям, и после этого помечает слова критериев.
Интересно, лучший способ сделать это вручную в C #, то есть без помощи полнотекстового поискового движка.
Основная проблема как быстро выбрать лучшую часть текста?
То, что я сделал до сих пор:
- Я получаю пробелы в индексах текста. Это позволяет мне знать, где
слова начинаются так, что я могу начать свой
тесты подстрок из них.
- Из каждого пробела я получаю 300 символов вперед и проверяю, как
много вхождений ключевых слов я
найти.
- Я предполагаю, что часть длиной в 300 символов,
вхождения являются лучшими, поэтому я вырезал его из исходного текста.
Это хороший подход? Есть ли более быстрый способ? Является ли подсчет количества вхождений лучшим способом найти наиболее релевантную часть?