Что является важной частью поисковых технологий? - PullRequest
0 голосов
/ 22 мая 2009

Что является важной частью поисковых технологий?

  • Распределенная файловая система
  • Облачные вычисления
  • Система хранения
  • Алгоритмы ранжирования
  • Алгоритмы поиска

Или что-то еще?

Ответы [ 6 ]

1 голос
/ 22 мая 2009

Я думаю, что большая проблема, которую еще предстоит решить в поиске, - Онотология . Нам очень трудно понять и классифицировать результаты в удобной для человека форме. Некоторые называют это «семантической паутиной». У нас есть этот поток данных и индексов, но мы категоризируем или делаем хороший смысл этого очень плохим способом. Ошибка заключается в том, что мы не обладаем атомарным самовыражением так, чтобы поиск (алгоритм) мог его понять.

1 голос
/ 22 мая 2009

// Начинаем саркастический ответ

RAM + CPU + Bandwidth + действительно потрясающее ПО для поисковых систем

// Конец саркастического ответа

Если серьезно, то, что сложнее, чем технология поиска, будет зависеть от множества проблем, как вы уже перечислили. Попытка прикрепить его к одной особой серебряной пуле на самом деле не применима.

0 голосов
/ 22 мая 2009

Я создал небольшую поисковую систему как часть моего проекта за последний год, и я могу сказать вам, что инвертированный индекс является важной частью поисковой системы.

Я также могу сказать, что гусеничный ход является важной частью.

Вы также можете сказать, что алгоритм Page Rank важен.

Можно утверждать, что кластеризация важна.

....

Что именно вы ищете? Ваш вопрос мне кажется широким.

0 голосов
/ 22 мая 2009

Производительность в поисковой системе имеет решающее значение; медленное обслуживание - мертвое, но это не самый важный аспект; этот значок, я думаю, соответствует актуальности результатов.

Мы просим поисковые системы делать невозможное; взять фразу или несколько ключевых слов и каким-то образом вернуть целую кучу результатов, которые точно соответствуют тому, что мы хотели - мы можем не знать точно, что искали, но как только мы это увидим, мы могу распознать это. Точно так же мы сразу узнаем, когда поисковая система возвращает «неправильную вещь».

В конечном счете, все дело в том, чтобы заставить глупую машину делать то, что мы имеем в виду, а не то, что мы говорим, что по сути является неразрешимой проблемой в вычислениях. Самые качественные поисковые решения всегда будут теми, которые имеют самые новые способы ранжирования результатов и соотнесения их с нашими оригинальными запросами. Это понятие довольно сильно связано с онтологией, как описывает Уэйн Хартман в своем ответе.

0 голосов
/ 22 мая 2009

Поиск и ранжирование очень важны, так же как и при индексации. Вам нужны эффективные алгоритмы, чтобы найти результаты, которые точно соответствуют ключевым словам, которые я ввел (ala google, yahoo и т. Д.), А затем вам нужно оценить эти результаты.

0 голосов
/ 22 мая 2009
...