Мне недавно задали вопрос о дизайне в интервью:
Как вы думаете, как работает самовнушение Quora?
Я старался изо всех сил, но я не уверен, что прибил его: / Я нарисовал эскиз схемы с несколькими компонентами Elasticsearch, переваривая узелную часть конвейера, которая отвечает за распознавание именованных сущностей (NER) перед индексацией данных и синонимы для токен-фильтра.
Может ли кто-нибудь из области более подробно разработать основные компоненты для окна поиска Quora, включая некоторые важные части процесса классификации?
(Я бы хотел стать лучше в этой области.)
Примеры:
Я ввел Shrek
, и он предложил Shrek (character)
.
Я ввел einstein
, и он предложил Albert Einstein (physicist)
.
Я ввел john
, и он предложил множество профилей людей, которые начинаются с "Джон".
Удивительно, но этот процесс поиска занимает несколько миллисекунд. Это поразительно. Как это делается?