Это информация из вторых рук, но я понимаю, что они используют инвертированные индексы (индексы?) Для поиска первых 100 или около того результатов, а затем они используют набор нейронных сетей, чтобы сузить его несколько раз до лучших 10, топ 3, а затем найти первый.
Они делают это потому, что причина первого попадания - то, что заставляет пользователя работать поисковая система или нет. Если вы ищете CNN и не видите CNN.com в качестве первого хита, пользователи считают, что механизм не работает.
Опять же, это знание из вторых рук. Я слышал об этом от друга, который некоторое время работал в MS в своей поисковой команде.