Возьмем следующую ссылку в качестве примера: http://www.yelp.com/biz/chef-yu-new-york.
В разделе «Основные моменты обзора» есть 3 фразы (острая нарезанная кубиками курица, счастливый час, специальные предложения на обед), которые выделены на основе отзывов, представленных пользователями. Очевидно, что это наиболее часто встречающиеся фразы, или наиболее часто встречающиеся длинные фразы, или какая-то другая логика.
Их официальное объяснение таково:
В своих обзорах Yelpers много упоминал приведенные ниже фразы.
И это не какие-то старые общие фразы, это также те, которые
наши роботы Yelp определили уникальные и хорошие, быстрые способы
опишите это дело. Нажмите на любую из фраз, чтобы увидеть все
отзывы, которые упоминают об этом.
У меня вопрос: что они использовали для анализа ввода текста, чтобы получить эти точки данных? Это какой-то алгоритм, основанный на Lempel Ziv, или какая-то карта сокращения? Я не был майором CS, поэтому, наверное, здесь что-то не хватает. Хотелось бы помочь, теории и т. Д.
Спасибо!