Является ли классификация текста достаточно быстрой для поиска по типу? - PullRequest
0 голосов
/ 24 сентября 2019

Я работаю над созданием сервиса typeahead, который можно использовать для поиска множества разных вещей.Я думал о создании модели классификации текста для классификации этих поисков, прежде чем приступить к поиску.

Вот пример результата, который я хотел бы получить от модели классификации.

Вход

John Smith

Выход

[
  {
    "likeliness": .6,
    "category": "car-name-typeahead-search"
  },
  {
    "likeliness": .9,
    "category": "person-name-typeahead-search"
  },
  {
    "likeliness": .1,
    "category": "vin-typeahead-search"
  },
  {
    "likeliness": .2,
    "category": "help-page"
  },
  {
    "likeliness": .2,
    "category": "faq-page"
  }
]

Тогда я 'взять категории, которые имеют вероятность выше некоторого значения, и фактически выполнить поиск заголовка.Также я бы вернул результаты, упорядоченные по рангу вероятности.

Мы собирали данные о поисках людей и отслеживали то, что они действительно искали, поэтому у нас должны быть данные, необходимые для обучения модели классификации текста.

Мой вопрос: могут ли модели классификации текста быть достаточно быстрыми, чтобы их можно было использовать с услугой опережающего ввода текста, и не были ли они слишком дорогими?Существуют ли определенные типы алгоритмов классификации текста, на которые мне следует обратить внимание?

1 Ответ

1 голос
/ 26 сентября 2019

Обычно в современной инфраструктуре обслуживания (например, обслуживание тензорного потока на автономном сервере) стандартная модель классификации текста, основанная на неглубоких нейронных сетях, должна иметь задержку менее 1 мс).Вы можете искать модель, состоящую из:

  • слоя для встраивания слов (до миллиона слов в словаре)
  • скрытого слоя (1-3)
  • классификации(до тысячи категорий)

Если ожидаемое время ответа составляет <= 200 мс, вам не следует беспокоиться о задержке из классификации.В худшем случае достаточно 10 мс, используя вышеописанную настройку. </p>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...