Заменить несколько слов одним объектом в наборе текстовых данных чата - PullRequest
0 голосов
/ 30 ноября 2018

У меня есть данные чата в виде 500 тысяч строк.Я хочу заменить или заменить несколько слов лица [например.Нью-йорк, нью-йорк, нью-йорк, нью-йорк] с одной сущностью как "нью-йорк" с использованием python.

Я пытался сделать это с помощью регулярных выражений, но это занимает слишком много времени для обработки.Также у меня много таких слов.Есть ли какой-нибудь альтернативный метод, который потребляет меньше времени при использовании Python?

Есть ли хороший ресурс, чтобы узнать больше о Spacy и Rasa API?

1 Ответ

0 голосов
/ 30 ноября 2018

Можете представить, какой простой пример вам нужно сделать?Я имею в виду пример использования некоторого учебного объекта.Вам нужно изменить сущность name или сущность value ?

Что касается большего количества документов для изучения rasa и spacy, у обоих есть хорошая документация на его собственных доменах (site /github).

О расе вы можете найти хорошие вещи здесь:

  1. https://rasa.com/docs/nlu/
  2. https://medium.com/rasa-blog
  3. https://forum.rasa.com/

О SpaCy:

  1. https://spacy.io/usage/
  2. https://explosion.ai/blog/

Также вы можете найти более реальные примеры насообщения пользователя

...