У меня есть данные чата в виде 500 тысяч строк.Я хочу заменить или заменить несколько слов лица [например.Нью-йорк, нью-йорк, нью-йорк, нью-йорк] с одной сущностью как "нью-йорк" с использованием python.
Я пытался сделать это с помощью регулярных выражений, но это занимает слишком много времени для обработки.Также у меня много таких слов.Есть ли какой-нибудь альтернативный метод, который потребляет меньше времени при использовании Python?
Есть ли хороший ресурс, чтобы узнать больше о Spacy и Rasa API?