Сводка : Невозможно найти файл модели, используемый для Lemmatizer (english-lemmatizer.txt /...
Предположим, у меня есть текстовый документ, такой как: document = '<p> I am a sentence....
Я делаю следующее: from spacy.lang.nb import Norwegian nlp = Norwegian() doc = nlp(u'Jeg heter...
Как лучше всего обращаться с аббревиатурами в модели встраивания персонажей?То есть, у меня есть DC...
Я сделал положительный и отрицательный отзыв, чтобы увидеть, как работает countvectorizer после...
Следующий код используется для предварительной обработки текста с помощью пользовательской функции...
следующий скрипт используется для лемматизации заданного входного столбца с текстом: %%time import...
Я пытался найти лемматизатор для шведского без какого-либо успеха.Кто-нибудь знает что-нибудь об...
При использовании spacy лемма токена (lemma_) зависит от POS. Поэтому конкретная строка может иметь...
Мне нужно использовать pos-тегер в моем анализаторе, потому что мне нужны pos-теги для лемматизации...
Есть ли у кого-нибудь хронологический список операций, выполняемых import spacy nlp = spacy
Я работаю над проблемой классификации текста, и я попробовал WordNetLemmmatizer, а затем TF-IDF,...
На веб-сайте spaCy есть некоторые метки для тегирования, токенизации и синтаксического анализа по...
Я использую TreeTagger для получения лемм слов на испанском языке, но я заметил, что слишком много...
Я относительно новичок в spaCy и пытаюсь токенизировать + лемматизировать 200 МБ текста для проекта...
Я пытаюсь добавить лематизацию в CountVectorizer из Skit-learn следующим образом import nltk from...
Microsoft Cognitive Services предлагает возможность анализа текста с использованием предварительно...
Я использую Spacy 2.0.11 с моделью голландского языка nl_core_news_sm (nl). Как я могу добавить...
Я хочу найти слова, связанные с Wordnet. Есть ли у wordnet функция стемминга? Я использую этот...
Знаете ли вы достаточно большую базу данных лемматизатора, которая возвращает правильный результат...
У меня проблемы с попыткой написать поисковую систему, которая рассматривает все перегибы слова как...
Мне интересно, могут ли основные движки SQL (MS SQL, Oracle, MySQL) понимать, что 2 слова связаны,...
Я собираюсь использовать SQL-версию WordNet, и у меня проблема с поиском способа лемматизировать...
Я пробовал PorterStemmer и Snowball, но оба не работают на всех словах, пропуская некоторые очень...