Вопросы с тегом NLTK

0 голосов

1 ответ

Условная Вероятность Списка, сопровождаемого другим термином NLTK

КОД НЕ ТРЕБУЕТСЯ. Я проверяю вероятность того, что для данной серии слов после этой серии индекс...

Andrew Bury / 28 февраля 2019

0 голосов

0 ответов

Разделите очень длинный текст на абзацы с помощью nltk и python

Я хочу получить очень большой текстовый файл и разбить его на абзацы.Текстовый файл может иметь...

santi / 27 февраля 2019

0 голосов

1 ответ

NLTK его и ее помечены по-разному,

Я только начал экспериментировать с обработкой естественного языка.Мои первые несколько строк кода...

Ken Krige / 26 февраля 2019

0 голосов

1 ответ

Написать собственный стеммер для

У меня есть набор данных из 27 файлов, каждый из которых содержит коды операций.Я хочу использовать...

aashay shah / 26 февраля 2019

0 голосов

1 ответ

НЛП: основа на наборе данных опкодов

У меня есть набор данных из 27 файлов, каждый из которых содержит коды операций.Я хочу использовать...

aashay shah / 25 февраля 2019

0 голосов

0 ответов

Возможно ли сделать pos-теги с помощью wolf (Free Wordnet для французского)?

Интересно, можно ли сделать pos-тегирование французского текста, используя wolf и nltk, как мы...

mee / 25 февраля 2019

0 голосов

0 ответов

Используйте собственный корпус CONLL для аннотации текста / предложения на французском языке

Я хочу получить результат, подобный тому, что мы получаем из секвойи корпуса. Но я не знаю, как...

mee / 25 февраля 2019

0 голосов

1 ответ

Как удалить предложение с одним словом в Python

В настоящее время я работаю в одном наборе данных, который содержит более 10000+ новостей, и я хочу...

Nijat Mursali / 25 февраля 2019

0 голосов

1 ответ

Любой обходной путь для манипулирования NER (распознавание именованных сущностей) как новых столбцов в панде dataframe?

У меня есть праздничный набор новостей, и я могу извлечь из них распознавание имен.Сначала я...

beyond_inifinity / 25 февраля 2019

0 голосов

3 ответов

python: токенизировать список кортежей без цикла for

У меня есть список из 2 миллионов кортежей, где первый элемент - текст, а второй - целое число

Jack Reimer / 25 февраля 2019

0 голосов

1 ответ

Нужно объединить указанное слово в тексте

Я хочу объединить определенные слова в тексте, например, текст, который гласит: "Я действительно...

FastFollower / 24 февраля 2019

0 голосов

1 ответ

Лемматизировать целое предложение в Python не работает

Я использую функцию WordNetLemmatizer () в пакете NLTK в python для лемматизации всего предложения...

MMAASS / 23 февраля 2019

0 голосов

0 ответов

Текстовое мини с Python: NLTK итальянский язык

Итак, я пишу свою диссертацию и столкнулся с несколькими проблемами при использовании NLTK для...

Giovanni Porcellato / 23 февраля 2019

0 голосов

1 ответ

Невозможно обновить словарь VADER

print(news['title'][5]) Землетрясение магнитудой 7,5 поражает пограничный регион...

Arpit Sah / 22 февраля 2019

0 голосов

1 ответ

NLTK стоп-слова языки

Я работаю с несколькими языками, и для некоторых из них у меня есть список стоп-слов в NLTK, но не...

Fernando S. Peregrino / 21 февраля 2019

0 голосов

0 ответов

Как исправить ошибки маркировки POS?

В настоящее время у меня есть текстовый файл, содержащий несколько сотен слов, которые я пытаюсь...

sh.learner / 21 февраля 2019

0 голосов

2 ответов

Как создать pandas dataframe из токенов слов из существующего столбца строк dataframe?

У меня есть pandas dataframe df в форме: df = pd.DataFrame.from_dict({'ID':[1,2,3], \...

Melsauce / 21 февраля 2019

0 голосов

1 ответ

Извлечение текста из HTML с помощью BeautifulSoup

Привет. Я пытаюсь извлечь текст из HTML с помощью функции BeautifulSoup в python - он работает...

murad / 21 февраля 2019

0 голосов

1 ответ

Как удалить специальные символы и остановить слова в файле с помощью Python?

Я новичок в python и пытаюсь сделать так, чтобы код удалял из файла стоп-слова и специальные...

Dan / 20 февраля 2019

0 голосов

1 ответ

NLTK WordNetLemmatizer обрабатывает «US» как «u»

Если вы введете слово "US" (США), после предварительной обработки (которое становится...

pgmank / 20 февраля 2019

0 голосов

0 ответов

NLTK BigramAssocMeasures.pmi дает одинаковый результат для всех биграмм

Я пытаюсь использовать BigramAssocMeasures PMI, чтобы найти большинство импортируемых биграмм,...

Ruoran Huang / 20 февраля 2019

0 голосов

1 ответ

Создание корпуса для POS-тегов на языке племени

Я использую NLTK для извлечения существительных из текстовой строки, и у каждого из его слов уже...

Mcrey Fonacier / 19 февраля 2019

0 голосов

1 ответ

Есть ли способ узнать, относится ли отзыв клиента именно к определенной теме?

Есть ли способ узнать, относится ли отзыв клиента именно к определенной теме?Как мне сделать это,...

Meenakshi / 18 февраля 2019

0 голосов

1 ответ

в чем разница между векторным преобразователем tfidf и преобразователем tfidf

Я знаю, что формула для tfidf vectorizer равна Count of word/Total count * log(Number of documents...

user_6396 / 18 февраля 2019

0 голосов

1 ответ

Как сделать выборочную пометку предлога nltk

Пометка предлога NLTK включает много слов, таких как - in, at, of, as, by, во время ... и т. Д. Я...

nkrishna / 18 февраля 2019