Я новичок в nltk и python.Мне было дано задание извлечь все тексты из URL.Я попытался и смог...
Я использую библиотеку Spacy на python3.6, у меня есть массив из 700 терминов и PharseMatcher,...
Я пытаюсь извлечь названия учебников и другие журнальные статьи в учебных программах, собранных из...
В настоящее время я проверяю NSLinguisticTagger Свифта.Для целей тестирования я использовал код из...
Я столкнулся с проблемой с функцией stemDocument в R. Как показано в следующих блоках, я правильно...
Я уже построил свою собственную модель Skip-Gram, используя gensim word2vec.Я знаю, что могу...
В FastText у меня несбалансированные метки.Как лучше всего справиться с этим?
У меня есть большой текстовый документ (UTF-8), который содержит буквы, цифры, пробелы, специальные...
Я извлекал текст из PDF-файлов, используя PyPDF2.Однако, кажется, вводится ошибочный пробел между...
Как бы заменить все предложения и абзацы тегом <string> в текстовых файлах? Я хочу сохранить...
В lst_test содержится около 98 000 предложений (длина от 5 до 100 слов) и около 1000 предложений...
Я пытаюсь использовать анализатор зависимостей для каждого предложения.Я пробовал разбор coreNLP...
Я пытаюсь соответствовать модели Word2Vec.Согласно документации для Word2Vec от Gensim нам не нужно...
Я использую spacy 2.0 и использую строку в кавычках в качестве ввода. Пример строки "The...
Я изучал использование R lime на наборах текстовых данных для объяснения предсказаний модели...
Я исполняю НЭР на арабском языке.Код выглядит следующим образом: from polyglot.text import Text...
У меня очень простой способ извлечь имена, организации и местоположения из строки.Я использую...
Фон одного предложения : у меня есть текстовые данные из автоматически транскрибированных...
Есть ли элегантный способ получить индекс слова / токена в его предложении?Мне известны атрибуты...
Stanford NER предоставляет банку NER для обнаружения POS-тегов и NER.Но я пытаюсь разобрать одну...
Я думаю, что это не строго BPE ( кодировка пары байтов ), но есть аналогичная идея, примененная к...
Это мой полный текст: RETENTION Liability in excess of the Retention The Retention shall be borne...
У меня аккуратный фрейм данных, созданный из текстового корпуса.Я хочу создать новую двоичную...
В настоящее время я транслирую твиты и хочу применить сентиментальный анализ для каждого твита,...
У меня есть параллельный переведенный корпус на английском-французском (text.en, text.fr), каждый...