Вопросы с тегом текстовый анализ

0 голосов

0 ответов

Ошибка при запуске функции на тестовых данных

Я выполняю классификацию текста, используя word2vec. Вот моя функция. def...

Shivam_hbti / 31 октября 2018

0 голосов

0 ответов

Стемминг против лемматизации для финансового текста в питоне [NLTK]

Чтобы извлечь больше информации из годовых отчетов (10ks), я пытаюсь сравнить компании на основе...

Adrian / 26 октября 2018

0 голосов

0 ответов

Очистка HTML для данных абзаца с использованием Python

Я пытаюсь вычислить значения косинуса для двух документов отчета и могу вычислить его на уровне...

Abhishek Kulkarni / 15 октября 2018

0 голосов

1 ответ

необходимое условие, чтобы исправить странные леммы?

( Выполнено в jupyter notbook ) Я применяю лемматизацию к документам, которые я токенизировал, и не...

Blank / 13 октября 2018

0 голосов

1 ответ

DBSCAN Python - Как построить кластеры на основе среднего вектора?

Привет, я получил среднее значение векторов и использовал DBSCAN для их кластеризации.Тем не менее,...

Cua / 10 октября 2018

0 голосов

1 ответ

scikit-Learn CountVectorizer словарь с регулярным выражением

Имеет корпус, подобный этому: 'This is the first document.', 'This document is the...

Paris Karipidis / 09 октября 2018

0 голосов

0 ответов

Объединение папки файлов .txt в один файл .csv с использованием R

Я пытаюсь выполнить структурное моделирование темы.Поэтому я пытаюсь объединить большое количество...

Alessio Levis / 04 октября 2018

0 голосов

0 ответов

Доступ к библиотеке шаблонов в Spyder

Моя базовая среда в Python 3.7.Я создал новую среду под названием Python27 (это версия Python 2.7,...

The Outlier / 01 октября 2018

0 голосов

1 ответ

Невозможно установить шаблон

Я не могу установить библиотеку шаблонов, используя pip install pattern Я получаю следующую ошибку...

The Outlier / 01 октября 2018

0 голосов

0 ответов

Анализ текста с помощью R-визуализации

Я провел эксперимент по отслеживанию глаз, поэтому для простоты у меня есть несколько отрывков из...

Grig / 26 сентября 2018

0 голосов

0 ответов

Как убрать те же и редкие слова в пандах данных?

Как удалить те же слова в кадре данных с именем df3?Мои приведенные ниже коды, похоже, не работают

Miguel A. Friginal / 20 сентября 2018

0 голосов

0 ответов

Как реализовать онтологию в чат-ботах?

Я пытаюсь разработать чат-бота, в который должна быть встроена базовая онтология.Мне трудно думать...

Kshitiz / 20 сентября 2018

0 голосов

1 ответ

Как преобразовать словарь в dataframe в Python

data = {'documents': [{'score': 0.8806856870651245, 'id':...

Nate Liu / 18 сентября 2018

0 голосов

1 ответ

Как удалить стоп-слова из массива строк в python?

Я хотел бы удалить стоп-слова из массива с именем arrayList1, который хранится в переменной данных

School / 17 сентября 2018

0 голосов

1 ответ

Как уменьшить семантически похожие слова?

У меня большой набор слов, извлеченных из документов. В корпусе есть слова, которые могут означать...

archkm / 03 сентября 2018

0 голосов

1 ответ

Вычисление первых совпадений пары n слов из матрицы терминов документа

Я использовал gensim для создания модели пакета слов. Хотя на самом деле это намного дольше, вот...

Jane Sully / 03 июля 2018

0 голосов

1 ответ

Токенизация и лемматизация для использования TF-IDF для набора текстовых файлов с использованием библиотеки NLTK

Проведение текстового анализа итальянского текста (токенизация, леммализация) для будущего...

Keithx / 12 июня 2018

0 голосов

2 ответов

Удалить телефонные номера с помощью регулярных выражений в Python 3

Я пытаюсь удалить телефонные номера из пакета документов, которые я проанализировал с...

Lorenzo_23 / 12 июня 2018

0 голосов

1 ответ

Создание текстовых кластеров, содержащих похожий текст

Недавно я работал над кластеризацией изображений, которая находила похожие изображения и...

Lambar / 11 июня 2018

0 голосов

0 ответов

Что анализировать и добывать в новостных статьях?

Я пытаюсь научиться анализировать текст и собираюсь применить его в новостных статьях, которые я...

Gsab / 28 апреля 2018

1 голос

2 ответов

Как определить правильные веса для метрических баллов

Я занимаюсь личным исследованием анализа текста и придумала около 70 метрик (частота использования...

drusepth / 24 марта 2012

0 голосов

1 ответ

Точный поиск по фразе с использованием lucene без увеличения количества полей

Для поиска по фразе мы хотим выводить результаты, только если есть точное совпадение (без...

naresh / 02 января 2012

3 голосов

3 ответов

Приоритетность текста на основе содержимого

Если у вас есть список текстов и человек, интересующийся определенными темами, каковы алгоритмы...

xralf / 04 ноября 2011

1 голос

2 ответов

Можно ли извлекать общие сущности, используя Lingpipe, кроме People, Org и Loc?

Я прочитал Lingpipe для NLP и обнаружил, что у нас есть возможность идентифицировать упоминания...

London guy / 24 сентября 2011

2 голосов

1 ответ

Как автоматически создавать шаблоны из html-страницы?

У меня есть сценарий использования, в котором мне нужно визуализировать неформатированный текст в...

nabeelmukhtar / 08 июля 2011