Как я могу токенизировать все строки в указанном столбце c из файла CSV, используя Python? - PullRequest
0 голосов
/ 12 марта 2020

Я делаю анализ чувств, используя Python (я все еще ладья ie с этим конкретным c языком программирования). У меня есть некоторые данные Twitter в CSV-файле, которые мне нужно предварительно обработать, прежде чем приступить к реальному анализу. Прежде всего, мне нужно сделать токенизацию текста из указанного столбца c, в моем случае второго или столбца B. Я нашел несколько советов, как выполнить токенизацию, но не выбирать указанный столбец c. Кто-нибудь, кто имеет опыт работы с этим?

Я пробовал этот код, который, кажется, работает для всех столбцов, но как я могу выделить его во второй столбец?

import csv
import nltk
from nltk import word_tokenize 

with open('TwitterData.csv', 'r') as csvfile:
   reader = csv.DictReader(csvfile)
   for row in reader:
       print(row)

Любые предложения для модулей и кода, который работает до обработка анализа настроений?

Большое спасибо!

1 Ответ

0 голосов
/ 12 марта 2020

Я настоятельно рекомендую вам документацию и модули scikit-learn, особенно часть о «работе с текстовыми данными»: https://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html

Там также есть раздел о настроениях анализ: https://scikit-learn.org/stable/tutorial/text_analytics/working_with_text_data.html#exercise -2-sentiment-analysis-on-mov ie -обзоры

Если вам нужна дополнительная конкретная c помощь с вашим кодом, всегда лучше всего предоставьте «минимальный воспроизводимый пример»: { ссылка } Таким образом, другие могут помочь вам лучше справиться с конкретной проблемой c, с которой вы столкнулись.

Надеюсь, это поможет:)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...