Как использовать Word Tokenize для одного столбца в фрейме данных (Python) - PullRequest
0 голосов
/ 18 октября 2018

Я пытаюсь использовать NLTK word_tokenize для файла Excel, который я открыл как фрейм данных.Столбец, в котором я хочу использовать word_tokenize, содержит предложения.Как я могу извлечь этот конкретный столбец из моего фрейма данных для его токенизации?Имя столбца, к которому я пытаюсь получить доступ, называется «Сведения о жалобах / запросах».

import pandas as pd
from nltk import word_tokenize

file = "List of Complaints.xlsx"

df = pd.read_excel(file, sheet_name = "All Complaints" )

token = df["Complaint / Query Detail"].apply(word_tokenize)

Я пробовал этот метод, но получаю ошибки.

1 Ответ

0 голосов
/ 07 февраля 2019

Попробуйте это:

df['Complaint / Query Detail'] = df.apply(lambda row: 
    nltk.word_tokenize(row['Complaint / Query Detail']), axis=1)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...