Question

Я пытаюсь использовать NLTK word_tokenize для файла Excel, который я открыл как фрейм данных.Столбец, в котором я хочу использовать word_tokenize, содержит предложения.Как я могу извлечь этот конкретный столбец из моего фрейма данных для его токенизации?Имя столбца, к которому я пытаюсь получить доступ, называется «Сведения о жалобах / запросах».

import pandas as pd
from nltk import word_tokenize

file = "List of Complaints.xlsx"

df = pd.read_excel(file, sheet_name = "All Complaints" )

token = df["Complaint / Query Detail"].apply(word_tokenize)

Я пробовал этот метод, но получаю ошибки.

Saud · Answer 1 · 07 февраля 2019

Попробуйте это:

df['Complaint / Query Detail'] = df.apply(lambda row: 
    nltk.word_tokenize(row['Complaint / Query Detail']), axis=1)

Как использовать Word Tokenize для одного столбца в фрейме данных (Python)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как использовать Word Tokenize для одного столбца в фрейме данных (Python)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов