Question

У меня есть столбец csv с msg, и он имеет следующий текст

muchloveandhugs                                  
dudeseriously                                    
onemorepersonforthewin                           
havefreebiewoohoothankgod                        
thisismybestcategory                             
yupbabe                                          
didfreebee                                       
heykidforget                                     
hecomplainsaboutit

Я знаю, что в nltk.corpus.words есть куча разумных слов.Моя проблема в том, как мне перебрать его по столбцу df ['msg'], чтобы я мог получить такие слова, как

df[‘msg’]
much love and hugs
dude seriously
one more person for the win

Stephen Cowley · Answer 1 · 15 октября 2018

С этот вопрос о разбиении слов на строки без пробелов и не совсем зная, как выглядят ваши данные:

import pandas as pd
import wordninja

filename = 'mycsv.csv' # Put your filename here

df = pd.read_csv(filename)
for wordstring in df['msg']:
    split = wordninja.split(wordstring)
    # Do something with split

Разделение слов в столбце

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Разделение слов в столбце

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы