Разделение слов в столбце - PullRequest
0 голосов
/ 15 октября 2018

У меня есть столбец csv с msg, и он имеет следующий текст

muchloveandhugs                                  
dudeseriously                                    
onemorepersonforthewin                           
havefreebiewoohoothankgod                        
thisismybestcategory                             
yupbabe                                          
didfreebee                                       
heykidforget                                     
hecomplainsaboutit                               

Я знаю, что в nltk.corpus.words есть куча разумных слов.Моя проблема в том, как мне перебрать его по столбцу df ['msg'], чтобы я мог получить такие слова, как

df[‘msg’]
much love and hugs
dude seriously
one more person for the win

1 Ответ

0 голосов
/ 15 октября 2018

С этот вопрос о разбиении слов на строки без пробелов и не совсем зная, как выглядят ваши данные:

import pandas as pd
import wordninja

filename = 'mycsv.csv' # Put your filename here

df = pd.read_csv(filename)
for wordstring in df['msg']:
    split = wordninja.split(wordstring)
    # Do something with split
...