Добавление значений во фрейм данных и экспорт - PullRequest
0 голосов
/ 17 февраля 2019

Я пытаюсь добавить два значения в виде списка в фрейме данных. Одно - это Предложение, а другое - список слов, который я получил, после токенизации этих предложений

, сейчас я сделал следующеекод

from nltk.tokenize import word_tokenize
example = ['Mary had a little lamb' , 
        'Jack went up the hill' , 
        'Jill followed suit' ,    
        'i woke up suddenly' ,
       'it was a really bad dream...']


def hi():
    for i in example:
        #print (word_tokenize(i),i)
        a=[i,word_tokenize(i)]

        print(a) 

Ожидаемый результат будет

Кадр данных, имеющий два столбца, Исходное предложение и токены этого предложения

Пример

Оригинальное предложение |Жетоны

Меня зовут Макс |my, name, is, max

Это windows |Это Windows

1 Ответ

0 голосов
/ 17 февраля 2019
df['Original Sentence'] = a[0]  
df['Tokens'] = a[1]

Или мы можем полностью пропустить вашу функцию:

df['Original Sentence'] = example
df['Tokens'] = [word_tokenize(i) for i in example]

РЕДАКТИРОВАТЬ:
Поскольку, похоже, у вас нет кадра данных для начала.

import pandas as pd
df = pd.DataFrame.from_dict({'Original Sentence': example,
                   'Tokens': [word_tokenize(i) for i in example]})
print(df) #to see your dataframe 
df.to_csv('mydata.csv') #To output your dataframe into a csv file  

Другой формат:

df.to_sql(etc...) #Refer to comment below  

Для вывода в виде sql напрямую в вашу базу данных требуется настройка, специфичная для вашей базы данных.См. Здесь, например: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_sql.html

...