Я новичок в программировании на Python.Я хочу получить количество слов для каждого слова в этом наборе данных Википедии (people_wiki.csv
).Я могу получить каждое слово и его вхождение в виде словаря, но не могу разбить пару ключ-значение словаря на отдельные столбцы.Я пробовал несколько методов (from_dict, from_records, to_frame, pivot_table и т. Д.) Это что-то выполнимое в Python.Я буду признателен за любую помощь.
Набор данных Samle:
URI name text
<http://dbpedia.org/resource/George_Clooney> George Clooney 'george timothy clooney born may 6 1961 is an american actor writer producer director and activist he has received three golden globe awards for his work as an actor and two academy awards one for acting and the other for producingclooney made his...'
Я пытался:
clooney_word_count_table = pd.DataFrame.from_dict(clooney['word_count'], orient='index', columns=['word','count']
Я также пытался:
clooney['word_count'].to_frame()
Это мой код:
people = pd.read_csv("people_wiki.csv")
clooney = people[people['name'] == 'George Clooney']
from collections import Counter
clooney['word_count']= clooney['text'].apply(lambda x: Counter(x.split(' ')))
clooney_word_count_table = pd.DataFrame.from_dict(clooney['word_count'], orient='index', columns=['word','count']
clooney _word_count_table
Вывод:
word_count
35817 {'george': 1, 'timothy': 1, 'clooney': 9, 'ii': ...
Я ожидаю получить выходной кадр данных с 2 столбцами из clooney_word_count_table:
word count
normalize 1
george 3
combat 1
producer 2