Как мне удалить дубликаты в таблице панды? - PullRequest
0 голосов
/ 14 октября 2019

Я очень новичок в кодировании и хочу, чтобы код подсчитывал частоту слов, но я остановлен, потому что не уверен, как удалить дубликаты.

txt = " remember all those walls we built remember those times"
words = txt.split()
for word in words:
    print (word + " " + str(txt.count(word)))
import pandas as pd
my_table = pd.DataFrame()
for word in words:
    tempdf = pd.DataFrame ({"word" : [word], "frequency" : [txt.count(word)]})
    my_table = my_table.append(tempdf)
print(my_table)

Ответы [ 3 ]

1 голос
/ 14 октября 2019

Вам необходимо:

txt = " remember all those walls we built remember those times"

words = txt.split()

for word in words:

    print(word + " " + str(txt.count(word)))

import pandas as pd

mytable = pd.DataFrame()

for word in words:

    tempdf = pd.DataFrame ({"word" : [word], "frequency" : [txt.count(word)]})
    mytable = mytable.append(tempdf)

print(mytable)

или лучше с pd.concat:

import pandas as pd
txt = " remember all those walls we built remember those times"
words = txt.split()
for word in words:
    print(word + " " + str(txt.count(word)) )

my_table=pd.concat([pd.DataFrame ({"word" : [word], "frequency" : [txt.count(word)]}) for word in words])
print(mytable)

имейте в виду, чтоВы также можете update словарь и затем создать кадр данных в конце

0 голосов
/ 14 октября 2019

Ваша синтаксическая ошибка вызвана отсутствием закрывающих скобок ()) для print в строке до import pandas as pd. Эта строка должна выглядеть следующим образом:

print(word + " " + str(txt.count(word)))

В качестве общего совета по поводу синтаксических ошибок сначала проверьте предыдущую строку или предыдущий вызов функции на наличие отсутствующих или дополнительных скобок.

0 голосов
/ 14 октября 2019

Вам необходимо добавить дополнительную закрывающую скобку в строке 4, а также добавить панд импорта как pd в строке 5, потому что вы используете pd вместо панд

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...