Python csv wordcount в столбец - PullRequest
0 голосов
/ 06 мая 2020

Мои извинения, я буквально четыре дня пробовал с нуля. Я пытаюсь взять csv и добавить к нему столбец с количеством слов. Каждая строка будет иметь свой собственный счетчик (в частности, столбец 10). Я пробовал несколько способов, библиотек и pandas. Я также работал с семьей, которая знала, как программировать, и они казались озадаченными. Я приму любую помощь, которую смогу получить. Язык python.

import csv

with open('C:\\Users\\Admin\\Desktop\\Big data\\test.csv','r') as csvinput:
    with open('C:\\Users\\Admin\\Desktop\\Big data\\testa.csv', 'w') as csvoutput:
    writer = csv.writer(csvoutput, lineterminator='\n')
    reader = csv.reader(csvinput)

    all = []
    row = next(reader)
    row.append('Wordcount')
    all.append(row)

    words = []
    for i in words:
        words.append(i)

    words_counted = []
    for i in words:
        x = words.count(i)
        words_counted.append((i,x))

    for row in reader:
        row.append(row[10])
        all.append(row)
        words = row[0].split(" ")

    writer.writerows(all)

Ответы [ 2 ]

1 голос
/ 06 мая 2020

Я дам вам пример кода, как подсчитывать слова:

import pandas as pd
a =  "This is a sample line"
b = "lets count the words for each line"
df = pd.DataFrame([a,b], columns=['col'])

df:

col
0   This is a sample line
1   lets count the words for each line

df['totalwords'] = df['col'].str.split().str.len()

df:

    col                                 totalwords
0   This is a sample line               5
1   lets count the words for each line  7
0 голосов
/ 06 мая 2020

Я предлагаю вам использовать pandas, это поможет вам в вашем случае, нет необходимости повторять колесо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...