число питонов в подсчете текстовых файлов - PullRequest
0 голосов
/ 02 мая 2018

У меня есть текстовые файлы с тегами (корейскими словами) и счетными числами. Я хотел бы посчитать все числа из счета из текстовых файлов. Но это довольно сложная задача для меня. Было бы здорово, если бы мне помогли ...

ех)

tag: 있다, count: 61
tag: 맛있다, count: 48
tag: 같다, count: 26
tag: 없다, count: 23
tag: 아니다, count: 20
tag: 좋다, count: 18
tag: 이다, count: 14
tag: 좋아하다, count: 12
tag: 많다, count: 12
tag: 그렇다, count: 11
tag: 유명하다, count: 9
tag: 시원하다, count: 6
tag: 이렇다, count: 6
tag: 멀다, count: 5
tag: 바쁘다, count: 5
tag: 어떻다, count: 5

Ответы [ 2 ]

0 голосов
/ 02 мая 2018

Вы можете использовать pandas для чтения вашего текстового файла в таблицу:

import pandas as pd
#read text file, split with regex seperator
df = pd.read_csv("test.txt", sep = ":|,", names = ["tag", "count"], usecols = [1, 3], engine = "python")
print(df)

Выход

      tag  count
0      있다     61
1     맛있다     48
2      같다     26
3      없다     23
4     아니다     20
5      좋다     18
6      이다     14
7    좋아하다     12
8      많다     12
9     그렇다     11
10   유명하다      9
11   시원하다      6
12    이렇다      6
13     멀다      5
14    바쁘다      5
15    어떻다      5

Суммировать все значения в столбце count

print(df["count"].sum())
>>>281
0 голосов
/ 02 мая 2018

Если вы читаете файл построчно, вы можете разделить каждую строку:

counter = 0
line = row.split(" ") # assumes all the lines are the same as you described

Тогда у вас есть такой массив: ['tag:', '있다,', 'count:', '61']

Теперь у каждого массива есть 4 элемента, и вы всегда можете выбрать последний.

counter += int(line[3])

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...