Di git частота в первом di git в CSV, без импорта - PullRequest
2 голосов
/ 27 мая 2020

Я действительно новичок в Python и прохожу курс в моем Uni. Если у вас есть подсказки и советы по этому вопросу, пожалуйста, очень признательны. У меня проблемы с записью кодов частоты первого di git в файл CSV. Импорт не допускается. например, если у меня есть следующие значения из CSV, мы должны выяснить, сколько 1,2,3,4,5,6,7,8,9,0 появляется в первом di git в каждом числе, et c. from 5.385686, 3665, 6942, 4053, 7726, 4601, 7302 есть одна 3 в первом di git, две 4 в первом di git, одна 3 в первом di git et c)

Я удалил все остальное чем число и. из файла. (используя корректор для таблицы Ascii) Я попытался сначала поместить все данные в список и вернул '5.385686', но я не знаю, что делать дальше ..

ожидаемый результат:

[[26, 22, 28, 22, 16, 20, 31, 22, 13, 0]]

Я показываю только часть из CSV.

5.385686 3665 6942 4053 7726 4601 7302
11754.41657 7859 7002 1502 8754 449 472
800.1759341 2161 4958 3738 5105 1472 2487
1055.19226 7473 3713 4302 3174 6415 9094
1747.798453 2685 5343 3207 2137 1934 1101
2551.157404 3200 4655 2673 4270 821 330
480.7713868 1172 847 3683 9486 2258 6323
19018.97818 3678 5628 1171 7270 8333 2534
505.5652756 7222 4105 6529 169 307 3142
3759.276869 9649 1445 5944 8892 371 8307
4753 6737 906 5057 4401 8698 533
2790 5239 6392 8637 8785 1331 6848
3328 639 3519 7829 6796 3935 2893
6331 2986 6076 1085 7715 8241 5688
[[26, 22, 28, 22, 16, 20, 31, 22, 13, 0]]

Вот что у меня получилось:

def filename():
file = open("sample_accounts.csv", "r")
filecsv = file.read()
filecsv = filecsv.lower()
a = []
b = [ ]

chlist = list(range(128))
del chlist[48:58]
del chlist[46]

for c in chlist:
filecsv = filecsv.replace(chr©," ")
a.append(chlist)

ftlist = filecsv.split()
greet = ftlist
a.append(ftlist)

for i in greet:
return greet[0]
# for i in greet:
# return greet[i]
#
# dic = {}
#
# for word in ftlist:
# dic[word] = dic.get(word,0) + 1
#
# # for item in dic: # **** *
# # print(item, dic[item])
# return greet




d = filename()

Ответы [ 2 ]

1 голос
/ 27 мая 2020

Вы можете сделать это, указав количество каждого di git в словаре:

count = dict({})
with open('path to your file') as file:
    for line in file.readlines():
        for number in line.split(' '):
            number=number.strip()
            if len(number)<1:
                continue
            digit = number[0]
            if digit.isdigit():
                digit = int(digit)
                if digit in count:
                    count[digit] = count[digit]+1
                else:
                    count[digit] = 1
print(count.values())

Вывод:

[14, 11, 16, 12, 10, 11, 9, 11, 4]
1 голос
/ 27 мая 2020

Основываясь исключительно на csv, выделенном в вопросе, вы можете сделать что-то вроде этого:

csv_dat = """[your csv snippet]"""
csv_lst = csv_dat.split(' ') #need to create a list from your snippet; you may already have it in your code
fd_lst = [] #initialize a list for the first digit in each
for item in csv_lst:
    fd_lst.append((item.strip()[0])) #select the first character in each entry
print('digit  frequency')
for x in set(fd_lst): #count only unique characters

    print(x,'\t',fd_lst.count(x))

Вывод:

digit  frequency
8    10
6    10
9    4
7    9
3    14
1    10
5    9
2    9
4    10
...