У меня есть куча файлов в папке, откуда я читаю каждый файл (где первый столбец - слова, а второй - цифры). Они выглядят примерно так -
file1 file2
a 2 a 3
b 3 b 1
c 1
so the output would be -
freq file_freq
a 5 2
b 4 2
c 1 1
Чтобы объяснить второй столбецвыходных данных a равно 2, потому что это происходит в обоих файлах, тогда как c равно 1, поскольку оно появляется только в файле file1.First столбец - это общее количество случаев, когда системные вызовы (a, b, c) появлялись в файлах.
часть кода-
while line:
words=line.split(" ")
if words[0] in df.index:
df.(words[0],'frequency')=int(words[1])+df.(words[0],'frequency')
df.(words[0],'file_frequency')=df.(words[0],'file_frequency')+1
else:
df.loc[-1] = [words[0],words[1],1]
Поэтому я ищу, если системный вызов, найденный в кадре данных, обновит частоту (которая должна быть + =).Я ищу его эквивалент в пандах.
edit- я попробовал
df[words[0]]['frequency'] += words[1]
df[words[0]]['file_frequency'] += 1
, но получил KeyError: 'clock_gettime'