Я читаю CSV-файлы, где каждая строка имеет различную интерпретацию в зависимости от значения второго поля.Каждая строка представляет информацию одного и того же типа несколько раз (повторяющиеся значения разных столбцов несколько раз подряд).Мне нужно читать построчно, и мне нужно распределить его по разным спискам или двум массивам.
Like:
with open('info.log','rt') as inputFile:
filereader = csv.reader(inputFile, delimiter=',')
for row in filereader:
if (int(row[1]) == 5):
for mylist in (divide the long row into list of lists of fix N length) : # N will be number of columns here
array5.append(mylist[2:]) << Now this is an Array of 5 column.
# Or Can I append this list direct to dataframe A??
elif (int(row[1]) == 4):
for mylist in (divide the long row into list of lists of fix M length): # M will be number of columns here
array4.append(row[2:3]+mylist)
#Can I append this list direct to dataframe B??
После того, как один файл проанализирован, имейте 2 2D массива.У меня есть несколько файлов для анализа.Теперь я хочу провести некоторый анализ этого двухмерного массива.Лучше ли конвертировать 2D массив в pandas dataframe?
Можно ли добавить каждую проанализированную строку (список) в кадр данных panda при анализе каждой строки?
РЕДАКТИРОВАТЬ:
Добавление данных примера: Формат данных, представленных в файлеэто так:
DATA,5,time, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>....
DATA,4,time, <port_index, read_users, write_users > <port_index, read_users, write_users> <port_index, read_users, write_users>...
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,4,20180529235251,0,4263532,464027, 2,4181981,2060546,3,4181981,2060546, 4,4181981,2060546, 5,4181981,2060546, 6,4263221,464221, 7,418332,206023,8,4181232,2060232, 9,418123,206023, 10,41812323,202456
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,4,20180529235251,0,4263532,464027, 2,4181981,2060546,3,4181981,2060546, 4,4181981,2060546, 5,4181981,2060546, 6,4263221,464221, 7,418332,206023,8,4181232,2060232, 9,418123,206023, 10,41812323,202456