Преобразование двумерного массива Python в пандас - PullRequest
0 голосов
/ 08 июня 2018

Я читаю CSV-файлы, где каждая строка имеет различную интерпретацию в зависимости от значения второго поля.Каждая строка представляет информацию одного и того же типа несколько раз (повторяющиеся значения разных столбцов несколько раз подряд).Мне нужно читать построчно, и мне нужно распределить его по разным спискам или двум массивам.

Like:
with open('info.log','rt') as inputFile:
      filereader = csv.reader(inputFile, delimiter=',')
      for row in filereader:
          if (int(row[1]) == 5):
                for mylist in  (divide the long row into list of lists of fix N length) : # N will be number of columns here
                 array5.append(mylist[2:])   << Now this is an Array of  5 column.
                 # Or Can I append this list direct to dataframe A??

          elif (int(row[1]) == 4):
              for mylist in  (divide the long row into list of lists of fix M length):   # M will be number of columns here
                  array4.append(row[2:3]+mylist)
                  #Can I append this list direct to dataframe B??

После того, как один файл проанализирован, имейте 2 2D массива.У меня есть несколько файлов для анализа.Теперь я хочу провести некоторый анализ этого двухмерного массива.Лучше ли конвертировать 2D массив в pandas dataframe?

Можно ли добавить каждую проанализированную строку (список) в кадр данных panda при анализе каждой строки?

РЕДАКТИРОВАТЬ:

Добавление данных примера: Формат данных, представленных в файлеэто так:

DATA,5,time, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>, <IP1, IP2, write, read,error>....
DATA,4,time, <port_index, read_users, write_users > <port_index, read_users, write_users> <port_index, read_users, write_users>...


DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,4,20180529235251,0,4263532,464027, 2,4181981,2060546,3,4181981,2060546, 4,4181981,2060546, 5,4181981,2060546, 6,4263221,464221, 7,418332,206023,8,4181232,2060232, 9,418123,206023, 10,41812323,202456
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,5,20180529235221,::127.0.0.1,127.0.0.1,0,33345,36736,36751,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33346,36736,74690,0,::ffff:127.0.0.1,::ffff:127.0.0.1,0,33347,36736,36749,0,
DATA,4,20180529235251,0,4263532,464027, 2,4181981,2060546,3,4181981,2060546, 4,4181981,2060546, 5,4181981,2060546, 6,4263221,464221, 7,418332,206023,8,4181232,2060232, 9,418123,206023, 10,41812323,202456
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...