Пропускать строки в CSV, содержащие определенную строку - PullRequest
0 голосов
/ 08 апреля 2019

У меня есть список строк (длиннее, чем в этом примере). Если в строке данных существует одна из строк, я хочу пропустить эту строку. Это то, что у меня есть, но я получаю ошибку индекса, из-за чего я думаю, что я не зацикливаюсь правильно.

stringList = ["ABC", "AAB", "AAA"]

with open('filename.csv', 'r')as csvfile:
    filereader = csv.reader(csvfile, delimiter=',')
    next(filereader, None) #Skip header row
    for row in filereader:
        for k in stringList:
            if k not in row:
                data1 = column[1] 

Я получаю ошибку: IndexError: list index out of range. Я понимаю, что читаю по строкам, но мне нужно извлечь данные по столбцам.

Ответы [ 2 ]

1 голос
/ 08 апреля 2019

Ошибка в том, что row - это список, и вы используете / получаете доступ к нему как к обычной переменной.Вы можете получить доступ к определенным столбцам, используя соответствующую индексацию строки списка.Например: в первой итерации row[0] будет элементом первого столбца первого ряда, row[1] элементом второго столбца и т. Д.На последующих итерациях row вы можете получить доступ к записям следующего столбца вниз.

Вот простой цикл, чтобы сделать это.

for row in filereader:
        for k in stringList:
            for i in range(len(row)):
                if k not in row[i]:
                    someVar=row[i]
1 голос
/ 08 апреля 2019

С пандами вы можете сделать это легко, с помощью маски.Подробнее: ссылка

import pandas as pd

data = pd.read_csv('filename.csv')
data = data.loc[data['column_name'] not in stringList]
...