Найдите пропущенные строки в исходном файле после использования numpy genfromtxt python - PullRequest
0 голосов
/ 13 мая 2019

мой вопрос о genfromtxt в python. Я использую следующий код:

syms = np.genfromtxt('final.csv', delimiter = ';', dtype=str, skip_header=1, invalid_raise=False)[:, 0:]

Из-за invalid_raise количество строк пропускается. Есть ли способ найти пропущенные строки в исходном файле (CSV), чтобы удалить их оттуда? Заранее спасибо!

1 Ответ

0 голосов
/ 14 мая 2019

Попробуйте это (может потребоваться отладка):

with open('final.csv') as f:
    lines = f.readlines()
lens = [len(line.split(';')) for line in lines]
# should give the length of each line
len1 = lens[1]   # the length of the first data line
errors = [i for i,n in enumerate(lens[1:] if n!=len1] 
# should give line number of lines with length different from len1

У меня нет хорошего тестового файла, поэтому я не буду пытаться проверить / отладить это.Но логика должна быть прямой.

...