Я новичок в python и пытаюсь проанализировать данные из файла, который содержит миллионы строк. Пытался пойти в старую школу, чтобы разобрать его с помощью Excel, но это не удается. Как я могу эффективно анализировать информацию и экспортировать ее в файл Excel, чтобы другим людям было легче читать?
Я пытался использовать этот код, предоставленный кем-то другим, но пока не повезло
import re
import pandas as pd
def clean_data(filename):
with open(filename, "r") as inputfile:
for row in inputfile:
if re.match("\[", row) is None:
yield row
with open(clean_file, 'w') as outputfile:
for row in clean_data(filename):
outputfile.write(row)
NameError: name 'clean_file' is not defined