Как разобрать файл jsonlines с помощью панд - PullRequest
0 голосов
/ 29 апреля 2019

Я новичок в python и пытаюсь проанализировать данные из файла, который содержит миллионы строк. Пытался пойти в старую школу, чтобы разобрать его с помощью Excel, но это не удается. Как я могу эффективно анализировать информацию и экспортировать ее в файл Excel, чтобы другим людям было легче читать?

Я пытался использовать этот код, предоставленный кем-то другим, но пока не повезло

import re
import pandas as pd

def clean_data(filename):
    with open(filename, "r") as inputfile:
        for row in inputfile:
            if re.match("\[", row) is None:
                yield row

with open(clean_file,  'w') as outputfile:
    for row in clean_data(filename):
        outputfile.write(row)
NameError: name 'clean_file' is not defined

1 Ответ

0 голосов
/ 29 апреля 2019

Похоже, clean_file не определено, что, вероятно, является проблемой из-за копирования / вставки кода.

Вы имели в виду запись в файл с именем "clean_file"?В этом случае вам нужно заключить его в кавычки: with open("clean_file", 'w')

Если вы хотите работать с json, я предлагаю изучить пакет json , в котором есть множество инструментов для загрузки и анализа json.,В противном случае, если json плоский, вы можете просто использовать встроенную функцию панд read_json

...