список json файлов в файл jsonL с использованием Python - PullRequest
2 голосов
/ 29 мая 2020

У меня есть каталог с большим количеством json файлов. Теперь я хочу, чтобы python прочитал их все и создал один выходной файл jsonl.

Вот сообщение, в котором было что-то подобное (Python преобразование из JSON в JSONL ), но по сравнению с этим сообщением отправной точкой моего вопроса является чтение jsons, чтобы сначала создать объект python, прежде чем преобразовывать их в jsonl.

1 Ответ

1 голос
/ 29 мая 2020

Вот как вы читаете json файлы из каталога в python, а затем выводите загруженные json файлы в один jsonl файл:

import os, json
import pandas as pd

directory = '/Path/To/Your/Json/Directory'  #Specify your json directory path here

json_list=[]    #Initiate a new blank list for storing json data in list format
for dirpath, subdirs, files in os.walk(directory):
    print(dirpath)
    print(filename)
    print(file)
    for file in files:
        if file.endswith(".json"):
            with open(os.path.join(dirpath, file)) as json_file: 
                data = json.load(json_file) 
                json_list.append(data)

#Now, output the list of json data into a single jsonl file
with open('output.jsonl', 'w') as outfile:
    for entry in json_list:
        json.dump(entry, outfile)
        outfile.write('\n')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...