Это пример данных (файл JSON)
- JSON-файл заполнен точно такой же строкой, поскольку этот «JSON-файл» готов к загрузке в Big Query и ищет способ его разделения по платформам.
{"origin": {"detailed": "instagram", "source": "instagram", "platform": "instagram"}.....}
{"origin": {"detailed": "website", "source": "website", "platform": "website"}.....}
{"origin": {"detailed": "forum", "source": "forum", "platform": "forum"}.....}
{"origin": {"detailed": "twitter", "source": "twitter", "platform": "twitter"}.....}
{"origin": {"detailed": "facebook", "source": "facebook", "platform": "facebook"}.....}
Я ищу разбиение этих данных на различные текстовые файлы в зависимости от платформы.
if platform = instagram ( but some how it should be - if line contain "platform": "instagram" )
write to post_instagram.json
if platform = facebook
write to post_facebook.json
..............
...................
Какой чистый способ сделать это? - С помощью PYTHON
Пример:
with open(FILE_NAME, "r") as infile:
Data = infileFollow.read()
If statements?
while statement?
.....
with open(FILE_NAME, "w+") as outfile:
outfile.write(Data)
Причина:
Я пытаюсь разбить данные, так как не смог создать единую схему, которая будет принимать разные платформы, так как разные платформы имеют дополнительные повторяющиеся столбцы, которые нарушают согласованность, даже если я создаю схему со всеми столбцами для всех платформ. Так как решение необходимо разделить данные на основе платформ, так что это будет разные схемы для каждого.