Синтаксический анализ данных JSON в таблице Netezza на Python - PullRequest
0 голосов
/ 21 января 2019

[{"id": 1, "name": "Lea", "username": "Bret", "email": "hhaa @ gma", "address": {"street": "Light","suite": "Apt. 5", "city": "Gwen", "zipcode": "3874", "geo": {"lat": "-37.3159", "lng": "81.1496"}},"phone": "1-770", "website": "hilde.org", "company": {"name": "Roma", "catchPhrase": "net", "bs": "markets"}}, {"id": 2, "name": "Er", "username": "Ant", "email": "Sh", "address": {"street": "Vis", "suite": "89 "," city ":" Wibrugh "," zipcode ":" 905 "," geo ": {" lat ":" -43.9509 "," lng ":" -34.4618 "}}," phone ":" 010-69 "," website ":" ansia.net "," company ": {" name ":" Deist "," catchPhrase ":" непредвиденные расходы "," bs ":" цепочки поставок "}}]

Я получаю эти данные из веб-страниц и хочу сохранить эти данные в базе данных netezza.Можете ли вы дать мне пример кода?Нужно ли исправлять Json раньше?Если да, как бы я это сделал?И когда я пытаюсь использовать элементы, повторяющиеся в списке, я получаю только последние идентификаторы пользователя.

1 Ответ

0 голосов
/ 24 января 2019

Я бы предложил другой подход из-за лучшей масштабируемости:

1) загрузите необработанные текстовые данные во (временную) таблицу с синтаксисом «внешней таблицы» Netezza

2.) используйте эти функции для разбора данных Json на столбцы таблицы: https://developer.ibm.com/articles/i-json-table-trs/

...