Почему Python не может проанализировать эти данные JSON? - PullRequest
1369 голосов
/ 14 мая 2010

У меня есть этот JSON в файле:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [
        "id": "valore"
    ],
    "om_points": "value",
    "parameters": [
        "id": "valore"
    ]
}

Я написал этот скрипт для печати всех данных JSON:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Эта программа вызывает исключение:

Traceback (most recent call last):
  File "<pyshell#1>", line 5, in <module>
    data = json.load(f)
  File "/usr/lib/python3.5/json/__init__.py", line 319, in loads
    return _default_decoder.decode(s)
  File "/usr/lib/python3.5/json/decoder.py", line 339, in decode
    obj, end = self.raw_decode(s, idx=_w(s, 0).end())
  File "/usr/lib/python3.5/json/decoder.py", line 355, in raw_decode
    obj, end = self.scan_once(s, idx)
json.decoder.JSONDecodeError: Expecting ',' delimiter: line 13 column 13 (char 213)

Как мне проанализировать JSON и извлечь его значения?

Ответы [ 9 ]

2056 голосов
/ 14 мая 2010

Ваши данные не действительны JSON формат. У вас есть [], когда вы должны иметь {}:

  • [] для массивов JSON, которые называются list в Python
  • {} для объектов JSON, которые называются dict в Python

Вот как должен выглядеть ваш JSON-файл:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": {
        "id": "valore"
    },
    "om_points": "value",
    "parameters": {
        "id": "valore"
    }
}

Тогда вы можете использовать свой код:

import json
from pprint import pprint

with open('data.json') as f:
    data = json.load(f)

pprint(data)

Теперь с данными вы также можете найти такие значения:

data["maps"][0]["id"]
data["masks"]["id"]
data["om_points"]

Попробуйте их и посмотрите, начнет ли это иметь смысл.

301 голосов
/ 30 ноября 2012

Ваш data.json должен выглядеть так:

{
 "maps":[
         {"id":"blabla","iscategorical":"0"},
         {"id":"blabla","iscategorical":"0"}
        ],
"masks":
         {"id":"valore"},
"om_points":"value",
"parameters":
         {"id":"valore"}
}

Ваш код должен быть:

import json
from pprint import pprint

with open('data.json') as data_file:    
    data = json.load(data_file)
pprint(data)

Обратите внимание, что это работает только в Python 2.6 и выше, так как это зависит от with -статажа . В Python 2.5 используйте from __future__ import with_statement, в Python <= 2.4 см. <a href="https://stackoverflow.com/a/2835672/906658"> ответ Джастина Пила , на котором основан этот ответ.

Теперь вы также можете получить доступ к отдельным значениям, например так:

data["maps"][0]["id"]  # will return 'blabla'
data["masks"]["id"]    # will return 'valore'
data["om_points"]      # will return 'value'
63 голосов
/ 22 мая 2015

Ответ Джастина Пила действительно полезен, но если вы используете Python 3, чтение JSON должно быть сделано так:

with open('data.json', encoding='utf-8') as data_file:
    data = json.loads(data_file.read())

Примечание: используйте json.loads вместо json.load. В Python 3 json.loads принимает строковый параметр. json.load принимает файл-подобный параметр объекта. data_file.read() возвращает строковый объект.

Если честно, я не думаю, что в большинстве случаев проблема загрузки всех данных json в память.

52 голосов
/ 13 мая 2013
data = []
with codecs.open('d:\output.txt','rU','utf-8') as f:
    for line in f:
       data.append(json.loads(line))
13 голосов
/ 10 марта 2015

"Ultra JSON" или просто "ujson" могут обрабатывать ввод [] в ваш файл JSON.Если вы читаете входной файл JSON в вашу программу в виде списка элементов JSON;например, [{[{}]}, {}, [], etc...] ujson может обрабатывать любой произвольный порядок списков словарей, словари списков.

Вы можете найти ujson в индексе пакета Python , и API почти идентичен встроенной библиотеке Python json.

ujson также намного быстрее, если вы загружаете большие файлы JSON.Вы можете увидеть детали производительности в сравнении с другими библиотеками Python JSON по той же ссылке.

7 голосов
/ 25 апреля 2017

Если вы используете Python3, вы можете попробовать изменить (connection.json файл) JSON на:

{
  "connection1": {
    "DSN": "con1",
    "UID": "abc",
    "PWD": "1234",
    "connection_string_python":"test1"
  }
  ,
  "connection2": {
    "DSN": "con2",
    "UID": "def",
    "PWD": "1234"
  }
}

Затем используйте следующий код:

connection_file = open('connection.json', 'r')
conn_string = json.load(connection_file)
conn_string['connection1']['connection_string_python'])
connection_file.close()
>>> test1
6 голосов
/ 07 ноября 2017

Здесь вы идете с измененным data.json файлом:

{
    "maps": [
        {
            "id": "blabla",
            "iscategorical": "0"
        },
        {
            "id": "blabla",
            "iscategorical": "0"
        }
    ],
    "masks": [{
        "id": "valore"
    }],
    "om_points": "value",
    "parameters": [{
        "id": "valore"
    }]
}

Вы можете вызвать или распечатать данные на консоли, используя следующие строки:

import json
from pprint import pprint
with open('data.json') as data_file:
    data_item = json.load(data_file)
pprint(data_item)

Ожидаемый результат для print(data_item['parameters'][0]['id']):

{'maps': [{'id': 'blabla', 'iscategorical': '0'},
          {'id': 'blabla', 'iscategorical': '0'}],
 'masks': [{'id': 'valore'}],
 'om_points': 'value',
 'parameters': [{'id': 'valore'}]}

Ожидаемый результат для print(data_item['parameters'][0]['id']):

valore
4 голосов
/ 30 ноября 2018

Как пользователь Python3 ,

Разница между load и loads методами особенно важна, когда вы читаете данные json из файла.

Как указано в документах:

json.load:

Десериализация fp (.read () - поддержка текстового файла или двоичного файла файл, содержащий документ JSON) в объект Python, используя этот таблица перевода.

json.loads:

json.loads: десериализация s (экземпляр str, bytes или bytearray содержащий документ JSON) в объект Python, использующий это преобразование стол.

Метод json.load может непосредственно читать открытый документ json, так как он способен читать двоичный файл.

with open('./recipes.json') as data:
  all_recipes = json.load(data)

В результате ваши данные json будут доступны в формате, указанном в следующей таблице преобразования:

https://docs.python.org/3.7/library/json.html#json-to-py-table

4 голосов
/ 05 октября 2018

В этом разборе есть два типа.

  1. Парсинг данных из файла по системному пути
  2. Разбор JSON с удаленного URL.

Из файла вы можете использовать следующее

import json
json = json.loads(open('/path/to/file.json').read())
value = json['key']
print json['value']

Эта статья объясняет полный анализ и получение значений с использованием двух сценариев. Синтаксический анализ JSON с использованием Python

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...