Я пытаюсь получить всю базу данных LibriVox и использую URLlib3 для python3. Он был основан на этом коде , где использовался URLlib2. Но я работаю с python3, поэтому я внес небольшие изменения:
url = librivox_audiobook_by_id + str(book_id)
poolM = urllib3.PoolManager()
json = poolM.request('GET', url, preload_content=False) #type of 'json' - byte
json = simplejson.loads(json) #doesn't work
#"original" code for p2
json = urllib2.urlopen(url).read() #not sure but it might be byte either
json = simplejson.loads(json) #works
IDK, почему мой код не работает.
Поэтому мне нужно получить только некоторые поля (не все) из xml / json в список классов (2-5 полей в), поэтому загрузка и запись в локальный файл слишком длинна для обработки всей базы данных (уже сделал это, но это действительно медленно ...)
ps Я знаю об Libri API, но он не идеален для извлечения информации из всей базы данных, опция «limit» работает плохо только после значения 17