Как сохранить файл JSON в Mongodb - PullRequest
0 голосов
/ 14 апреля 2019

У меня есть данные временной шкалы в Твиттере для каждого твита, сохраненные в формате .json, я не могу сохранить данные в mongodb

Пример: извлечены данные одного твита.

{
  "created_at": "Fri Apr 12 05:13:35 +0000 2019", 
  "id": 1116570031511359489, 
  "id_str": "1116570031511359489", 
  "full_text": "@jurafsky How can i get your video lectures related to   Sentiment Analysis", 
  "truncated": false, 
  "display_text_range": [0, 73], 
  "entities": { 
    "hashtags": [], 
    "symbols": [], 
    "user_mentions": [
      {
        "screen_name": "jurafsky", 
        "name": "Dan Jurafsky", 
        "id": 14968475, 
        "id_str": "14968475", 
        "indices": [0, 9]
      }
    ], 
  "urls": []
}

itтакже содержит URL-адреса и другую потерянную информацию

Я пробовал следующий код.

from pymongo import MongoClient
import json

client=MongoClient('localhost',27107)
db=client.test
coll=db.dataset
with open('tweets.json') as f:
    file_data=json.loads(f.read())
coll.insert(file_data)
client.close()

Ответы [ 2 ]

1 голос
/ 14 апреля 2019

Попробуйте это:

from pymongo import MongoClient
import json

client=MongoClient('localhost',27107)
db=client.test
coll=db.dataset
with open('tweets.json') as f:
    file_data=json.load(f)
coll.insert(file_data)
client.close()
0 голосов
/ 15 апреля 2019

Мой набор данных json недействителен, я должен объединить его с одним объектом массива

Благодаря: Невозможно проанализировать файл json: json.decoder.JSONDecodeError: Дополнительные данные.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...