Каков наилучший способ хранения нескольких pandas фреймов данных в реляционных таблицах SQLite? - PullRequest
0 голосов
/ 04 апреля 2020

Контекст

Я ежедневно собираю некоторые данные, связанные с коронавирусом, в качестве самостоятельного проекта. Учитывая, что данные являются действительными, я хотел бы сохранить их так, чтобы я мог видеть: «Хорошо, в Огайо было много таких случаев вчера, а сегодня столько».

Предлагаемое решение

Я загружаю свои pandas фреймы данных в базу данных sqlite. Прямо сейчас это просто набор таблиц, каждая таблица представляет один день. Структура каждой таблицы:

Имя таблицы: состояние_ [месяц] _ [день]

  • состояние: сокращения штата
  • положительный: количество проверенных позиций
  • отрицательный: количество протестированных отрицательных
  • госпитализированных: число pos в больнице
  • смертей: количество смертей
  • last_updated: дата и время обновления

У меня также есть справочная таблица:

Название таблицы: state_pop

  • Штат: сокращение штата
  • Население: население по состоянию на 2019

Я представлял себе использование state.state_pop в качестве ссылочного ключа для всех других таблиц. Так что я мог бы просто вытащить Огайо и получить его данные из всех других таблиц.

Issue

Я не могу найти способ либо: загрузить мой pandas фреймы данных, а затем назначить столбец (это не поддерживается sqlite) в качестве первичного ключа ИЛИ назначить столбец в качестве первичного ключа и затем загрузить их (насколько я могу судить, это не поддерживается python / pandas).

Хотелось бы услышать ваши предложения!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...