Контекст
Я ежедневно собираю некоторые данные, связанные с коронавирусом, в качестве самостоятельного проекта. Учитывая, что данные являются действительными, я хотел бы сохранить их так, чтобы я мог видеть: «Хорошо, в Огайо было много таких случаев вчера, а сегодня столько».
Предлагаемое решение
Я загружаю свои pandas фреймы данных в базу данных sqlite. Прямо сейчас это просто набор таблиц, каждая таблица представляет один день. Структура каждой таблицы:
Имя таблицы: состояние_ [месяц] _ [день]
- состояние: сокращения штата
- положительный: количество проверенных позиций
- отрицательный: количество протестированных отрицательных
- госпитализированных: число pos в больнице
- смертей: количество смертей
- last_updated: дата и время обновления
У меня также есть справочная таблица:
Название таблицы: state_pop
- Штат: сокращение штата
- Население: население по состоянию на 2019
Я представлял себе использование state.state_pop в качестве ссылочного ключа для всех других таблиц. Так что я мог бы просто вытащить Огайо и получить его данные из всех других таблиц.
Issue
Я не могу найти способ либо: загрузить мой pandas фреймы данных, а затем назначить столбец (это не поддерживается sqlite) в качестве первичного ключа ИЛИ назначить столбец в качестве первичного ключа и затем загрузить их (насколько я могу судить, это не поддерживается python / pandas).
Хотелось бы услышать ваши предложения!