обновление набора данных внутри локального пакета - PullRequest
0 голосов
/ 22 ноября 2018

Я создаю локальный пакет, который постоянно использует один и тот же набор данных для сравнения с входными данными.Пакет будет доступен другим пользователям, что означает, что набор данных должен быть установлен вместе с пакетом (как наборы данных в наборах данных обучения sci-kit).Проблема в том, что набор данных нужно обновлять каждый месяц, и я не уверен, как обновить набор данных в пакете, который уже установлен.Есть идеи?Вот и скелет моего кода / псевдокода для пакета.

class myClass():
    def __init__ (self):
        self.dataset = dataset in the package
        self.input = pd.DataFrame()
        self.output = pd.DataFrame()
    def somefuntion(self):
        self.check_date_dataset()
        if checked_date < Today - 30 days:
            self.update_dataset()
        do_something_with_self.input()
    def check_date(self):
        checks date of dataset in day and returns the age
    def update_dateset(self)
        update the data set in the package  # (IS THIS POSSIBLE)?

Можно ли обновить набор данных внутри уже установленного пакета?

1 Ответ

0 голосов
/ 23 ноября 2018

Посмотрите на пакет uszipcode .Он поддерживает актуальный кеш в домашнем каталоге пользователя (вне директории пакета), при необходимости загружая свежую копию.Вы можете принять аналогичный подход.

...