Вычитание строк в разных файлах - PullRequest
0 голосов
/ 03 сентября 2018

Я выбираю несколько CSV-файлов в папке. Каждый файл имеет столбец «Время». Я хотел бы построить дополнительный столбец с именем time duration, который вычитает время каждой строки с первой строкой и это для каждого файла Что я должен добавить в свой код?

strong textoutput = pd.DataFrame()
for name in list_files_log:
    with folder.get_download_stream(name) as f:
        try:
            tmp = pd.read_csv(f)
            tmp["sn"] = get_sn(name)
            tmp["filename"]= os.path.basename(name)
            output = output.append(tmp)
        except:
            pass

1 Ответ

0 голосов
/ 03 сентября 2018

Если ваш Time столбец будет выглядеть так:

                 Time
0 2015-02-04 02:10:00
1 2016-03-05 03:30:00
2 2017-04-06 04:40:00
3 2018-05-07 05:50:00

Вы можете создать Duration столбец, используя:

df['Duration'] = df['Time'] - df['Time'][0]

И вы получите:

                 Time           Duration
0 2015-02-04 02:10:00    0 days 00:00:00
1 2016-03-05 03:30:00  395 days 01:20:00
2 2017-04-06 04:40:00  792 days 02:30:00
3 2018-05-07 05:50:00 1188 days 03:40:00
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...