Я просматриваю несколько CSV-файлов в сегменте S3 и пытаюсь проверить, есть ли в сегменте данные за июнь, которые должны содержать только данные за июль.
import pandas as pd
import datetime
import os
import boto3
import s3fs
from io import StringIO
import numpy as np
fs = myawskeys
bucket = myawsbucket
files = mylistoffiles
master = []
for file in files:
with fs.open(file) as f:
df = pd.read_csv(f, delimiter='|')
df['occurred_at'] = pd.to_datetime(df['occurred_at'])
df['generated_at'] = pd.to_datetime(df['generated_at'])
for row in df['occurred_at'].dt.month:
if row == 6:
master.append(df.loc[row])
Я хочу создать новый dataframe (list = master в моем примере) строк, которые находятся в месяце 6. Как мне подмножество df, если мое условие соответствует?