У меня есть пакет документов JSON, добавленных вместе. Каждый файл JSON содержит заголовок; Дата; и тело. Дата имеет следующий формат: «день», «месяц» и «год», например, 01 января 1980 года - 31 декабря 2018 года. Я хотел бы создавать подгруппы только из «тела» для каждого месяца. То есть, добавьте весь текст, который появляется в «теле» каждого документа для всех статей за один месяц. Что было бы наиболее эффективным способом сделать это через цикл?
Пока у меня есть Dataframe всех данных:
appended_data = pandas.concat(appended_data)
Я, вероятно, сначала поместил данные в нужный лоток формата datetime
верно?