У меня есть метод обратного вызова , который создаст python dictionary
в l oop и добавит эти словари в pandas
фрейм данных,
def process_data(self, _data, ec_search, ec_helpers, _log):
_data_dict = {}
for single_data in _data:
_id = single_data.get('id')
latlon = single_data.get('latlon')
country_code = single_data.get('country_code')
_data_dict[property_id] = {'latlon': latlon,'country_code':country_code}
output = pd.DataFrame() # what to do here?
output = output.append(_data_dict, ignore_index=True)
print(output.head())
Проблема в когда я вызываю этот обратный вызов от другого python def , он создает фрейм данных pandas и добавляет словарь в виде строк, но когда я вызываю второй или более поздний, он будет повторно -инициализировать output = pd.DataFrame()
и добавить словари. Поэтому я просто хочу сохранить свой существующий фрейм данных неповрежденным при добавлении словарей, я видел подобное решение с использованием pd.concate
, но не уверен, что это правильный способ сделать это, или это создаст какие-либо проблемы с производительностью, потому что у меня обработать около 10 млн данных?