Не знаю, как решить эту проблему.
У меня есть фрейм данных с тысячами столбцов, во многих случаях 10 столбцов - это просто списки словарей, разбитых на несколько столбцов. Я объединил все свои столбцы и хотел бы найти определенные слова, если я найду эти предопределенные слова, я хочу добавить эти слова в виде столбцов и все «значения», присвоенные данным словам, в качестве значений столбцов.
Образцы данных (для удобства преобразуются из кадра данных в dict)
0 [{"date":"0 1 0" firstBoxerRating:[null null] ...
1 [{"date":"2 2 1" firstBoxerRating:[null null] ...
2 [{"date":"2013-10-05" firstBoxerRating:[null n...
dtype: object
Итак, что-то похожее на это:
col_names= ['date','firstBoxerRating:','judges']
#for i in col_names, add i as column, add text before i & i+1 as column value
Пример вывода с использованием этого примера будет:
date firstBoxerRating
0 1 0 [null null]
2 2 1 [null null]
2013-10-05 [null n...
Попытка преобразовать фрейм данных в словарь и использовать регулярное выражение для присвоения значений элементам в списке (в качестве ключей)
import re
boxers = {"date":[], "firstBoxerRating":[], "judges":[]}
for i in ax_two:
date_field = re.search("date: *",i)
if date_field is not None:
date = re.search('\w*\s\w*',date_field.group())
, но это был вывод
{'date': [], 'firstBoxerRating': [], 'judges': []}