Разделить фрейм данных на несколько столбцов на основе соответствия строк - PullRequest
1 голос
/ 06 ноября 2019

Не знаю, как решить эту проблему.

У меня есть фрейм данных с тысячами столбцов, во многих случаях 10 столбцов - это просто списки словарей, разбитых на несколько столбцов. Я объединил все свои столбцы и хотел бы найти определенные слова, если я найду эти предопределенные слова, я хочу добавить эти слова в виде столбцов и все «значения», присвоенные данным словам, в качестве значений столбцов.

Образцы данных (для удобства преобразуются из кадра данных в dict)

0    [{"date":"0 1 0" firstBoxerRating:[null null] ...
1    [{"date":"2 2 1" firstBoxerRating:[null null] ...
2    [{"date":"2013-10-05" firstBoxerRating:[null n...
dtype: object

Итак, что-то похожее на это:

col_names= ['date','firstBoxerRating:','judges']
#for i in col_names, add i as column, add text before i & i+1 as column value

Пример вывода с использованием этого примера будет:

date         firstBoxerRating
0 1 0         [null null]
2 2 1         [null null]
2013-10-05    [null n...

Попытка преобразовать фрейм данных в словарь и использовать регулярное выражение для присвоения значений элементам в списке (в качестве ключей)

import re
boxers = {"date":[], "firstBoxerRating":[], "judges":[]} 
for i in ax_two:
    date_field = re.search("date: *",i)
    if date_field is not None:
        date = re.search('\w*\s\w*',date_field.group())

, но это был вывод

{'date': [], 'firstBoxerRating': [], 'judges': []}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...