Dict до Pandas Датафрейм - PullRequest
       3

Dict до Pandas Датафрейм

0 голосов
/ 20 января 2020

Создаю первый раз мой экспорт .csv из dict.

Мой диктофон имеет следующую структуру:

dict_all[key] = {
"id_ja" : None, 
"id_nein" : None ,
"ZUW_ja": set(), 
"ZUW_nein": set(), 
"missing_ZUW_ja" : set(), 
"missing_ZUW_nein" : set()
}

Мой .CSV должен выглядеть следующим образом:

ID_yes/ID_no, ZUW (this needs to be "ZUW" in every row), missing_ZUW_yes/missing_ZUW_nein and Relation (which needs to be -1 in every row)

Для

missing_ZUW_yes/missing_ZUW_nein

Мне нужно написать по одной строке для каждой записи в этом наборе. Это означает, что остальные три столбца должны быть продублированы до тех пор, пока внутри моего missing_ZUW_yes/missing_ZUW_nein есть идентификатор, вероятно, проще всего сначала выполнить итерацию по id_yes, а в этом l oop добавить строку для каждой записи в missing_ZUW_yes. Если первая половина закончена, возможно, было бы легче продолжить с id_no и missing_ZUW_no .. я прав?

Мои соответствующие записи в dict выглядят так:

dict["LM_Doctor"]= {"id_ja": 122344, "id_nein":122345, "missing_ZUW_ja": 123,132,143,12, "missing_ZUW_ja": 432,64,321}

, а в csv это должно выглядеть так:

row 0 = Term ID 1
row 1 = 122344
row 0 = ZUW
row 1 = ZUW
row 0 = Term ID 2
row 1 = first id from missing_ZUW_yes #in this example 123
row 0 = RV
row 1 = -1

и вторая строка должна выглядеть одинаково, за исключением факта что должно быть 132 для missing_ZUW_yes

...