Итак, это код.
'' '
for i in range(0,len(azdias.columns.values)):
azdias[str(feat_info.iloc[i,0])] = azdias[(feat_info.iloc[i,0])].replace([feat_info.iloc[i,3]],np.NaN)
' ''
azdias - это сам набор данных, который является фреймом данных.
feat_info - это другой набор данных, который был импортирован в pandas в качестве кадра данных. Столбец 0 содержит имя объекта, которое является именем столбца в наборе данных azdias. 3-й столбец содержит значения, например, XX, которые показывают, что отсутствуют данные / данные об ошибках
Я хочу заменить данные в azdias на NaN, где в нем отсутствует код, указанный в наборе данных feat_info.
Файл feat_info выглядит следующим образом ...
'' '
attribute;information_level;type;missing_or_unknown
AGER_TYP;person;categorical;[-1,0]
ALTERSKATEGORIE_GROB;person;ordinal;[-1,0,9]
ANREDE_KZ;person;categorical;[-1,0]
' ''
Azdias выглядит следующим образом ...
1022 * '' ' 1024 * GER_TYP ALTERSKATEGORIE_GROB ANREDE_KZ CJT_GESAMTTYP FINANZ_MINIMALIST FINANZ_SPARER FINANZ_VORSORGER FINANZ_ANLEGER FINANZ_UNAUFFAELLIGER FINANZ_HAUSBAUER ... PLZ8_ANTG1 PLZ8_ANTG2 PLZ8_ANTG3 PLZ8_ANTG4 PLZ8_BAUMAX PLZ8_HHZ PLZ8_GBZ ARBEIT ORTSGR_KLS9 RELAT_AB 0 - 1 2 1 2.0 3 4 3 5 5 3 ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN 1 -1 1 2 5.0 1 5 2 5 4 5 ... 2.0 3.0 2.0 1.0 1.0 1.0 5.0 4.0 3.0 5.0 4.0 2 - 1 3 2 3.0 1 4 1 2 3 5 ... 3.0 3.0 1.0 0.0 1.0 4.0 4.0 3.0 5.0 2.0 2 2 4 2 2.0 4 2 5 2 1 2 ... 2.0 2.0 2.0 0.0 1.0 3.0 4.0 2.0 3.0 3.0 4 -1 3 1 5,0 4 3 4
Нажмите здесь, чтобы увидеть выше в таблице Набор данных azdias составляет 900 000 * 85 приблизительно