Я делаю классификацию набора данных Ecoli как назначение. Набор данных собирается из хранилища UCI. Чтобы создать классификатор дерева решений, мне нужно преобразовать типы данных объекта в float. В то время как преобразование типов данных изменяется на float, но строка в столбце меняет все на «NaN», так что я не смог использовать этот столбец в функции fit ()
data_file = pd.read_csv('/home/root-user/Documents/ecoli.csv')
df1 = pd.DataFrame(data_file)
df1_cleaned = df1.drop('SEQUENCE_NAME',axis=1)
df1_cleaned['PROTEIN_SEQUENCE'] = pd.to_numeric(df1_cleaned['PROTEIN_SEQUENCE'], errors='coerce')
cleaned_list = df1_cleaned.values.tolist()
print(df1_cleaned)
Тогда вывод будет таким
набор данных после преобразования объекта типа d в float