Склерн Стандартный Скалер - PullRequest
0 голосов
/ 29 сентября 2019

У меня проблема со стандартным Scaler.

После кодирования меток у меня есть числовые данные, но он показывает эту ошибку

Traceback (последний вызов был последним): Файл "c: \Users \ barte.vscode \ extensions \ ms-python.python-2019.9.34911 \ pythonFiles \ ptvsd_launcher.py ", строка 43, в основном файле (ptvsdArgs)" c: \ Users \ barte.vscode \ extensions \ ms-python. python-2019.9.34911 \ pythonFiles \ lib \ python \ ptvsd__main __. py ", строка 432, в основном run () Файл" c: \ Users \ barte.vscode \ extensions \ ms-python.python-2019.9.34911 \ pythonFiles \lib \ python \ ptvsd__main __. py ", строка 316, в файле run_file runpy.run_path (target, run_name = ' main ') Файл" C: \ Users \ barte \ AppData \ Local \ Programs \ Python \ Python36\ Lib \ runpy.py ", строка 263, в run_path pkg_name = pkg_name, script_name = fname) Файл" C: \ Users \ barte \ AppData \ Local \ Programs \ Python \ Python36 \ Lib \ runpy.py ", строка 96,в _run_module_code mod_name, mod_spec, pkg_name, script_name) Файл "C: \ Users \ barte \ AppData \ Local \ Programs \ Python \ Python36 \ Lib \ runpy.py", строка 85, в _run_code exec (code, run_globals) Файл "c: \ Users \ barte \ Desktop \ Projects \ tf \ adullt Набор данных UCI \ model.py", строка 93, в данных [label] = StandardScaler (). fit_transform (data [label]) Файл "C: \ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ sklearn \ base.py", строка 553, в файле fit_transform возвращает self.fit (X, ** fit_params) .transform (X) Файл "C: \ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ sklearn \ preprocessing \ data.py", строка 639, в соответствии
, возвращает self.partial_fit (X, y) Файл "C: \ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ sklearn \ preprocessing \ data.py", строка 663, в part_fit force_all_finite = 'allow-nan') Файл "C:\ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ sklearn \ utils \ validation.py ", строка 496, в check_array
array = np.asarray (массив, dtype = dtype, order =порядок) Файл "C: \ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ numpy \ core_asarray.py", строка 85, в массиве возврата asarray (a, dtype, copy = False, order =порядок) Файл "C: \ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \"site-packages \ pandas \ core \ series.py ", строка 948, в массив return np.asarray (self.array, dtype) Файл" C: \ Users \ barte \ Desktop \ Projects \ tf \ "env \ lib \ site-packages \ numpy \ core_asarray.py ", строка 85, в массиве возврата asarray (a, dtype, copy = False, order = order) Файл" C: \ Users \ barte \ Desktop \ Projects \ tf \ "env \ lib \ site-packages \ pandas \ core \ arrays \ numpy_.py ", строка 166, в массив
return np.asarray (self._ndarray, dtype = dtype) Файл" C:\ Users \ barte \ Desktop \ Projects \ tf \ env \ lib \ site-packages \ numpy \ core_asarray.py ", строка 85, в массиве возврата asarray (a, dtype, copy = False, order = order) ValueError: не удалосьпреобразовать строку в число с плавающей точкой: 'Other-service

label = 'occupation'

temp_values = data[[label,'50']].groupby(label).mean()

temp_values = temp_values.to_dict()['50']
print(temp_values)

for index,row in enumerate(data[label]):

    data[label][index] = temp_values[row]



data[label] = StandardScaler().transform(data[label])

print(data[label])

Just: print (data [label]) дает:

0         0.133835
1          0.48522
2        0.0614815
3        0.0614815
4         0.448489
           ...
30102     0.124619
30105    0.0410959
30110     0.448489
30156     0.326087
30158     0.124619

Я использую этот набор данных https://archive.ics.uci.edu/ml/datasets/Adult

спасибо за помощь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...