Я думаю, что они предупреждают об использовании его для X (входные данные), потому что:
Категориальные входные данные лучше кодируются как одно горячее кодирование, а не как целые числа в большинстве случаев поскольку в большинстве случаев у вас есть несортируемые категории.
Во-вторых, другая техническая проблема будет заключаться в том, что LabelEncoder не запрограммирован для обработки таблиц (для столбцов / функций кодирования будет необходимо для ИКС). LabelEncoder предполагает, что данные представляют собой простой список. Это будет проблемой.
from sklearn.preprocessing import LabelEncoder
enc = LabelEncoder()
categories = [x for x in 'abcdabaccba']
categories
## ['a', 'b', 'c', 'd', 'a', 'b', 'a', 'c', 'c', 'b', 'a']
categories_numerical = enc.fit_transform(categories)
categories_numerical
# array([0, 1, 2, 3, 0, 1, 0, 2, 2, 1, 0])
# so it makes out of categories numbers
# and can transform back
enc.inverse_transform(categories_numerical)
# array(['a', 'b', 'c', 'd', 'a', 'b', 'a', 'c', 'c', 'b', 'a'], dtype='<U1')