Загрузка меток и данных из csv в sklearn - PullRequest
0 голосов
/ 01 мая 2018

У меня есть CSV-файл со строками классификаций / меток, за которыми следуют данные, связанные с ними:

  cat, 0, 1, 45, 23, ...
  dog, 1, 5, 75, 23, ...
  cat, 3, 4, 63, 24, ...
  cat, 0, 1, 44, 23, ...
  dog, 7, 3, 25, 4, ...

Как я могу загрузить CSV-файл в Sklearn?

Редактировать: или мне нужно заменить метки на числовые эквиваленты? То есть собака = 1, кошка = 2 и т. д.

1 Ответ

0 голосов
/ 01 мая 2018

* Отредактировано на основе комментария Вивека

Вы можете использовать панд. Вот пример подачи данных в простой случайный лесной классификатор:

import pandas as pd
from sklearn.ensemble import RandomForestClassifier

data = pd.read_csv('/path/to/data')

Y = data[[0]]  # labels
X = data.drop([0], axis = 1)  # features

clf = RandomForestClassifier()
clf.fit(X, Y)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...