Как загрузить набор данных, содержащий помеченные и немаркированные экземпляры в Python? - PullRequest
0 голосов
/ 28 апреля 2019

Я пытаюсь построить полу-контролируемый классификатор (kNN) в python3, используя набор данных banana-SSL.Но я не могу загрузить данные.

Я попробовал обе функции read_csv () из pandas

data = read_csv('banana-ssl10-10-1tra.dat', index_col=0, sep=',')

Я получил это сообщение об ошибке "pandas.errors.ParserError: Ошибка токенизации данных. Ошибка C: Ожидается 2 поля в строке 4, увидел 3 "

и функцию getfromtxt () из numpy

data = np.genfromtxt('banana-ssl10-10-1tra.dat',
                     skip_header=1,
                     skip_footer=1,
                     names=True,
                     delimiter=',')

Я получил эту ошибку" ... Строка # 4775 (получил 3 столбца вместо 2) "Вот это некоторыестроки из набора данных "banana-ssl10-10-1tra.dat":

@relation banana
@attribute At1 real[-3.09,2.81]
@attribute At2 real[-2.39,3.19]
@attribute Class {-1.0,1.0, unlabeled}
@inputs At1, At2
@outputs Class
@data
-0.239, -0.619, -1.0
1.37, -0.331, 1.0
-1.74, 0.697, -1.0
1.15, -1.52, 1.0
0.308, -1.34, -1.0
1.05, 0.453, -1.0
1.01, 0.555, -1.0
...
0.924, 0.861, unlabeled
-1.1, 1.16, unlabeled
0.422, -0.934, unlabeled
-0.209, 0.345, unlabeled
0.434, 2.19, unlabeled
0.412, -0.124, unlabeled
1.02, 0.0975, unlabeled
1.09, 0.614, unlabeled
-0.794, 1.07, unlabeled
1.23, -1.2, unlabeled
-1.07, -0.616, unlabeled
-1.32, -0.403, unlabeled
-1.94, 0.832, unlabeled

Можете ли вы показать мне, как правильно загрузить его в python3?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...