Я пытаюсь построить полу-контролируемый классификатор (kNN) в python3, используя набор данных banana-SSL.Но я не могу загрузить данные.
Я попробовал обе функции read_csv () из pandas
data = read_csv('banana-ssl10-10-1tra.dat', index_col=0, sep=',')
Я получил это сообщение об ошибке "pandas.errors.ParserError: Ошибка токенизации данных. Ошибка C: Ожидается 2 поля в строке 4, увидел 3 "
и функцию getfromtxt () из numpy
data = np.genfromtxt('banana-ssl10-10-1tra.dat',
skip_header=1,
skip_footer=1,
names=True,
delimiter=',')
Я получил эту ошибку" ... Строка # 4775 (получил 3 столбца вместо 2) "Вот это некоторыестроки из набора данных "banana-ssl10-10-1tra.dat":
@relation banana
@attribute At1 real[-3.09,2.81]
@attribute At2 real[-2.39,3.19]
@attribute Class {-1.0,1.0, unlabeled}
@inputs At1, At2
@outputs Class
@data
-0.239, -0.619, -1.0
1.37, -0.331, 1.0
-1.74, 0.697, -1.0
1.15, -1.52, 1.0
0.308, -1.34, -1.0
1.05, 0.453, -1.0
1.01, 0.555, -1.0
...
0.924, 0.861, unlabeled
-1.1, 1.16, unlabeled
0.422, -0.934, unlabeled
-0.209, 0.345, unlabeled
0.434, 2.19, unlabeled
0.412, -0.124, unlabeled
1.02, 0.0975, unlabeled
1.09, 0.614, unlabeled
-0.794, 1.07, unlabeled
1.23, -1.2, unlabeled
-1.07, -0.616, unlabeled
-1.32, -0.403, unlabeled
-1.94, 0.832, unlabeled
Можете ли вы показать мне, как правильно загрузить его в python3?