Большой набор данных для КНН - PullRequest
0 голосов
/ 07 июня 2019

Я хочу применить модифицированный KNN, чтобы он был реализован для большого набора данных. Я пытаюсь найти большой набор данных (более 20000 строк), который идеально подходит для KNN, чтобы можно было сравнить классический KNN и мою собственную версию. Любой пример?

1 Ответ

1 голос
/ 07 июня 2019

При правильном поиске через Интернет их должно быть много.Хорошим местом для начала может послужить рукописный набор данных MNIST, содержащий 70000 помеченных примеров.Тщательно настроенный KNN хорошо работает с этими данными.

Его можно загрузить из библиотеки sklearn.

>>> from sklearn.datasets import fetch_mldata
>>> mnist = fetch_mldata('MNIST original', data_home=custom_data_home)

Для получения более подробной информации, пожалуйста, обратитесь к https://scikit -learn.org/0.19/datasets/mldata.html.

...