Мне интересно, что вы можете сделать вывод, используя извлечение данных из двух больших наборов данных, которые имеют схожие свойства.Скажем, у вас есть два набора данных, содержащих подробную информацию о школах в стране, и каждый набор данных относится к школьному этапу за определенный год.Какие вещи вы можете сделать с этими наборами данных, используя интеллектуальный анализ данных?
Я знаю, как использовать и применять алгоритмы в пандах, но у меня возникают проблемы с получением мотивации, особенно с помощью k-средних.
Я знаю, что вы используете k-средства для помещения немеченых данных в кластеры на основе числа факторов из набора данных и на основе значений свойств каждого элемента данных, они помещаются в один из созданных кластеров.Но тогда что вы делаете с этими кластерами?Как вы можете использовать их для анализа данных?Я читал, что его даже можно использовать для очистки данных или связывания двух наборов данных друг с другом, но мне просто трудно представить, как вы собираетесь делать эти вещи.
Любая помощь хорошаоценили.Спасибо ..