Вы действительно должны изменить принятый ответ на этот вопрос, чтобы он не вводил в заблуждение тех, кто сталкивался с ним.
Сказать, что запрос к базе данных - это интеллектуальный анализ данных, потому что "как бы вы обнаружили какой-либо шаблон в ваших данных без предварительного запроса?" это все равно, что сказать, что открывать дверь машины - это вождение, потому что «как еще можно было бы ехать куда-нибудь, не открывая дверь машины в первую очередь».
Вы можете читать свои данные из текстового файла, если хотите. Мое первое задание по извлечению данных использовало наборы данных из UCI-репозитория , и это почти все текстовые файлы.
Если вы хотите узнать о добыче данных, начните с поиска кластеризации и классификации. Узнайте о деревьях решений и классификации на основе правил. Затем посмотрите на k-ближайшего соседа и k-средних. После этого, если вы действительно хотите увидеть, что такое интеллектуальный анализ данных, посмотрите на Chameleon, DBScan и Support Vector Machines. Не обязательно изучать подробности последних трех (они довольно сложны и сложны по математике), но понимание абстрактного представления о том, что происходит, расскажет вам все, что вам нужно знать, чтобы использовать множество инструментов и библиотек, доступных для каждая стратегия.
Это только те алгоритмы, которые всплыли в моей голове только сейчас. Есть так много других, которые я не помню или даже не знаю.