Как школьное задание я должен реализовать наивный алгоритм Байеса, который я собираюсь сделать на Java.
Пытаясь понять, как это делается, я прочитал книгу «Интеллектуальный анализ данных - практические инструменты и методы машинного обучения», в которой есть раздел на эту тему, но до сих пор не уверен в некоторых основных моментах, которые блокируют мой прогресс.
Поскольку я ищу здесь руководство, а не решение, я расскажу вам, ребята, о чем я думаю в своей голове, что я думаю о правильном подходе, и взамен потребую исправления / руководства, которые будут очень благодарны. обратите внимание, что я абсолютный новичок в наивном алгоритме Байеса, интеллектуальном анализе данных и общем программировании, поэтому вы можете увидеть глупые комментарии / расчеты ниже:
Набор данных обучения, который мне дан, имеет 4 атрибута / функции, которые являются числовыми и нормализованными (в диапазоне [0 1]) с использованием Weka (без пропущенных значений) и одного номинального класса (да / нет)
1) Данные, поступающие из CSV-файла, являются числовыми HENCE
В Java я использую ArrayList of ArrayList
и Double
для хранения значений атрибутов.
наконец, я не уверен, как получить новые данные? Должен ли я попросить входной файл (например, CSV) или командную строку и попросить 4 значения?
Сейчас я остановлюсь здесь (у меня есть еще вопросы), но я боюсь, что это не получит никаких ответов, учитывая, как долго он получил. Я буду очень признателен тем, кто уделяет время чтению моих проблем и комментариям.