Я хочу научить себя достаточно машинному обучению, чтобы я мог, для начала, понять достаточно, чтобы использовать доступные фреймворки с открытым исходным кодом ML, которые позволят мне делать такие вещи, как:
Просмотрите исходный HTML-код страниц определенного сайта и «поймите», какие разделы образуют контент, какие рекламные объявления, а какие - метаданные (ни контент, ни объявления, например, -Оглавление, биография автора и т. Д.)
Просмотрите исходный HTML-код страниц из разрозненных сайтов и "классифицируйте", принадлежит ли сайт определенной категории или нет (список категорий будет предоставлен заранее)) 1.
... аналогичные задачи классификации по тексту и страницам.
Как видите, мои непосредственные требования связаны склассификация по разнородным источникам данных и большим объемам данных.
Насколько я понимаю, использование подхода нейронной сети будетВы много тренируетесь и поддерживаете, чем используете SVM?
Я понимаю, что SVM хорошо подходят для (бинарных) задач классификации, таких как моя, и фреймворки с открытым исходным кодом, такие как libSVM, достаточно развиты?
В таком случае, какие предметы и темы нужно изучать выпускнику информатики прямо сейчас, чтобы можно было решить вышеуказанные требования и использовать эти рамки?
Я бы хотелостаться в стороне от Java, возможно, и у меня нет никаких языковых предпочтений иначе.Я готов учиться и приложить столько усилий, сколько смогу.
Мое намерение состоит не в том, чтобы писать код с нуля, а для того, чтобы начать использовать различные фреймворки, доступные для использования (я не знаю достаточночтобы решить, какой именно), и я смогу исправить ситуацию, если они пойдут не так .
Рекомендации от вас по изучению определенных частей статистики и теории вероятностей не являются неожиданными с моей стороны,так что скажите, что если потребуется!
Я изменю этот вопрос при необходимости, в зависимости от всех ваших предложений и отзывов.