Как предсказать непрерывную переменную без каких-либо выходных данных? Все, что у меня есть, это входные данные - PullRequest
0 голосов
/ 10 января 2020

Я работаю над проектом кибербезопасности, в котором мы должны расставить приоритеты уязвимостей на основе существующих функций, которые в основном являются категориальными переменными (включая пару порядковых переменных).

Целью здесь является выявление уязвимости, которая с наибольшей вероятностью может быть использована, и, следовательно, определение ее приоритетности. Следовательно, мы должны прогнозировать счет 0-10. Какая бы самая высокая оценка, которую мы прогнозируем (в данном случае 10), будет самой критической уязвимостью, которая требует немедленного внимания.

Все, что у нас есть, - это категориальные переменные (как входные функции).

Еще раз суммируя проблему здесь:

Функции токового входа: все категориальные переменные (с парой порядковых переменных)

Функция токового выхода: НЕ СУЩЕСТВУЕТ

Ожидаемый результат : Прогнозировать оценку в диапазоне 0-10, при этом 10 является наиболее критической уязвимостью

Никогда не сталкивался с подобной проблемой. Похоже, что регрессия не является ответом. Можете ли вы поделиться своими мыслями о том же.

Ответы [ 2 ]

0 голосов
/ 10 января 2020

Если вы не можете назначить оценку самостоятельно, то алгоритм машинного обучения не сможет это сделать. Он не может знать, для чего оптимизировать.

Однако вы можете добиться успеха, используя неконтролируемый алгоритм для кластеризации ваших данных на основе категориальных значений, затем просматривая кластеры и определяя, какие из них, по-видимому, имеют самые важные вопросы. Вы можете найти одно обсуждение категориальной кластеризации k-средних здесь .

0 голосов
/ 10 января 2020

Возможно, я неправильно понимаю, но, похоже, у вас нет необходимой информации, чтобы сделать прогноз.

Насколько я понимаю, у вас есть информация о категории, но нет других ассоциаций. Для некоторых категорий вы можете жестко закодировать свой прогноз на основе мнения эксперта. Предсказание развертки пинга в основном доброкачественно, например, просто зная, как оно называется. Для чего-то более динамичного c вам понадобится больше информации, чем вы перечислили.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...