MultiLabel Classification в Керасе для более чем 1700 классов - PullRequest
0 голосов
/ 09 мая 2019

У меня огромный набор протеиновых данных.с 9800 функциями и около 1700 метками классов.Каждый образец может иметь 4 или 5 меток класса.Я разработал модель и провел начальную подготовку.Я получаю очень высокую точность, для которой я знаю причину.Мой вопрос в том, какая функция оптимизатора и потерь будет точной, чтобы получить хорошие результаты.Кроме того, кто-нибудь может мне помочь с пользовательской метрикой точности, которая оказывается немного хитрой, поскольку она должна основываться на тензорности.

1 Ответ

0 голосов
/ 09 мая 2019

Точность не является хорошим показателем для задачи классификации, если используется отдельно.Проверьте, что такое матрица путаницы .Сначала проверьте, сбалансированы ли ваши занятия или нет.Выбор функции потерь сильно зависит от этого.Представьте, что набор данных состоит из 90 наблюдений с меткой 0 и 10 с меткой 1. Классификатор, который всегда выбирает 0, получает точность 90%, хотя это наихудший возможный классификатор.

Оптимизатор не очень важен.Просто иди за Адамом.Когда ваша модель дает интересные результаты, вы можете настроить оптимизатор.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...