Я хотел создать модель обнаружения знаков «наруто», чтобы потом использовать ее в AR-игре, и я попытался реализовать ее в fastai с помощью resnet50 после получения краудсорсинга данных (в основном это я). Но у меня есть модель, предсказывающая только одну категорию для всего.
Это ссылка kaggle:
https://www.kaggle.com/vikranthkanumuru/naruto-hand-sign-detection-usin-fastai-diff-method
Не уверен, что это Это проблема, но раньше у меня было около 28 изображений на группу, поэтому я снял видео о том, как я делаю различные знаки, и использовал opencv, чтобы сохранять кадр за кадром. Позже я удалил те, которые не ограничивались какой-либо группой, и это увеличило размер набора данных с 220 МБ до 2 ГБ. Было ли это правильно или причина плохой модели?
Это ссылка на набор данных
https://www.kaggle.com/vikranthkanumuru/naruto-hand-sign-dataset
Я не являюсь уверен, как действовать дальше и был бы признателен за любую помощь. Большое спасибо.
Редактировать: Если кому-то интересна законченная вещь, вот ссылка: https://www.linkedin.com/feed/update/urn: li: активность: 6640529067936440320 /