Я пытаюсь написать программу для распознавания жестов рук со сложным фоном (не просто белой стеной).
В настоящее время я думаю об использовании каскада Хаара для обнаружения руки, а затем обрезать эту область для CNN, чтобыпредсказать жест рукой.Но я слышал, что R-CNN также может делать подобные вещи.
Какой из них лучше?Или есть лучший способ сделать это?