Таким образом, все поле обнаружения объекта более или менее работает. Вы хотите предсказать рамки вокруг объектов, например, на изображениях. Для каждого блока вы по существу предсказываете несколько параметров регрессии, таких как x, y position, width и length. При обнаружении 3D-объектов у вас есть еще больше параметров, таких как положение z, высота, вращение (угол рыскания).
Я не знаю, назову ли я это тривиальным, но определенно работает.
Как и в случае с многие вещи в машинном обучении вы никогда не узнаете, если не попробуете. То, что может работать над одной задачей, может не сработать хорошо над другой. В общем, я всегда начинаю самое простое решение, которое в вашем случае, вероятно, просто добавляет другой нейрон к выходному слою и смотрит, как это работает.