Вариант использования Гауссовой регрессии - PullRequest
0 голосов
/ 23 января 2020

, читая статью: «Тактильное распознавание активных объектов и поиск целевых объектов в неизвестном рабочем пространстве», есть кое-что, что я просто не могу понять:

В статье рассказывается о поиске позиции объекта и др. свойства, использующие только тактильную информацию. В разделе 4.1.2 автор говорит, что он использует GPR для руководства исследовательским процессом, а в разделе 4.1.4 он описывает, как он обучил свой GPR:

  1. Используя пример из раздела 4.1. 2, вход (x, z) и выход y.
  2. При наличии контакта сохраняется значение y, отвечающее ядру.
  3. Эта процедура повторяется несколько раз.
  4. Этот обученный георадар используется для оценки следующей точки исследования, которая является точкой, где дисперсия максимальна при.

В следующей ссылке вы также можете увидеть демонстрацию: https://www.youtube.com/watch?v=ZiLq3i-BJcA&t=177s. В первой части видео (0: 24-0: 29) первая инициализация происходит, когда робот выполняет 4 выборки. Затем в течение следующих 25 секунд, робот исследует исследует с соответствующего направления. Я не понимаю, как эта крошечная инициализация GPR может вести исследовательский процесс. Может ли кто-нибудь объяснить, как можно оценить входные точки (x, z) из первой части исследования?

1 Ответ

1 голос
/ 23 января 2020

Любой алгоритм регрессии просто отображает входные данные (x,z) на выходные данные y каким-то образом, уникальным для указанного алгоритма c. Для нового ввода (x0,z0) алгоритм, скорее всего, будет предсказывать что-то очень близкое к истинному выводу y0, если в тренинг было включено много точек данных, подобных этим. Если бы только данные обучения были доступны в совершенно другом регионе, прогнозы, скорее всего, будут очень плохими.

GPR включает в себя меру достоверности прогнозов, а именно дисперсию. Разница, естественно, будет очень высокой в ​​регионах, где данные обучения не были замечены ранее, и низкими очень близко к уже замеченным точкам данных. Если «эксперимент» занимает гораздо больше времени, чем оценка гауссовского процесса, вы можете использовать гауссовский процесс, чтобы убедиться, что вы отбираете области, в которых вы очень не уверены в своем ответе.

Если целью является полное изучение Во всем пространстве ввода вы можете нарисовать много случайных значений (x,z) и оценить дисперсию по этим значениям. Тогда вы можете выполнить дорогостоящий эксперимент в точке ввода, где вы наиболее неуверенны в y. Затем вы можете переучить GPR со всеми исследованными данными и повторить процесс.

Для задач оптимизации (не вопрос ОП)

Если вы будете sh чтобы найти самое низкое значение y во входном пространстве, вы не заинтересованы в проведении эксперимента в регионах, которые, как вы знаете, дают высокие значения y, но вы просто не уверены в как высоко эти значения будут. Поэтому вместо выбора (x,z) точек с наибольшей дисперсией вы можете выбрать прогнозируемое значение y плюс одно стандартное отклонение. Этот способ минимизации значений называется байесовской оптимизацией, а эта схема c называется Upper Confidence Bound (UCB). Ожидаемое улучшение (EI) - вероятность улучшения ранее лучшего результата - также широко используется.

...