Вопросы с тегом армирование обучение

0 голосов

1 ответ

в биржевой торговле, как оценить количество акций

Я работаю над анализом и прогнозированием фондового рынка с использованием методов машинного...

parth vadhadiya / 16 января 2019

0 голосов

0 ответов

Ошибка подтверждения возникает, когда я запускаю код для блэкджека RL

точно так же, как и заголовок. мой код - простое Q-learning для блэкджека. но в обучающей части...

seunghyung lee / 13 января 2019

0 голосов

1 ответ

используя openai тренажерный зал (блэкджек), чтобы сделать ай

Я использую тренажерный зал openai, чтобы сделать ИИ для блэкджека. но я плохо разбираюсь в питоне...

seunghyung lee / 12 января 2019

0 голосов

1 ответ

Является ли MonteCarloTreeSearch подходящим методом для решения этой проблемы (большое пространство действия / состояния)?

Я занимаюсь исследованием проблемы решения с конечным горизонтом с t = 1, ..., 40 периодами. На...

D. B. / 09 января 2019

0 голосов

1 ответ

Keras Tensorboard для обучения усилению DQN

Я использую keras для построения DQN и обучения его классическому алгоритму DQN с памятью...

palazzo train / 09 января 2019

0 голосов

1 ответ

Свертка для государственного представительства

При использовании DQN, других алгоритмов глубокого RL, имеет ли смысл использовать сверточный слой...

user3180 / 04 января 2019

0 голосов

1 ответ

OpenAI Gym - Как создать одно горячее пространство наблюдения?

Кроме документа openAI , мне не удалось найти более подробную документацию. Мне нужно знать...

Gulzar / 03 января 2019

0 голосов

0 ответов

нейронная сеть pytorch (вероятно) не учится

Я пытаюсь написать агента DDPG, чтобы играть в футбольную игру в pytorch.Первоначально с агентом...

Amogh Badugu / 30 декабря 2018

0 голосов

1 ответ

Обучение усилению с использованием наборов данных нескольких биржевых тикеров?

Вот общий вопрос, который, возможно, кто-то может указать мне в правильном направлении. Я вхожу в...

Matt Wilson / 30 декабря 2018

0 голосов

1 ответ

Какое конкретное изменение формулы в цели меняет нейронную сеть с градиентного спуска на градиентное восхождение?

Было странно, когда я сталкиваюсь с этим в обучении подкреплению.Потеря MSE.Все должно быть...

Andrei Li / 25 декабря 2018

0 голосов

0 ответов

OpenAI: усиление блэкджека в контроле MC по политике превосходит эвристическую политику

Я создал код для реализации в политике контроля Монте-Карло по проблеме БлэкДжек из openAIgym в...

Bram Janssens / 20 декабря 2018

0 голосов

1 ответ

Зачем разворачивать тренажерный зал openAI?

Я пытаюсь получить представление об обучении с подкреплением, используя тренажерный зал openAI в...

Bram Janssens / 18 декабря 2018

0 голосов

0 ответов

Оптимизация tfjs tenorflowjs с проблемой нестандартных потерь getInputTensorIds

Я пытаюсь использовать тензор потока для создания агента DQN.Я черпаю вдохновение из этого...

Clement Le Fur / 18 декабря 2018

0 голосов

1 ответ

Как реализовать инвертирующий градиент в Tensorflow?

Я пытаюсь реализовать DDPG в Tensorflow.Пространство действия непрерывно с верхней границей P_max и...

王士豪 / 18 декабря 2018

0 голосов

0 ответов

Создание MonitoredTrainingSession вызывает InvalidArgumentError в тензорном потоке

Код, используемый для инициации MonitoredTrainingSession, вызывает InvalidArgumentError: with tf

haless / 18 декабря 2018

0 голосов

0 ответов

Оптимизация алгоритма итерации стоимости в обучении подкреплению

У меня есть одно сомнение, связанное с итерацией значения.Я пытался решить проблему...

abhi s / 17 декабря 2018

0 голосов

1 ответ

Внедрение Pytorch PPO не изучается

Эта реализация PPO где-то содержит ошибку, и я не могу понять, что не так.Сеть возвращает...

martinenzinger / 16 декабря 2018

0 голосов

1 ответ

Создание MDP // Искусственный интеллект для 2D игры с несколькими терминалами

, поэтому я уверен, что все слышали о вызове Беркли Pac-Man AI в тот или иной момент.Некоторое время...

Speakmore / 16 декабря 2018

0 голосов

0 ответов

Как изменить масштаб агента Humanoid-v2 и сделать его меньше или больше?

Для проекта я хочу тренировать «Humanoid-v2» для разных типов телосложения.Обычный Humanoid-v2...

Beginner / 12 декабря 2018

0 голосов

1 ответ

Как найти расстояние, пройденное агентом Humanoid-v2 после тренировки?

Я тренировал «Humanoid-v2» (https://github.com/openai/gym/wiki/Humanoid-V1), чтобы ходить. Награды...

Beginner / 11 декабря 2018

0 голосов

1 ответ

Каков код стрельбы пулями в динамические объекты в Python?

Я хочу тренировать ИИ с использованием Reinforcement Learning на python.Цель состоит в том, чтобы...

Farbod.T / 11 декабря 2018

0 голосов

1 ответ

Python binning data openAI тренажерный зал

Я пытаюсь создать пользовательскую среду для обучения с подкреплением в тренажерном зале openAI.Мне...

HenryHub / 10 декабря 2018

0 голосов

2 ответов

Почему Q-Learning - это обучение вне политики?

Привет, сообщество переполнения стека! В настоящее время я слежу за лекциями Дэвида Сильвера по...

dummyHead / 10 декабря 2018

0 голосов

1 ответ

Визуализация прогресса обучающего агента по усилению

Я видел много постов, которые визуализируют улучшение агента подкрепления в процессе обучения

Bartleby / 09 декабря 2018

0 голосов

1 ответ

OpenAI gym 0.10.9 объект 'module' не имеет атрибута 'benchmark_spec'

benchmark = gym.benchmark_spec ('Atari40M') AttributeError: у объекта 'module' нет атрибута...

李浥尘 / 09 декабря 2018