Поскольку y_i
вычисляется с использованием функции Q, которая изменяется от итерации к итерации. Поэтому значения, хранящиеся в одной итерации, недопустимы для следующих итераций.
В рамках одной и той же итерации, я думаю, вы точно указали, что если вы делаете выборку одного и того же перехода несколько раз, то нет необходимости вычислять y_i
несколько раз, вместо этого вы можете использовать один и тот же результат. Я предполагаю, что псевдокод более сфокусирован на ключевых концепциях, чем на деталях такого рода.