Да, Q-функция - это термин, который используется для аппроксимации Q-значения, которое совпадает с функцией action-value.
Другими словами, когда приближение функции используется для получения Q-значения для любого произвольного действия состояния, эта функция называется Q-функцией.