как должен выглядеть оператор, если я не хочу вводить все 400-тысячные PK-числа в WHERE-предложение?
Не уверен, какую стратегию Pentaho использует для запуска удалений, но вы можете попытаться загрузить идентификаторы 400k в промежуточную таблицу или временную таблицу и сослаться на нее в DELETE. например,
delete from maintable where id in (select id from maintable_ids_to_delete)