Нет, ваши проблемы, скорее всего, необоснованны.
GC может быть проблемой, когда имеешь дело с большими кучами и сломанной памятью (требуется остановить коллекцию мира) или средне живыми объектами, которые повышены до старого поколения.но затем быстро разыменовывается (требует чрезмерного GC, но может быть исправлено путем изменения размера нового: старого пространства)
Сканер очень маловероятно подходит для любого из двух вышеупомянутых профилей - вам, вероятно, не нужно массивное старое поколение, и у вас должны быть относительно недолговечные объекты (представление страницы в памяти при разборе данных) иэто будет эффективно решаться в коллекционере молодого поколения.
У нас есть собственный сканер (Java), который может успешно обрабатывать 2 миллиона страниц в день, включая некоторую дополнительную постобработку на страницу, на аппаратном оборудовании (2 ГБ ОЗУ), основным ограничением является пропускная способность.GC не является проблемой.
Как уже упоминали другие, GC редко является проблемой для приложений, чувствительных к пропускной способности (таких как сканер), но может (если не соблюдать осторожность) быть проблемой для приложений, чувствительных к задержке(например, торговая платформа).