50-100 ГБ для одной таблицы в состоянии Flink - не проблема.
Но, чтобы быть ясным, когда мы говорим о том, что во Flink имеется огромное количество состояний (например, терабайт), о которых мы говоримсостояние ключа, которое обрабатывается многими параллельными задачами. Да, у вас может быть одна очень большая таблица, но у любого данного экземпляра будет только подмножество строк этой таблицы.
Обратите внимание, что вам нужно будет выбрать бэкэнд состояния - либо кучуоснованный на состоянии бэкэнд, который будет сохранять состояние в памяти как объекты в куче JVM или бэкэнд состояния RocksDB, который будет сохранять состояние в виде сериализованных байтов на диске с кэшем в памяти.