У меня есть большая таблица (30B + строки), где на основе значений в 2 полях я хочу определить имя поставщика с помощью регулярного выражения. Существует более 1000 поставщиков, каждый из которых имеет хотя бы один REGEX для его идентификации.
В настоящее время я использую массивное SQL-выражение, но это занимает много времени и ресурсов, если вообще. (RedShift & Snowflake справляется, Google BigQuery - нет.)
Вопрос: Есть ли другой подход к этой проблеме, возможно, до загрузки в базу данных?