Мне не удалось найти какую-либо связанную информацию об эквивалентности типов данных при преобразовании данных Oracle БД в приемник GCP Bigquery, однако я видел в документации Spanner рекомендуемые преобразования типов данных для этого вида ETL:
CLOB, NCLOB, LONG столбцы могут быть преобразованы в тип STRING с некоторыми примечаниями:
Маленькие объекты (меньше чем 2621440 символов) можно сохранить как STRING . Подумайте об использовании альтернативных предложений Google Cloud, таких как Cloud Storage, для хранения более крупных объектов.
Я знаю тот факт, что GCP Spanner является отдельным продуктом и обладает некоторыми существенными функциями по сравнению с GCP Bigquery, но концептуально оба Продукты GCP поддерживают простые типы данных, которые предположительно можно использовать для одного и того же обмена [CLOB, NCLOB]> STRING в GCP Bigquery.
Вы можете найти ToString()
method in Apache Beam SDK, который может приблизиться к вышеупомянутому преобразованию, настраивая его в конкретном PCollection
внутри вашего конвейерного кода.
Подробнее читайте в этой статье .