У меня есть набор данных, сохраненный в файлах Parquet, отобранных из S3 и зарегистрированных в каталоге данных Glue. Некоторые из столбцов имеют неоднозначный тип.
Например, столбец col
имеет тип struct<long:bigint,string:string>
.
Если я выберу из этой таблицы tbl
, то значения col
например, отображаются так:
{long=16, string=null}
{long=null, string=15.2}
Что я хотел бы сейчас сделать, так это запросить те строки, где col
был классифицирован как string
.
Как бы я это сделалчто?
(Как должен выглядеть запрос для фильтрации строк из tbl
, значение которых в столбце col
классифицируется как long
и > 10
?)