Мне нужно выбрать только одну строку, последнюю строку из многих многострочных CSV-файлов и добавить их в таблицу в aws athena, а затем экспортировать их в CSV-файл как весь список.
Я пытаюсь собрать данные из многих источников, и файлы CSV обновляются еженедельно, но мне нужна только одна строка из каждого файла.Я использовал стандартный импорт в Афину, и он импортирует все строки из выбранных CSV в корзине, но мне нужна только последняя строка каждой, так что у меня есть самые последние данные из этого файла.
CREATE EXTERNAL TABLE IF NOT EXISTS inventory.laptops (
`date` string,
`serialnum` string,
`biosver` string,
`machine` string,
`manufacturer` string,
`model` string,
`win` string,
`winver` string,
`driveletter` string,
`size` string,
`macaddr` string,
`domain` string,
`ram` string,
`processor` string,
`users` string,
`fullname` string,
`location` string,
`lastconnected` string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
WITH SERDEPROPERTIES (
'serialization.format' = ',',
'quoteChar' = '"',
'field.delim' = ','
) LOCATION 's3://my-s3-bucket/'
TBLPROPERTIES ('has_encrypted_data'='false',"skip.header.line.count"="1");
Мне нужна последняя строка из каждого файла CSV в s3, но я получаю каждую строку, используя этот запрос создания