Как работает ценовая политика S3 select? Что такое данные, возвращаемые и сканируемые в s3 select - PullRequest
0 голосов
/ 26 октября 2018

У меня есть 1M строк данных CSV. выберите 10 строк, мне будет выставлен счет за 10 строк. Что означают возвращаемые данные и данные сканирования в S3 Select?

На этих условиях меньше документации по выбору S3

1 Ответ

0 голосов
/ 25 января 2019

Для простоты давайте на некоторое время забудем, что S3 читает столбчатым способом.Предположим, у вас есть следующие данные:

City, Last Updated Date
London, 1st Jan
London, 2nd Jan
New Delhi, 2nd Jan

Теперь, если вы запрашиваете выборку самой последней даты обновления, вы заставляете S3 сканировать все 3 записи, но возвращаемых записей только 2 (когда дата последнего обновления2 января) Следовательно, основываясь на вашем запросе, он может отсканировать больше данных (3 строки), но вернуть меньше данных (2 строки)

Если я выполнил запрос в выбранном городе, где дата последнего обновления 1 января, он будетотсканируйте все 3 строки, но верните только 1 строку - «Нью-Дели».

Я надеюсь, вы понимаете разницу между отсканированными данными и данными, возвращенными сейчас.

...