Mean_partition_size таблицы показывает неправильные, чрезвычайно высокие значения - PullRequest
0 голосов
/ 27 января 2019

У меня есть таблица в scylla, назовите ее «tablex», в пространстве ключей «keyspacey», теперь я загружаю данные из нее в Spark, и я обнаружил очень большое количество разделов, копающихся в коде, который я виделон использует mean_partition_size, это можно увидеть с помощью запроса:

SELECT range_start, range_end, partitions_count, mean_partition_size FROM system.size_estimates WHERE keyspace_name = 'keyspacey' AND table_name = 'tablex';

tablex имеет 586 строк, каждая из которых состоит из метки времени, текста, текста, bigint.

Выполнение запроса выше,Я получил 256 строк, у всех есть partition_count = 1 и nean_partition_size = 5960319812.

В чем может быть причина проблемы и как ее решить?

1 Ответ

0 голосов
/ 28 января 2019

Похоже, вы нажали эту ошибку: https://github.com/scylladb/scylla/issues/3916

Исправлено в Scylla 3.0 - мы бы рекомендовали обновление.Руководство по обновлению на https://docs.scylladb.com/upgrade/upgrade-opensource/upgrade-guide-from-2.3-to-3.0/

...