Производительность фильтрации больших строк в облаке - PullRequest
2 голосов
/ 10 октября 2019

Что происходит на большом сервере, когда вы выполняете сканирование префиксов с фильтрацией строк?

Допустим, вы выполняете сканирование префиксов с использованием фильтрации, и со временем все больше строк в конечном итоге отфильтровываются. Мне интересно, снижается ли производительность из-за фильтрации.

Эффективна ли Cloud Bigtable при сканировании с префиксами, которое должно отфильтровывать множество строк?

Ответы [ 2 ]

2 голосов
/ 12 октября 2019

Является ли Cloud Bigtable эффективным при сканировании префиксов, для которого необходимо отфильтровать множество строк?

Короче говоря, нет, это не эффективно. Чтобы сделать ваш запрос более эффективным, вы можете повысить значение поля (полей) , которые вы используете в запросе: переместить его (их) из данных столбца в ключ строки.

1 голос
/ 12 октября 2019

Ответы на ваши вопросы приведены в документе

https://cloud.google.com/bigtable/docs/schema-design

, например:

Чтобы добиться максимальной производительности Cloud Bigtable, важно подуматьтщательно о том, как вы составляете свой ключ строки. Это происходит потому, что наиболее эффективные запросы Cloud Bigtable используют ключ строки, префикс ключа строки или диапазон строк для извлечения данных. Другие типы запросов запускают полное сканирование таблицы, что гораздо менее эффективно. Выбрав правильный ключ строки сейчас, вы сможете избежать болезненного процесса переноса данных позже.

...