Просмотреть все документы, загруженные в vespa - PullRequest
0 голосов
/ 25 января 2019

Есть ли способ получить все документы, загруженные в vespa?

Я пытался делать запросы с регулярными выражениями, но это не сработало, как ожидалось.

select * from entity where ID matches "[.]+";

ID не является атрибутом, но я попытался с полем атрибута, оба не ответили ни с какими значениями.

Ответы [ 2 ]

0 голосов
/ 25 января 2019

Использование посещения вместо поиска, либо с помощью инструмента vespa-visit , либо с использованием посещения в документе / v1 API REST обычно предпочтительнее для вывода документов.

Если вы хотите использовать поиск, используйте этот запрос для сопоставления всех документов типа:

select * from yourdocumenttype where sddocname contains 'yourdocumenttype';

Чтобы перебрать все документы с этим, будет более эффективно использовать какое-то поле в вашем документе дляразбить набор документов на более мелкие порции и выполнить запрос для одного порции за раз (например, если у вас есть поле метки времени, добавьте в запрос условие диапазона для извлечения документов за отрезок времени в каждом запросе).

(Регулярные выражения поддерживаются только в потоковом режиме.)

0 голосов
/ 25 января 2019

Чтобы выгрузить все документы из Vespa, используйте vespa-visit :

«визит» - это другой интерфейс, чем интерфейс поиска - он создан для передачи больших объемов данных с высокой пропускной способностью,но не обязательно с низкой задержкой

Команды используют посещение для извлечения полного дампа или подмножества, используя выражение выбора

...