Поиск содержимого файлов хранилища BLOB-объектов с помощью поиска Azure - PullRequest
0 голосов
/ 28 сентября 2018

Я хочу выполнить полнотекстовый поиск по файлам HTML в хранилище больших двоичных объектов. Я создал службу поиска Azure, добавил источник данных в службу и создал индекс и индексатор через портал Azure.

Я протестировалслужба поиска Azure на портале, использующая Search explorer.It отлично работает.

Но я хотел отобразить результаты поиска в окне консоли, используя код c # вместо тестирования в проводнике поиска.

Должен ли янеобходимо написать класс POJO для DataSource, даже если источник данных для службы создается через портал Azure

Followig - это фрагмент кода

SearchServiceClient serviceClient = new SearchServiceClient(searchServiceName, new SearchCredentials(searchServiceKey));

ISearchIndexClient indexClient = serviceClient.Indexes.GetClient(indexName);

DocumentSearchResult searchResults = indexClient.Documents.Search(searchText);

Я хочу преобразовать объект результатов поиска в читаемый тексти отобразить в окне консоли.Я попробовал метод Base64Decode, но не получил ожидаемого результата.Пожалуйста, помогите мне решить эту проблему.

Заранее спасибо !!!

1 Ответ

0 голосов
/ 28 сентября 2018

Документ, который вы получите, будет JSON, который содержит каждое из полей поискового документа.

Ваш вопрос не ясен относительно того, хотите ли вы отобразить оригинальный HTML или текст, извлеченный из документа HTML.,

Если вам важен только текст (без форматирования HTML), взгляните на поле content .Там будет информация, которая вам нужна.Убедитесь, что поле content можно найти в вашем поисковом индексе, чтобы вы получили его как часть результата.

Если вам нужен документ с фактическим форматированием HTML, обычно он не является частьюИтоговый документ как таковой не индексируется.В этих случаях обычно люди добавляют metadata_storage_path в индекс, чтобы убедиться, что его можно извлечь.Затем, используя этот путь, вы можете просто прочитать исходный файл из хранилища BLOB-объектов.Если вы использовали поле metadata_storage_path в качестве ключа вашего индекса и закодировали его с помощью base64, обязательно декодируйте путь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...