Почему нельзя Azure Поиск импортировать JSON BLOB-объектов? - PullRequest
1 голос
/ 07 января 2020

При импорте данных с использованием конфигурации, указанной ниже, Azure Cognitive Search возвращает следующую ошибку:

Ошибка определения схемы индекса из источника данных: ""

Это настроено неправильно? Файлы хранятся в контейнере «example1» и в папке BLOB-объектов «json». При создании одного и того же индекса с теми же данными в прошлом не было ошибок, поэтому я не уверен, почему сейчас он отличается.

Импорт данных:

Источник данных : Azure Хранение BLOB-объектов
Имя : тестовый пример
Данные для извлечения : Содержимое и метаданные
Режим анализа : JSON
Строка подключения :
DefaultEndpointsProtocol = https; AccountName = EXAMPLESTORAGEACCOUNT; AccountKey = EXAMPLEACCOUNTKEY;
Имя контейнера : пример1
Папка BLOB-объектов : json

. json структура файла.

{
  "string1": "vaule1",
  "string2": "vaule2",
  "string3": "vaule3",
  "string4": "vaule4",
  "string5": "vaule5",
  "string6": "vaule6",
  "string7": "vaule7",
  "string8": "vaule8",
  "list1": [
    {
      "nested1": "value1",
      "nested2": "value2",
      "nested3": "value3",
      "nested4": "value4"
    }
  ],
  "FileLocation": null
}

Вот изображение экрана с ошибкой при нажатии «Далее: Добавить когнитивные навыки (необязательно)» Кнопка: enter image description here

Ответы [ 3 ]

1 голос
/ 10 января 2020

Чтобы прояснить, есть две проблемы:

1) На портале есть ошибка, из-за которой сообщение об ошибке не отображается, поэтому мы наблюдаем бесполезную пустую строку "" как ошибку сообщение. Исправление уже в пути и должно быть выпущено в начале следующей недели.

2) Ошибка при попытке портала определить схему индекса из вашего источника данных. Трудно сказать, в чем проблема, когда сообщение об ошибке просто "". Я пробовал ваши данные образца, и он отлично работает с импортом.

Я обновлю сообщение, как только выйдет исправление для отображения сообщения об ошибке. А пока (опять же, мы здесь летим вслепую без указания строки ошибки c) вот несколько вещей, которые нужно проверить:

1) Убедитесь, что правила брандмауэра позволяют порталу читать из хранилища больших двоичных объектов.

2) Убедитесь, что в файлах JSON нет лишних символов. Проверьте, являются ли пробелы символами пробела (вы должны открыть файл в VSCode и проверить).

Обновление: исправлено исправление портала для отсутствующих сообщений об ошибках. Вы должны увидеть более конкретное c сообщение об ошибке, если во время импорта произойдет ошибка.

0 голосов
/ 08 января 2020

Я связывался с Microsoft, и это ошибка на портале Azure. Проблема заключается в том, что мастер строки подключения неправильно добавляет суффикс конечной точки. Они рекомендовали вручную вставить строку подключения, но это все равно не работает для меня. Так что это предложенный ответ от Microsoft, но я не считаю, что он полностью правильный, потому что портал выводит одно и то же сообщение об ошибке:

Ошибка при обнаружении схемы индекса из источника данных: ""

0 голосов
/ 07 января 2020

Мне кажется, это проблема, связанная с типом данных list1. Убедитесь, что вы выбираете: «Collection (Edm.String)» для него во время создания индекса.

больше информации, пожалуйста, проверьте шаг 5 следующей ссылки: https://docs.microsoft.com/en-us/azure/search/search-howto-index-json-blobs

...