Я работаю над инструментом поиска документов, используя CloudSearch в AWS. Индекс принимает только XML или JSON. Я хотел бы проиндексировать содержимое документа вместе с метаданными, но не могу понять, как преобразовать файлы PDF (и Excel) в формат, который принимает CloudSearch. Я видел ссылки на cs-import-documents
, но это не отображается в моем CLI.
Кто-нибудь сталкивался с этим? Или кто-нибудь может указать мне другой способ сделать это?