у нас есть требование извлекать темные данные из неструктурированных источников, таких как письма, рад-отчеты и т. Д. Пожалуйста, предложите ресурс Azure для извлечения данных из распространенных форматов документов: DOC, DOCX, PDF, RTF, TXT, HTML и т. Д., А затем сделать анализ на извлеченных данных.