Я являюсь членом команды AWS SageMaker GroundTruth.Сожалею, что у вас возникли трудности при использовании определенных функций нашего продукта.
Из вашего поста я предполагаю, что у вас есть несколько текстовых файлов, и каждый текстовый файл содержит несколько строк.Для классификации текста, чтобы показать предварительный просмотр в консоли, в настоящее время мы поддерживаем только встроенный режим, используя «источник», содержащий каждую строку.
Мы понимаем, что создавать манифест со встроенным текстом неудобно, поскольку он не является тривиальным и требует много времени.Вот почему мы предусмотрели функцию сканирования в консоли (см. Ссылку «создать входной манифест» над полем входного манифеста), которая принимает входной s3Prefix и сканирует все текстовые файлы (с расширениями .txt, .csv) в этом префиксе и читаеткаждая строка каждого из текстовых файлов в префиксе, и создает манифест с каждой строкой как {«source»: »»}.Пожалуйста, дайте нам знать, если вы можете сканировать, чтобы создать свой манифест.
Обратите внимание, что в настоящее время сканер будет работать только в том случае, если вы создали папку s3: // my-bucket / data / из консоли, а затем загрузили все текстовые файлы в этой папке (вместо использования инструмента синхронизации s3 cli).загрузить локальные данные / каталог).
Извините, если наши документы не ясны, и мы определенно принимаем ваши отзывы, чтобы улучшить наш продукт.По любым вопросам, пожалуйста, свяжитесь с нами здесь: https://aws.amazon.com/contact-us/