Загрузите книгу Microsoft Excel с несколькими листами в Azure ML Studio - PullRequest
0 голосов
/ 28 июня 2018

Я хочу загрузить свою Excel рабочую книгу в Azure Machine Learning Studio. Причина в том, что у меня есть некоторые данные, которые я хотел бы объединить с другими моими .csv файлами для создания набора обучающих данных. Когда я загружаю свои Excel, я не получаю .xlsx или .xls, но другие расширения, такие как .csv, .txt и т. Д.

Вот так это выглядит, enter image description here

Я все равно загрузился, и теперь у меня появляются странные персонажи. Как я могу загрузить книгу Excel и получить свои листы, чтобы я мог объединить данные и подготовить данные. Есть предложения?

1 Ответ

0 голосов
/ 28 июня 2018

Вы можете сохранить книгу в виде (набора) файлов CSV и загрузить их отдельно.

Файл CSV, файл ' Comma Separated Values ​​', является именно этим. Плоский файл с некоторыми значениями, разделенными запятой. Если вы загрузите файл Excel, он испортится, поскольку в файле Excel гораздо больше информации, чем просто значения, разделенные запятыми. Взгляните на File -> Save as -> Save as type, где вы можете выбрать 'CSV (с разделителями-запятыми) (* .csv)'

Отказ от ответственности: нет, это не всегда запятая ...

Кроме того, термин «CSV» также обозначает некоторые тесно связанные форматы, разделенные разделителями, в которых используются разные разделители полей. К ним относятся значения, разделенные табуляцией, и значения, разделенные пробелами. Разделитель, отсутствующий в данных поля (например, табуляция), упрощает синтаксический анализ формата. Эти альтернативные файлы, разделенные разделителями, часто даже имеют расширение .csv, несмотря на использование разделителя полей без запятой.

Редактировать
Так что, очевидно, файлы Excel поддерживаются : Поддерживаемые источники данных для подготовки данных машинного обучения Azure

Excel (.xls / .xlsx)
Читайте файл Excel по одному листу за раз, указав имя или номер листа.

Но также поддерживается только UTF-8: Импорт данных - Технические примечания

Машинное обучение Azure требует кодировки UTF-8. Если импортируемые данные используют другую кодировку или были экспортированы из источника данных, который использует другую кодировку по умолчанию, в тексте могут появиться различные проблемы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...