Как подготовить файл CSV для извлечения сущности AutoML из GCP? - PullRequest
0 голосов
/ 20 мая 2019

Я создал Jsonl файлы и форматы, указанные Google.Я загрузил файлы в облачное хранилище.

Я подготовил файл CSV, в первом столбце указан путь к файлу Jsonl (gs: //*example/file.jsonl), во втором столбце указано «TRAIN» или «VALIDATE».'или' TEST '.

Я получил сообщение об ошибке: «Не удается найти указанный файл: TRAIN в запросе».

Как подготовить файл CSV?

1 Ответ

2 голосов
/ 21 мая 2019

Похоже, у вас есть порядок столбцов в обратном направлении. Порядок столбцов должен быть «ML Use» первым, а затем GCS URI. Смотрите пример CSV-файла из Quickstart:

https://cloud.google.com/natural-language/automl/entity-analysis/docs/quickstart

GS: //cloud-ml-data/NL-entity/dataset.csv

https://console.cloud.google.com/storage/browser/cloud-ml-data/NL-entity/?_ga=2.132412110.-1530629862.1558449111

$ cat Downloads/NL-entity_dataset.csv 
TRAIN,gs://cloud-ml-data/NL-entity/train.jsonl
TEST,gs://cloud-ml-data/NL-entity/test.jsonl
VALIDATION,gs://cloud-ml-data/NL-entity/validation.jsonl
...