ClientError: Невозможно проанализировать CSV: строки 1-1000, файл - PullRequest
0 голосов
/ 08 июля 2019

Я посмотрел другие ответы на этот вопрос, и никто из них не помог мне.Я пытаюсь запустить простой алгоритм случайного рубки леса.У меня есть небольшой набор данных IP-адресов, которые были сокращены, чтобы иметь только цифры.Я все еще получаю эту ошибку.У него только один столбец из этих чисел.CSV выглядит следующим образом:

176162144

176862141

176762141

176761141

176562141

1 Ответ

0 голосов
/ 10 июля 2019

Вы смотрели этот образец ноутбука и пытались использовать его со своими данными?https://github.com/awslabs/amazon-sagemaker-examples/blob/master/introduction_to_amazon_algorithms/random_cut_forest/random_cut_forest.ipynb

В двух словах, он читает файл CSV с помощью Pandas и обучает модель следующим образом:

rcf = RandomCutForest(role=execution_role,
                      train_instance_count=1,
                      train_instance_type='ml.m4.xlarge',
                      data_location='s3://{}/{}/'.format(bucket, prefix),
                      output_path='s3://{}/{}/output'.format(bucket, prefix),
                      num_samples_per_tree=512,
                      num_trees=50)

# automatically upload the training data to S3 and run the training job
rcf.fit(rcf.record_set(taxi_data.value.as_matrix().reshape(-1,1)))

Вы не сказали, каков был ваш вариант использования, но как выПри работе с IP-адресами может оказаться полезным встроенный алгоритм IP Insights: https://docs.aws.amazon.com/sagemaker/latest/dg/ip-insights.html

...