Вы смотрели этот образец ноутбука и пытались использовать его со своими данными?https://github.com/awslabs/amazon-sagemaker-examples/blob/master/introduction_to_amazon_algorithms/random_cut_forest/random_cut_forest.ipynb
В двух словах, он читает файл CSV с помощью Pandas и обучает модель следующим образом:
rcf = RandomCutForest(role=execution_role,
train_instance_count=1,
train_instance_type='ml.m4.xlarge',
data_location='s3://{}/{}/'.format(bucket, prefix),
output_path='s3://{}/{}/output'.format(bucket, prefix),
num_samples_per_tree=512,
num_trees=50)
# automatically upload the training data to S3 and run the training job
rcf.fit(rcf.record_set(taxi_data.value.as_matrix().reshape(-1,1)))
Вы не сказали, каков был ваш вариант использования, но как выПри работе с IP-адресами может оказаться полезным встроенный алгоритм IP Insights: https://docs.aws.amazon.com/sagemaker/latest/dg/ip-insights.html