Это задача курсового проекта. У нас есть данные обучения и данные тестирования. Для тренировочных данных в основном указывается начальная и конечная отметки времени для одной поездки, место получения и отправки, мили за поездку и общая сумма заработка за одну поездку. Как показано ниже:
Затем задается вопрос: «В 8 часов утра один таксист получил три заказа одновременно, что одинаково далеко от этого таксиста. один с самым большим доходом. "Данные тестирования показывают ниже:
У меня есть только несколько идей о том, как работать над этим вопросом. Мы можем сначала очистить бесполезные данные. Затем мы можем вычислить новую переменную под названием «тариф за минуту». Мы нормализуем данные и группируем места выгрузки и получения. Затем для каждого taxi_id мы могли бы сгенерировать транзакцию и провести некоторое обучение под наблюдением. То есть создание модели, которая кормит транзакцию и выводит общий тариф. Однако я не уверен, что эта модель может работать для тестового набора, поскольку тестовый набор предоставляет только начальное местоположение. Также нам нужно сгенерировать реальный тариф и чаевые. Я не уверен, какой алгоритм мог бы действительно работать в этом вопросе. Поэтому я действительно надеюсь, что кто-то, кто хорошо умеет работать с данными, может дать мне несколько советов!
Набор данных здесь: https://drive.google.com/open?id=1mAAwDeSvaV913bQ1dnSvIfqINSbX5u05
Большое спасибо всем!