Я пытаюсь преобразовать некоторые файлы Excel с расписанием автобусов по маршрутам / остановкам.
В файлах Excel доступны только данные номер автобусного маршрута , упорядоченный список названия автобусных остановок для указанного c автобусного маршрута и раз , когда автобус должен прибыть на указанную c автобусную остановку.
Мне нужно сопоставьте их с указанием c информации о маршруте / остановке автобуса из информационной системы автобуса, чтобы я мог получить дополнительную информацию, НЕ предоставленную в файлах Excel, такую как X / Y расположение автобусных остановок и т. д. c.
Мне предоставлен доступ к следующим API-интерфейсам для получения такой информации из автобусной информационной системы:
- API-интерфейс для поиска идентификатор автобусного маршрута s по номер маршрута
- API для поиска идентификатор автобусной остановки s по имя остановки
- API для получения упорядоченного списка автобусных остановок по идентификатор маршрута
- API для получения дополнительной информации (например, местоположение автобуса остановка) по идентификатор маршрута и идентификатор остановки
Я написал автоматический скрипт для получения дополнительной информации со следующими шагами:
- используйте (1) для получения возможных кандидатов идентификатор автобусного маршрута с для каждого номера маршрута в файле Excel
- используйте (3) для получения списка идентификатор автобусной остановки с для каждого кандидата
- сравните результат с тем, что в файле Excel, переданном через (2)
- выберите наиболее вероятный идентификатор маршрута среди тех, кто с первого шага
- наконец, передаст выбранные идентификатор маршрута и идентификатор остановки через (4), чтобы получить нужную информацию
Однако я сталкиваюсь с некоторыми техническими трудностями:
- Некоторые автобусные маршруты имеют один и тот же номер маршрута, но разные направления / промежуточные остановки. Эти маршруты имеют в основном похожие остановки, что приводит к вероятности ошибки.
- Некоторые имена автобусных остановок в файле Excel не являются точными, как в информационной системе шин, что приводит к неудачным попыткам поиска. Примеры их включают сокращения, названия окрестностей и т. Д. c.
- Некоторые названия автобусных остановок похожи, что приводит к неправильным совпадениям автобусных остановок. Поскольку я использую их для определения маршрута автобуса из аналогичных, более вероятно, что они неверно идентифицируют маршрут автобуса.
Как я могу разработать алгоритм для моего скрипта, чтобы точно выбирать маршрут и идентификаторы остановки, чтобы он мог извлекать правильную информацию из API, сводя к минимуму необходимость для человека вручную выбирать маршрут или стоп ID?