Kaggle: задача отслеживания частиц TrackML - PullRequest
0 голосов
/ 29 апреля 2019

Я новичок в ML и Kaggle.Я проходил решение Kaggle Challenge.
Задача: https://www.kaggle.com/c/trackml-particle-identification
Решение: https://www.kaggle.com/outrunner/trackml-2-solution-example

При просмотре кода я заметил, что автор использовал только файл train_1 (не train_2), 3,…).

Я знаю, что есть какая-то стратегия, связанная с использованием только файла train_1.Может кто-нибудь объяснить, пожалуйста, почему это так?Кроме того, для чего используются файлы blacklist_training.zip, train_sample.zip и detectors.zip?

1 Ответ

2 голосов
/ 30 апреля 2019

Я один из организаторов соревнований. train_1 2 3 .. все файлы эквивалентны. Outrunner, вероятно, видел, что не было никакого улучшения, используя больше данных.

train_sample.zip - это небольшой набор данных, эквивалентный train_1 2 3 ... для удобства.

blacklist_training.zip - это список частиц, которые следует игнорировать из-за небольшой ошибки в симуляторе (не очень важно).

detectors.zip - список геометрических поверхностей, на которых проводятся измерения x y z.

David

...