Много хороших предложений уже. Я добавлю (оба из горького опыта --- до публикации , к счастью!),
1) Проверьте ваши результаты на стабильность:
- попробуйте несколько разных подмножеств данных
- переберите ввод
- восстановить вывод
- настроить интервал сетки
- попробуйте несколько случайных семян (если применимо)
Если это не стабильно, вы еще не сделали.
Опубликуйте результаты вышеуказанного тестирования (или, по крайней мере, сохраните доказательства и упомяните, что вы это сделали).
2) Выборочная проверка промежуточных результатов
Да, вы, вероятно, собираетесь разработать метод на небольшом образце, а затем перебрать весь беспорядок. Пик в середине несколько раз, пока идет шлифовка. Еще лучше, где это возможно, собирать статистику по промежуточным этапам и искать признаки аномалий в них.
Опять любые сюрпризы, и вам нужно вернуться и сделать это снова.
И, опять же, сохраните и / или опубликуйте это.
Уже упоминалось, что мне нравится включать
- Контроль источника --- вам все равно это нужно для себя.
- Регистрация среды сборки. Публикация же хороша.
- План по обеспечению доступности кода и данных.
Еще один, о котором никто не упомянул:
3) Документируйте код
Да, вы заняты написанием этого и, вероятно, заняты его разработкой по ходу дела. Но я не имею в виду подробный документ, а хорошее объяснение всех сюрпризов. Вам все равно придется их написать, так что думайте об этом как о начале работы над документом. И вы можете хранить документацию в системе контроля версий, чтобы вы могли свободно выбрасывать куски, которые больше не применяются - они будут там, если они вам понадобятся.
Не мешало бы собрать немного README с инструкциями по сборке и рекламой "Как запустить". Если вы собираетесь сделать код доступным, люди будут спрашивать об этом материале ... Плюс, для меня, проверка с ним помогает мне идти в ногу.