У меня есть программа, которую я портирую с одного языка на другой. Я делаю это с помощью программы перевода, которую разрабатываю сам. Соответствующим результатом этого является то, что я ожидаю, что в моей системе есть ряд ошибок, которые мне нужно будет найти и исправить. Каждая ошибка может проявляться во многих местах, и ее исправление исправит ошибку во всех местах, где она обнаружена. (Я чувствую, что у меня действительно большой рычаг, и я нажимаю на короткий конец, я нажимаю очень сильно, но когда что-то движется, они много двигаются.)
У меня есть возможность запуска различий в журнале выполнения, поэтому я измеряю свой прогресс по тому, как далеко через набор тестов я могу выполнить его до того, как он отклонится от выполнения исходной программы. (Спасибо за то, что вы хотите за BeyondCompare, он работает достаточно хорошо с ~ 1M строчными файлами: D)
Вопрос в следующем: Какую фигуру мне следует ожидать, если я построю эту длину графика как функцию времени? (больше времени == больше ошибок устранено)
Моя первая мысль - это что-то вроде распределения Пуассона . Однако, поскольку исправление каждой ошибки также приводит к удалению всех остальных случаев, это не должно быть правильным.
(Кстати, это может иметь реальные последствия в отношении оценки того, когда программы завершат отладку.)
Edit:
Более абстрактное изложение проблемы:
Дан упорядоченный список из N целых чисел, выбранных из диапазона [0, M] (где N >> M) с равномерным распределением по позициям в списке, но не обязательно с равномерным распределением чисел. Каково ожидаемое местоположение этого последнего «нового» номера? Как насчет второго до последнего? Etc