При заданной последовательности чисел N
1 , N
2 , N
3 ...
из какого-то источника, не ГСЧ, но говорят датчик или регистрация данных какого-либо рода, можно ли предположить, что обрабатывать это так
N
n
/ B = Q
n Rem M
n
приведет к тому, что последовательность Q
будет иметь меньшую энтропию, чем последовательность M
?
Примечание: предположим, что B
таков, что и Q
, и M
имеют одинаковый размерный диапазон.
Это связано с наблюдением того, что большинство наборов данных реального мира, независимо от их источника, имеют логарифмическое распределение ; числа, начинающиеся с 1, встречаются гораздо чаще, чем числа, начинающиеся с 9. Но это мало говорит о деталях младшего разряда.
для забавного способа проверить это (и разозлить вашего системного администратора, загромождая его компьютер), запустите это в bash:
ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c
и получите гистограмму первой цифры размеров файлов.