По моему опыту, основная проблема заключается в неправильном использовании статистических методов. Одна распространенная ошибка - не определять заранее данные, которые должны быть проверены. Один Профессор, которого я слышал, сравнивал это с скачками, на которых вы делаете финальный снимок не в заранее определенном месте, а когда ваша лошадь впереди. Это довольно часто встречается в медицинских исследованиях.
Другой пример, который я знаю, - это когда кто-то проводил статистический тест, который предполагал, что данные распределены нормально, а это не так.
Никогда не думайте, что статическая зависимость является причинной (например, во Франкфурте существует зависимость между ВИЧ и шумом самолетов - это не означает, что шум полета вызывает ВИЧ).
В принципе, это не сложность модели. Вы должны использовать правильные методы с правильными данными. Это достаточно сложно. Вы должны определить свои данные перед тестированием. Если вы хотите проверить это, просто сделайте тест на справедливость бросков кубика или бросков монет. Сделайте это со всеми данными после каждого броска / сальто. Вы увидите, что время от времени это будет показывать, что ваша смерть не справедлива. Конечно, если вы проведете большое количество независимых тестов на честность кубика, у вас будут тесты, которые покажут, что он несправедлив - но это ожидаемая ошибка в статистических тестах.
Еще одна очень простая вещь в статистических исследованиях: будьте уверены, что говорит ваша гипотеза. Иногда тест не может показать то, что вы хотите иметь - он только не может отклонить его.
Короче говоря - не занимайтесь интеллектуальным анализом данных / статистическим анализом без какой-либо мысли и образования. Работа статистики нелогична для людей, и вы можете легко обмануть (себя и других).