Мне приходит в голову мысль, что вы можете выполнить вейвлет-преобразование на фрагменте, а затем посмотреть на среднюю энергию, связанную с высокочастотными вейвлетами.
Если вы не знакомы с вейвлетами, проще всего описать это вейвлет Хаара . Предполагая, что количество выбранных вами точек составляет 2 n , вы можете рассчитать это следующим образом:
- Разделите ваши данные на пары точек.
- Возьмите половину разницы. Это коэффициент детализации вейвлета.
- Возьмите среднее значение каждой пары. Это дает вам 2 n-1 очков. Рекурсивно делать вейвлет-преобразование на тех.
Для каждого уровня вейвлета Хаара возьмите среднее значение квадрата коэффициента. Если ваши данные действительно похожи на то, что вы описали, эта статистика для первых нескольких уровней будет сильно отличаться. Поэкспериментируйте, решите, где находится ваш порог, и у вас, вероятно, будет довольно надежный тест. (Я бы рекомендовал иметь 3 возможных ответа из вашего теста: «Текст», «Не текст», «неясно». Посмотрите на «неясные» примеры, а затем улучшите свой тест.)