Алгоритм уменьшения большого набора данных в меньший набор? - PullRequest
4 голосов
/ 02 марта 2011

У меня большой набор данных (десятки миллиардов) точек данных (удваивается), которые мне нужно отобразить на графике. Поскольку одновременное отображение всех данных бесполезно, я искал алгоритм, который поможет мне выбрать лучшие N точек из всего набора.

В настоящее время я делаю Систематическая выборка , чтобы уменьшить набор данных. Любые предложения о том, как улучшить это? Спасибо.

Обновление: данные представляют собой 16-битные числа со знаком, обозначающие амплитуду сигнала. Таким образом, они могут варьироваться в диапазоне от -32 768 до 32 767. Я хочу захватить пики и долину, чтобы N точек, выбранных для отображения из всего набора, давали аппроксимацию всего набора.

...