У меня большой набор данных (десятки миллиардов) точек данных (удваивается), которые мне нужно отобразить на графике. Поскольку одновременное отображение всех данных бесполезно, я искал алгоритм, который поможет мне выбрать лучшие N точек из всего набора.
В настоящее время я делаю Систематическая выборка , чтобы уменьшить набор данных. Любые предложения о том, как улучшить это? Спасибо.
Обновление: данные представляют собой 16-битные числа со знаком, обозначающие амплитуду сигнала. Таким образом, они могут варьироваться в диапазоне от -32 768 до 32 767. Я хочу захватить пики и долину, чтобы N точек, выбранных для отображения из всего набора, давали аппроксимацию всего набора.