Постоянная нота музыкального инструмента - это периодический сигнал, и наш друг Фурье (второе «F» в «FFT») говорит нам, что любой периодический сигнал может быть построен путем добавления набора синусоидальных волн (обычно с различными амплитуды, частоты и фазы). фундаментальный является самой низкой частотной составляющей и соответствует высоте тона; остальные компоненты обертоны и кратны основной частоте. Относительная смесь основных и обертонов определяет тембр , или характер инструмента. Кларнет и труба, играющие в унисон, звучат «в гармонии», потому что они имеют одну и ту же основную частоту, однако их можно идентифицировать индивидуально из-за их различного тембра (смесь обертонов).
Для вашей проблемы вы можете сэмплировать трубу по временному окну, рассчитать БПФ (которое разбивает последовательность семплов на составляющие его цифровые частоты), а затем утверждать, что высотой звука является частота бина с наибольшей величиной. , Если вы хотите, это может быть тривиально квантовано до ближайшего музыкального полшага, например, E flat. (Поищите БПФ в Википедии, если вы не понимаете взаимосвязи между частотой дискретизации и результирующими частотными бинами, или если вы не понимаете вреда слишком низкой частоты дискретизации.) Это, вероятно, удовлетворит ваши потребности, потому что основной компонент обычно имеет большую энергию, чем любой другой компонент. Чем длиннее окно, тем выше точность основного тона, потому что центры бинов станут более близко расположенными по частоте. Однако, если окно настолько длинное, что труба заметно меняет свою высоту во время действия окна, то эффективность метода значительно снизится.