Я не знаю, какова временная база для передачи данных, но я знаю, что TMS32064x, который указан в спецификации для SDK, имеет очень мощный механизм DMA. (Я предполагаю, что это оригинальный ZOOM OMAP34X MDK. Там написано, что у него 64хх.) Я надеюсь, что у OMAP есть что-то символическое, используйте их в полной мере. Я бы порекомендовал установить буферы "пинг-понга" во внутреннем оперативном памяти 64хх и использовать SDRAM в качестве разделяемой памяти с дескриптором передачи DMA. Внешнее ОЗУ станет узким местом в любой части серии 6xxx, поэтому держите все, что можете, во внутренней памяти для повышения производительности. Как правило, эти части будут иметь возможность передавать 8 32-битных слов в ядро процессора, когда оно находится во внутренней памяти, но это зависит от части к части в зависимости от того, какой уровень кэша позволяет отображать в качестве памяти прямого доступа. Чувствительные к затратам детали от TI перемещают «отображаемую память» дальше, чем некоторые другие чипы. Также все руководства по запчастям доступны от TI для бесплатной загрузки в формате PDF. Они даже бесплатно дали мне бумажные копии руководства по ЦПУ и набору инструкций TMS320C6000 и многих других книг.
Что касается программирования, вам может понадобиться использовать некоторые "встроенные функции процессора" или встроенную сборку, чтобы оптимизировать любую математику, которую вы делаете. Для 64xx предпочтение отдается целочисленной операции, когда это возможно, потому что она не имеет встроенного ядра с плавающей запятой. (Это серии 67xx.) Если вы посмотрите на блоки исполнения, и вы сможете отобразить свои расчеты так, чтобы разные детали выполняли разные операции таким образом, который может происходить в одном цикле, тогда вы сможете добиться максимальной производительности из из этих частей. В руководстве по набору команд указан список типов операций, выполняемых каждым исполнительным блоком. Если вы можете разбить свой расчет на наборы двойных потоков данных и немного раскрутить циклы, компилятор будет «приятнее» для вас, когда включена полная оптимизация. Это связано с тем, что процессор разбит на левую и правую стороны с почти одинаковыми исполнительными блоками по обе стороны.
Надеюсь, это поможет.