Как уже говорили другие, SIP не передает аудио или видео. Хотя теоретически вы можете отправлять данные через любой транспорт, включая ATM, аналоговые линии, DS0 и т. Д., В реальном мире RTP является наиболее распространенным. RTP (протокол реального времени) и RTCP (протокол управления в реальном времени) или SRTP (безопасный RTP) обычно передают аудио и видео.
Что касается кодеков, вы будете ограничены тем, что поддерживает ваш сервер. Вот несколько общих кодеков и некоторые плюсы и минусы каждого.
G.711 - Платное качество (т. Е. Хорошо, как хорошая аналоговая телефонная линия, или даже немного лучше). «Универсальный» в том, что практически каждое устройство поддерживает G.711. Занимает большую полосу пропускания, на самом деле не сжимает данные (G.711 - «компандер»). Базовая линия G.711 довольно проста (это действительно пара справочных таблиц). В добавлении I добавлено маскирование потери пакетов (PLC), а в добавлении II добавлено подавление паузы и генерация комфортного шума.
GSM - используется на мобильных телефонах, звучит нормально, хороший ПЛК, хорошее сжатие
G.729A - широко используется, почти платного качества, хорошее сжатие (8 Кбит / с)
G.723.1 - широко используется, почти так же хорошо, как G.729, лучшее сжатие (4-5Kbps)
G.722 - звучит лучше, чем G.711, широкополосный (вдвое больше полосы пропускания звука по G.711 или аналоговому вызову), такая же полоса пропускания, что и G.711
GIPS - существуют различные реализации, одна бесплатная. IIRC, использует около 13,5 Кбит / с на линии, звук не так хорош, как G.723.1 (но это метрика восприятия, YMMV) Занимает много процессора.
Все кодеки используют некоторый процессор и другие системные ресурсы. Как правило, чем более агрессивен кодек (чем меньше пропускная способность), тем больше используется процессор. Кроме того, все эти конкретные кодеки являются кодеками с потерями - они теряют часть данных. Это означает, что существует сжатие, а не то, что части аудио отбрасываются из-за плохой маршрутизации и низкого качества линии. Так же, как MP3 считается кодек потери, в то время как FLAC считается без потерь. Если вам интересно, следующая статья в Википедии объясняет более подробно: http://en.wikipedia.org/wiki/Lossy_compression