Многообразие стандартов
После прочтения раздела «Протоколы, кодеки, алгоритмы» вы поймете, что в мире VoIP до сих пор нет единых стандартов. Связисты в лице ITU (International Telecommunication Union – Международный Телекоммуникационный Союз) продвигают стандарт Н.323. Компьютерщики придумали открытый стандарт SIP и создают все новые сервисы на его основе. Бизнесмены идут своим путем, создавая нестандартные сервисы и пытаясь заработать на них. Например, создатели нестандартной программы Skype (а это шведские бизнесмены и эстонские программисты) заработали около двух миллиардов долларов. Их программа приобрела популярность, и бизнес удалось продать за огромные деньги. Эстонские программисты, впрочем, не получили своих миллионов, потому что трудились исключительно за зарплату.
Закрытые интернет-пейджеры с поддержкой VoIP выпускают крупнейшие интернет-корпорации – Yahoo! Google, MSN и AOL. Программу Skype также можно занести в этот список, потому что теперь она принадлежит богатейшей интернет-корпорации eBay. Каждое из этих приложений закрыто от других, но корпорации вкладывают миллионы долларов в развитие и продвижение именно своей программы. Это настоящая битва стандартов на фоне конкуренции между финансовыми гигантами.
К сожалению, приверженцы открытых стандартов не обладают такими огромными финансовыми ресурсами, поэтому VoIP-программы, работающие на открытых стандартах и совместимые друг с другом, такие как Gizmo или SIPphone, пока не получили широкого распространения. Однако многие эксперты считают, что будущее именно за ними.
Протоколы, кодеки, алгоритмы
Разберемся, каким образом работает интернет-телефония. Общая схема такова.
1. Голос переводится в цифровую форму (оцифровка) и сжимается (компрессия).
2. Цифровой поток разбивается на пакеты, которые отправляются по компьютерной сети в пункт назначения.
3. Система адресата получает пакеты с голосовым потоком, осуществляет их «сборку», после чего переводит информацию обратно из цифровой формы в аналоговую.
Расскажем подробнее о каждом из этих этапов.
Оцифровка и сжатие
Оцифровка аналогового сигнала означает, что колебания воздуха превращаются в ряд нулей и единиц. На первом этапе колебания воздуха ваш голос фиксируется мембраной микрофона. На втором этапе задействован обычно блок аналого-цифрового преобразования (АЦП) звуковой карты компьютера.
Процесс оцифровки имеет следующие стадии.
1. Выборка.
2. Квантование сигнала.
3. Кодирование.
Самый известный стандарт кодирования звука называется PCM (Pulse Code Modulation – импульсно-кодовая модуляция), известный также как стандарт G.711. Он предполагает выборку 8000 образцов речи в секунду. Каждый из образцов имеет размер 8 бит, так что результатом работы PCM является цифровой поток 64 000 бит/с (рис. 1.1).
Рис. 1.1. Запись голосового сигнала на компьютере после оцифровки
Одновременно с оцифровкой звука кодек PCM обеспечивает и эффективное сжатие цифрового сигнала. Основной принцип сжатия звука основан на том, что человеческое ухо не воспринимает большую часть звукового спектра. Кроме того, голос человека занимает лишь узкую полосу в диапазоне всех слышимых звуков.
Диапазон слышимых частот составляет примерно 200-20 000 Гц. Частоты человеческого голоса лежат в пределах 200-10 000 Гц, а типичные частоты телефонного сигнала – в диапазоне 300-3000 Гц.
Только за счет эффективной выборки частот уже можно сжать сигнал в несколько раз. Применяются и другие, более сложные методы компрессии. Как уже было сказано, кодек PCM обеспечивает цифровой поток 64 000 бит/с. Существуют и другие стандарты оцифровки звукового сигнала. Вот некоторые из кодеков, которые входят в базовый набор Н.323 (рис. 1.2):