D звук
О самом понятии 3D звук мы уже не раз говорили. Тем не менее, эта тема вызывает не меньше споров в конференциях, чем тема 3D графики. Поэтому, на мой взгляд, никогда не будет лишним поговорить о сути технологии еще раз.
Большинство людей имеют два уха. Это не является секретом. Оба уха обычно тесно взаимодействуют с нашим мозгом. У некоторых людей это взаимодействие происходит несколько лучше или гораздо лучше, чем у других. В этом случае про таких людей говорят, что у них хороший или музыкальный слух. Если говорить простыми словами, то слух - это результат взаимодействия нашего мозга с информацией, которую воспринимают наши уши. Такой тандем позволяет нам различать звуки и иногда определять положение в пространстве источников этих звуков, т.е. определять с некоторой точностью место, откуда исходят звуки. Мы не случайно говорим о том, что нельзя гарантировать правильное определение звуков и местоположение их источников в пространстве. Объяснение этому явлению каждый может найти для себя сам, проведя простой тест. Закройте глаза, закройте ладонью одно ухо, медленно начинайте поворачиваться по кругу и ждите, когда зазвонит ваш телефон. Если вы дождетесь телефонного звонка - никто не говорил, что тест будет легкий - то попробуйте определить, где находится телефон. Вряд ли вы с первого раза правильно определите его местоположение. Теперь вы понимаете, почему при разговоре о 3D звуке много внимания уделяется особенностям восприятия каждого конкретного человека.
На основе подобных тестов разработчики звуковых технологий пришли к выводу, что слушателя можно вводить в заблуждение при определении точного местоположения источника звука при прослушивании через две или более колонок, а еще лучше через наушники. В результате этого мы создаем себе устойчивое представление об акустике окружающего нас мира, а с помощью мощных вычислительных процессоров источники отдельных звуков и музыка могут частично свободным образом располагаться в пространстве вокруг слушателя в режиме реального времени.
Два основных инструмента, которые применяют разработчики для создания 3D звука - это сдвиг по фазе и изменение частоты звукового сигнала в режиме реального времени. При этом используются мощные алгоритмы кодирования и преобразования звука, которые позволяют управлять звуком и слышать нам этот звук так, как это задумал режиссер. Слыша звук, мы определяем расположение источников звука в пространстве в зависимости от того, в какой акустической среде мы находимся и на каком расстоянии от источников звука. При этом прохождение звуковых волн сквозь препятствия, их поглощение объектами или отражение звуковых волн играют очень важную роль, и этим эффектам уделяется особое внимание. Например, очень важно знать, насколько сильно изменяется частота звука, если этот звук отразился от объекта, прежде чем достиг наших ушей. Все эти нюансы должны приниматься во внимание при моделировании 3D звука.
Заметим, что под термином "3D звук" мы имеем в виду только такую акустическую модель, когда источники звука позиционируются в виртуальном пространстве, и имеется интерактивное взаимодействие слушателя и источников звука. Например, при перемещении слушателя в виртуальном пространстве или при каких-либо действиях слушателя акустическая модель должна адекватно реагировать на эти события. Все остальные техники создания объемного звучания типа Q-Surround или многоканального звука типа Dolby Digital лишь расширяют стерео-базу и позиционируют источники звука в пространстве относительно слушателя, но не позволяют оценить слушателю расстояние до источников звука, как в горизонтальной, так и в вертикальной плоскости. Итак, настоящая система воспроизведения 3D звука осуществляет две вещи: первое - позиционирование источников звука в виртуальном пространстве и второе - взаимодействие слушателя с источниками звука.
Как было отмечено ранее, правильное восприятие 3D звука позволяет сделать виртуальный мир частично реальным. Наше зрение является еще одной очень важной частью, позволяющей нам воспринимать окружающую среду.
Зрительное восприятие позволяет нам правильно идентифицировать звук, даже если частота звука очень низкая, например фраза "Эй, танки слева!" помогает нам понять, что тот тихий, едва различимый рокот где-то на пределе слышимости означает приближение колонны бронетехники. Если мы не видим объект, издающий звук или не знаем, что именно издает звук, нам бывает очень сложно идентифицировать источник звука. Например, если мы слышим какие звуки из-за стены, но не знаем, что ребенок тренируется в сольфеджио, мы можем решить, что кто-то издевается над кошкой.
Пока нет совершенных во всех отношениях систем создания и воспроизведения 3D звука, также как нет идеальных систем создания и визуализации 3D графики. Тем не менее, уже сейчас у нас есть возможность слышать 3D звук, по крайней мере, на базовом уровне. Необходимые для создания 3D звука алгоритмы давно известны и отработаны, созданы звуковые движки и выбраны интерфейсы, приняты стандарты, осталось создать оптимальную по цене и производительности аппаратную часть (или воспользоваться возможностями CPU), отточить до совершенства алгоритмы и звуковые движки и обеспечить тонкую настройку всей системы под конкретного слушателя.
Компания Sensaura более 10 лет занимается созданием звуковых технологий. Ранее Sensaura носила имя CRL (Central Research Lab) и была подразделением концерна EMI. В легендарной студии Abbey Road оттачивались технологии создания 3D звука. Все разработки Sensaura ориентированы на работу через стандартный интерфейс DirectSound3D и его расширения. Часть технологий Sensaura уже применяется на практике, другие разработки мы скоро увидим в действии.
Технология Sensaura для воспроизведения 3D звука носит общее название 3D Positional Audio (3DPA) и включает в себя целый ряд решений, представляющих собой набор специализированных алгоритмов и звуковых движков:
- MacroFX - позволяет воспроизводить звук от источников, расположенных на расстоянии до 1 м от слушателя (в т.н. ближнем поле, near field)
- MultiDrive - технология воспроизведения 3D звука через четыре и более акустических колонок
- EnvironmentFX - движок реверберации, через него реализована поддержка EAX 1.0/2.0 и I3DL2
- ZoomFX - позволяет использовать такой параметр источника звука, как размер
- Digital Ear - позволяет формировать библиотеки HRTF под конкретного слушателя
Более подробно о технологиях Sensaura вы можете узнать в специальном материале.
Производители звуковых чипов лицензируют разработки Sensaura и воплощают их в жизнь. При этом технологии Sensaura могут работать и за счет CPU, т.е. при использовании так называемых HSP (host-based signal processing) алгоритмов. Первый DSP чип, в котором на аппаратном уровне реализована поддержка технологий Sensaura сделала компания ESS Tech. Этот чип называется Canyon3D, а первую карту на базе этого DSP сделала компания Terratec. Об этой карте, которая получила футуристическое имя DMX мы и поговорим сегодня.