Коллекция Рефератов - Технологии мультимедия - скачать рефераты, бесплатно рефераты

Рефераты. Технологии мультимедия

p> Все звуковые платы SB вплоть до AWE64 включительно были реализованы в конструктиве под шину ISA. Однако тенденция отказа от наследия IBM PC требовала перехода на шину PCI, значительно более быструю, а также позволявшую разделять ресурсы компьютера, что существенно упрощало его конфигурирование. Более того, переход на PCI легко решал вопрос организации хранения банков инструментов не в ПЗУ или ОЗУ на самой звуковой карте, а в системном ОЗУ компьютера. Немаловажно и то, что PCI-карты были заметно дешевле. Первую реально работоспособную PCI-аудиокарту создала фирма
Ensoniq, которую шустрая Creative тут же и купила. Произошло это в декабре
1997 года. После доработки и модернизации программного обеспечения карта стала называться довольно своеобразно - Creative Labs Ensoniq AudioPCI
(апрель 1998 года).

3D-звук

Его элементы появлялись на звуковых картах уже давно, но, как правило, в реализации, аналогичной применяемой в бытовой аудиотехнике низшей ценовой категории. Это, например, расширение стереобазы (кое-кто вообще скажет, что к 3D это не имеет никакого отношения) и самые простейшие варианты Surround
("звук вокруг"). Кто бы мог подумать, что компьютерные игры простимулируют наряду с 3D-видео интерес к "настоящему" 3D-звуку, вокруг которого и развернулась борьба за передел рынка.

Борьба за первенство в 3D-звуке развернулась между двумя крепостями, первая из которых звалась A3D, а вторая - EAX. Но сначала несколько слов о самом 3D-звуке. Дело в том, что под этим термином, как правило, понимаются три различные технологии.

. Stereo Expansion (расширение стереобазы) - технология, которая увеличивает ширину звукового поля, используя избыточную информацию, содержащуюся в стереосигнале. Вариантов исполнения существует множество, из них самые известные – Sound Retrieval System (SRS) от фирмы SRS Labs и Spatializer 3-D от фирмы Spatializer Labs.

. Surround ("звук вокруг") – технология, которая использует специально закодированные данные в формате surround с целью воспроизведения нескольких звуковых каналов в их пространственной перспективе на небольшом числе реальных источников звука, к примеру, пяти звуковых каналов на двух колонках. Одна из последних реализаций технологии в компьютерной технике – Creative Multi-Speaker Surround (CMSS).

. Positional 3D Audio (позиционируемый 3D-звук) – технология, которая основывается на определении местоположения в трехмерном пространстве каждого из множества звуковых потоков.

Первые две технологии применяются в основном при воспроизведении музыки как на персональных компьютерах, так и на специализированной бытовой и профессиональной аудиоаппаратуре, в домашних кинотеатрах и т. п. Следует отметить, что продвинутые варианты технологии Surround широко распространены также в киноиндустрии. Третья технология прочно обосновалась в новейших компьютерных играх. В чистом виде эти технологии встречаются все реже, и в настоящее время появляется все больше реализаций 3D-звука, где они комбинируются самым причудливым образом.

Но это еще не все. Для обеспечения реализма звучания, помимо точного позиционирования источников звука необходима имитация взаимодействия звука с окружающим пространством, то есть, прежде всего, имитация звуков, отраженных от стен, пола и потолка (реверберация), прошедших через препятствие (окклюзия) и поглощенных препятствием (обструкция). Необходимо также произвести дистанционное моделирование, то есть учесть удаленность источника звука от слушателя.

Фирма Aureal выпускает прикладной интерфейс программирования (API) под названием A3D. При подготовке этой технологии Aureal опиралась на разработки лаборатории исследований компьютерного звука (Computer Audio
Research Laboratory) университета Сан-Диего, выполненные под руководством
Дика Мура (Dick Moore) в начале 80-х годов. Помимо этого, фирма Aureal приобрела компанию Crystal River, в которой трудился Скотт Фостер (Scott
Foster), в свое время по заказу NASA разработавший Convolvotron – одну из первых реализаций технологии виртуальной реальности. Второй крепостью стала технология от фирмы Creative под названием EAX (Environmental Audio
Extensions), расширяющая возможности прикладного интерфейса программирования (API) Microsoft Direct Sound 3D. Creative использовала результаты работ, проведенных Джоном Чоунингом (John Chowning) в
Стэнфордском университете в конце 70-х годов, а также четвертьвековой опыт компании E-mu Systems, которая занималась созданием звукового оборудования для Голливуда и в марте 1993 года была приобретена фирмой Creative.

В связи с тем, что EAX не является полноценным звуковым API, так как в ней отсутствуют средства позиционирования 3D-звука (используются возможности Microsoft Direct Sound 3D, или DS3D), мы этот вопрос опустим, а более подробно поговорим о методах имитации взаимодействия звука с окружающей средой. Единственное, отметим, что при позиционировании 3D-звука в настоящее время все чаще используются бинауральные процессы обработки звука, и, как правило, это функции HRTF (Head Related Transfer Function), посредством которых наши органы слуха совместно с соответствующими центрами головного мозга определяют местоположение источника звука. Качество реализации 3D-позиционирования в A3D и DS3D схожи, хотя существует мнение, что позиционирование звука в вертикальной плоскости реализовано в A3D лучше.

Так в чем же разнятся подходы Aureal и Creative к имитации взаимодействия звука с окружающей средой? Различия корнями уходят в университетскую науку США. Упомянутый выше Дик Мур разрабатывал методы, с помощью которых можно точно вычислить все необходимые параметры звука в зависимости от физических свойств среды. Джон Чоунинг пошел другим путем, и основой его метода моделирования акустической среды стал учет особенностей восприятия звука человеком. Фирма Aureal выбрала первый путь, а Creative – второй.

Реализацией подхода фирмы Aureal является технология WaveTracing, суть которой заключается в проведении анализа упрощенной геометрии окружающего пространства и расчете в режиме реального времени путей распространения звуковых волн, их отражения и поглощения в пассивных объектах акустической среды. У этой технологии есть и недостатки. Прежде всего, она по понятным причинам требует больших вычислительных ресурсов. Существуют также проблемы и с качеством, достижимым в реальных условиях. Дело в том, что алгоритмы, применяемые в WaveTracing, используют только ранние отраженные звуки, напрочь отбрасывая их рассеянные остатки (diffuse tail), играющие огромную роль в акустическом представлении пространства. И это зачастую приводит к явно слышимым артефактам.

Технология EAX от Creative использует для моделирования акустических свойств среды некую обобщенную модель (прежде всего, реверберации), при этом заранее создаются так называемые пресеты, содержащие в себе набор параметров звука для каждого типа среды. Creative руководствовалась, по- видимому, следующими соображениями. Широко известно, что в кинематографии
(кстати, вспомните об опыте создания звуковых студий для Голливуда, который имеет E-mu) звук практически никогда не записывается сразу при съемках, а добавляется позже в студийных условиях. И дело не только в том, что на натуре трудно получить высокое качество. В искусстве всегда присутствует некоторая доля условности, более того, она даже необходима для увеличения степени воздействия на зрителя. Например, по замыслу режиссера необходимо, чтобы в какой-то момент на плотном звуковом фоне (шум автомобилей и т. п.) стало отчетливо слышаться тиканье часов. В жизни такого не бывает. А по сюжету фильма – надо. Естественно, звуковой фон и часы записываются отдельно, а потом сводятся воедино нужным способом. Все вышесказанное относится и к компьютерным играм, которые в своих лучших проявлениях, типа
"Half-Lifе", уже относятся скорее к категории интерактивных игровых компьютерных фильмов. Раз так, то зачем заниматься расчетами путей прохождения звука в виртуальной акустической среде, когда можно, как в кинематографии, использовать заранее подготовленную высококачественную модель. Результат, утверждает Creative, не хуже, чем обеспечивает
WaveTracing, а во многих случаях и лучше. Не все с этим согласны, и такой подход обычно критикуется за отсутствие интерактивности.

Справедливости ради, необходимо упомянуть компанию QSound, которая не смогла возвести свою крепость, но хорошо подготовленные позиции оборудовала. Компания предлагает целое семейство API (как полноценных, так и для очень специфических применений) под названиями Q3D, QMSS, QSoft3D,
Qmixer и др., алгоритмы работы которых основываются не столько на формальных (прежде всего, математических) методах, сколько на результатах, полученных при прослушивании тестовых последовательностей звуков большим числом людей (называется цифра, превышающая 500 тысяч). Однако влияние
QSound на компьютерном рынке не очень велико. Чтобы больше к фирме QSound не возвращаться, упомяну, что ее технология реализована в аудиопроцессоре
VLSI Thunderbird 128 – мощном DSP, применяемом фирмой Aztech Labs в звуковой плате Aztech Labs PCI 386DSP.

Борьба конкурирующих API проявилась в ожесточенной конкуренции звуковых карт, их поддерживающих. Каждый производитель стремился занять место, которое занимала в свое время легендарная Sound Blaster.

Creative или Aureal?

Как сказано выше, производители аудиокарт вступили в борьбу за доминирующее место в индустрии, когда-то принадлежащее Sound Blaster, а ныне свободное. API A3D от Aureal, поддерживаемый многочисленными аудиокартами от разных производителей на основе фирменного чипа Vortex
AU8820 (например, Diamond Sonic Impact S90), какое-то время пребывал почти в гордом одиночестве на рынке, и, порой, казалось, что именно A3D станет стандартом 3D-звука в отрасли. Между тем, приверженцы Creative ожидали возвращения Господаря. И он не заставил себя ждать.

К моменту выхода микросхемы EMU10K1 компания Aureal уже заканчивала подготовку следующего поколения своих чипов - AU8830 (Vortex 2), поэтому на рынке оба чипсета и карты на них появились почти одновременно. EMU10K1 и
AU8830 - принципиально разные микросхемы. EMU10K1 – то легко модернизируемый программно DSP (Digital Signal Processor –цифровой сигнальный процессор), содержащий 2 млн. транзисторов, с пиковой производительностью, сравнимой с производительностью Pentium 90, полностью выделенного под обработку звука, то есть около 1000 MIPS (для справки: SB
AWE64 имел производительность 36 MIPS). AU8830 (Vortex 2) – то специализированная звуковая микросхема (ASIC) с аппаратно реализованными функциями, код которых невозможно изменить. Она содержит 3 млн. транзисторов и имеет производительность 600 MIPS в собственной системе команд, а если привести ее к производительности DSP – где-то на уровне 800-
1200 MIPS. Такой разброс значений получается потому, что до сих пор нет единого мнения о том, как же подсчитывать производительность. Звуковые карты на основе EMU10K1 с августа 1998 года выпускают Creative (семейство
Sound Blaster Live!) и ее подразделение E-mu (семейство APS - Audio
Production Studio), а самым распространенным представителем клана AU8830
(Vortex 2) является Diamond Monster Sound II MX300, поступившая на рынок в декабре 1998 года.

Страницы: 1, 2, 3, 4, 5