NOTAT OM SPATIALISERINGSTEKNIKKER
VBAP (VECTOR-BASE AMPLITUDE PANNING)
I vanlig stereo-miksing gir man mer og mindre volum til hver av høytalerne, og dette gir en illusjon av at lyden kommer mer fra vesntre eller mer fra høyre. VBAP utvider dette prinsippet til en ring av høytalere. Når man ønsker at lyden skal komme fra en bestemt retning, finner VBAP ut hvilke to høytalere som er nærmest (på hver sin side av den ønskede retningen), og bruker deretter vanlig stereo-panning mellom disse.
Pro:
- Matrise-basert, og krever dermed lite prosessorkraft
- Tydelig definering av retning. Det er kanskje den teknikken som har mest presis definering av retning
- Teknikken er robust for litt irregulære høytaleroppsett
- Spread-parameter kan brukes for å gjøre lydkilder mer diffuse.
Con:
- Sweet-spot-basert (dvs. laget for at det skal fungere godt i midten av ringen)
- Man kan få en følelse av at lyden bare vandrer rundt langs den kanten som høytalerringen definerer, heller enn at lyden kommer fra et sted, i eller utenfor rommet.
- Hvis man setter opp f.eks. en sirkulær bevegelse, kan man få en følelse av at lyden hopper fra høytaler til høytaler. Dette kan justeres vha. spread-paameteren.
- Det ver ikke mulig å få til noen illusjon av lyd lokalisert innenfor høytalerringen, og hvis man f.eks. prøver å la lyd bevege sweg langs en linje gjennom sentrum av rommet, vil det i stedet låte som et plutselig sprang fra den ene siden til den andre.
DBAP – DISTANCE-BASED AMPLITUDE PANNING
Dette er en teknikk som utvider stereoprinsippet om konstant instensitet på en annen måte enn VBAP:
- Alle høytalere brukes hele tiden (forskjellig fra VBAP)
- Intensitet er konstant (som i stereo og VBAP)
- Relativt volum i hver høytaler er omvendt proposjonal med avstanden fra den virtuelle kilden til høytaleren. På denne måten er det mest lyd fra de høytalerne som er nærmest den virtuelle kilden.
Pro:
- Matrise-basert, og krever dermed lite prosessorkraft
*DBAP tillater at høytalere kan distribueres helt vilkårlig. De trenger ikke plasseres i en ring. DBAP er særlig velegnet når man har høytalere distribuert utover et felt (som flåten i “Konsert for Grønland”, eller i flere tilstøtende rom.
- Det er mulig å beskrive bevegelser på tvers gjennom rommet. Men du får nok likevel aldri lyden til å gå “tvers gjennom hodet”.
Con:
- Hvis høytalerne er satt opp i en ring, vil DBAP kunne være mindre overbevisende enn VBAP og Ambisonics. Det er en sjanse for at lyden høres tilstrekkelig fra flere høytalere i rommet til at presedence-effekt slår inn og man opplever at lyden kommer fra den/de nærmeste høytalerne.
- DBAP fungerer ikke til å beskrive at lyd kommer fra utenfor høytalerfeltet. Når lyden er langt unna, vil man ende opp med at alle høytalerne har omtrent samme volum (fordi det er små forskjeller i relativ avstand fra kilde til høytalerne). Convex hull addresserer dette problemet, men er bare implementert for 2D-rigg.
AMBISONICS OG AMBIPANNING
Matematikken bak ambisonics er mer kompleks, men enkelt fortalt bruker ambisonics alle høytaleren hele tiden på en slik måte at den skal gjenkalle lydfeltet (dvs. lydens bølgemønster) i sentrum av ringen. Dette gir en annen opplevelse av å være lokalisert i et lydfelt, og når vi prøvde ut teknikken, tror jeg at vi alle følte at det ga fine illusjoner av lyd som kommer fra en horisont utenfor rommet.
Ambisonics setter egentlig ganske strenge krav til at høytalerne må være helt jevnt distribuert rundt sirkelen (samme avstand fra sentrom, samme vinkelavstand mellom høytalerne), men som vi så, fungerte det ganske bra også i vårt oppsett også.
Ambisonics består av to prosesser: Lydkildene enkodes til “B-format”, og deretter dekodes “B-format” lydsignalet til høytalerne. En fordel med dette er at enkodingen er uavhengig av hvor mange høytalere man bruker og hvordan de er plassert.
Ambisonics kan enkodes i ulike ordener (1. orden, 2. orden, 3. orden,…). Dette kan sammenlignes med at billedfiler kan kompresses mye eller lite. Høyere orden = mer detaljert spatiell informasjon.
Modulen som vi bruker, benytter en spesiell variant av ambisonics som kalles “ambipanning”. I ambipanning gjøres dekoding “in-phase”, og enkoding og dekoding gjøres i et og samme objekt, som en matriseoperasjon. Matematisk gjør det at man dynamisk kan skifte hvilken ambisonics orden man ønsker å bruke, og det blir også mulig å jobbe med desimaltalls-orden. Innholdsmessig innebærer dette at en kilde kan gjøres relativt diffus eller “blurret” i rommet (1. orden), og så kan gjøres “skarpere” og mer tydelig lokalisert ved å øke ordenen. I slike tilfeller kan det være interessant å eksperimentere med hele feltet fra 1. orden og oppmot 30. til 40. orden.
Pro:
- Matrise-basert, og krever dermed lite prosessorkraft
- Ambisonics gir en tydeligere illusjon av at lyden kommer fra en horisont, og er derfor egnet for å gi illusjon av lyd fra uterom som er utenfor, og omslutter, scenerommet.
- Sirkulære bevegelser oppleves som svært jevne, og lyden “kleber” ikke til de enkelte høytalerne.
- Ved bruk av 3. orden og høyere, er sweet spot relativt stor, så dette gir en god illusjon i det meste av rommet.
- Det er mulig å rendre lydmateriale som B-format (1., 2. eller 3. orden) for avspilling, og dette kan noen ganger spare CPU sammenlignet med live avspilling.
Con:
- Sweet-spot-basert teknikk, men ved høyere orden er sweety spot relativt stor.
- Det er ikke mulig å skape noen illusjon av at lyden er lokalisert inne i rommet, all lyden kommer fra en horisont utenfor høytalerringen.
AMBISONICS OPPATK; OG DEKODING AV B-FORMAT FILER
Det finnes mikrofoner som kan ta B-format opptak, dvs. at de fanger opp surround lyd fra alle kanter. BEK og NOTAM har begge tilgang til denne mikrofonen:
http://soundfield.co.uk/products/sps200.php
TetraMic er et rimeligere alternativ:
http://www.core-sound.com/TetraMic/1.php
Et komemrsielt B-format lydbibliotek for lyddesign er tilgjengelig her:
http://www.surround-library.com/
Pro:
- Ambisonics opptak gir veldig fin romlig opplevelse av lyd som omslutter en.
Con:
- I ordinær dekoding er det lite man kan gjøre annet enn å spille av, rotere og tilte lydfeltet, samt justere volum. Det blir dermed fort en “take it or leave it”, uten de samme muligheter for å plassere lyd i rommet som andre teknikker byr på.
Sven Berge, som er basert i Oslo, har utviklet en VST plugin for ambisoncs dekoding som gir spesielt imponernede resultater, Harpex:
http://harpex.net/
Denne pluggen er relativt dyr, men kan gi fine resultater.
DBAP MED B-FORMAT LYDKILDER
Denne teknikken kombinerer ambisonics og DBAP: Lyden distribueres til høytalerne med gain-nivåer på samme måte som for DBAP, men vinkelen fra virtuell kilde til høytaler beregnes, og B-format-signalet dekodes i forhold til dette.
Resultatet er at man får et rikt lydfelt med mye romlig informasjon og variasjon. Samtidig er det muligheter for å flytte feltet, og f.eks. legge det mot et av hjørnene av rommet. På denne måten kan opptaket bedre fungere som et av flere lag i lydbildet, og blir ikke så allestedsnærværende og romlig dominerende som regulær ambisonics B-format dekoding vil være.
Pro:
- Mye rikere romlig lydfelt enn teknikkene overfor, og samtidig muligheter for å behandle det plastisk.
- DBAP med B-format lydkilde er matrisebasert, og dermed rinelig prosessormessig. Likevel er det noe dyrere (4x) enn metodene overfor, fordi nå skal en 4-kanals kilde dekodes snarere enn en mono-kilde.
Con:
- Forutsetter at man har B-format lydsignal (eller doble MS opptak) å arbeide med som kilder.
ViMiC – Virtual Microhpne Technique
Denne teknikken er basert på at man i tillegg til virtuelle kilder har et sett med virtuelle mikrofoner plassert i rommet. Disse mikrofonene fanger opp den lyden som relle mikrofoner lokalisert samme sted ville fanget opp. Dess lengre vekk en lydkilde er fra en virtuell mikrofon, dess svakere er signalet som mikrofonen fanger opp. I tillegg vil signalet til mikrofonen være forsinket (pga. at lydbølger har relativt lav hastighet). ViMiC bruker med andre ord en kombinasjon av volum-forskjeller og tidsforskjeller (delays).
I spatialisering plasserer jeg som regel de virtuelle mikrofonene på samme sted som høytalerne.
ViMiC har mange konfigureringsvalg sammenlignet med øvrige metider:
- Mikrofoner kan konfigureres med ulike patternes (figure 8, cardoid, omni). Jeg bruker som regel omni fordi andre patterns gjør at lydkilder kommer og går på litt pussige måter avhengig av hvordan lydkilden beveger seg.
- Man kan sette kilder til å ha direksjonell stråling, dvs. at de sender mer lyd i en retning enn en annen (slik f.eks. en trompet sender sterkest lyd ut i den retningen som trompet-åpningen peker).
- Man kan beskrive hvilken retning kilder og mikrofoner peker.
- Man kan beskrive et virtuelt rom (kube) som omkranser mikrofoner og kilder, og la mikrofonene fange opp tidlig-refleksjoner fra disse veggene. Rommets størrelse kan endres, og det er også mulig å beskrive ulike overflater, som vil absorbere lyd i større eller mindre grad.
- ViMiC har et filter for filtrering av lyd i luft (air absorbtion).
Pro:
- ViMiC gir ofte veldig fine virkninger av at en lydkilde er lokalisert i et bestemt område i eller utemfor rommet. Lyden får en “kropp” som ingen av de andre teknikkene kan gi. Dette kan f.eks. være virkningsfullt ved bruk av Folley-lyd, eller om man ønsker å plassere omngivelseslyd et bestemt sted på eller ved scenen, som en lydlig scenografi.
- ViMiC er ikke sweet-spot-basert, og gir ganske robust reproduksjon gjennom det meste av rommet.
- Det er ikke en forutsetning at høøytalerne er plassert i en ring e.l. Høytaleroppsett er fleksibelt på samme måte som for DBAP.
- ViMIC er godt dokumentert.
Con
- ViMiC er en tyngre prosess enn øvrige spatialiseringsteknikker. Særlig ved bruk av 1. og 2. ordens refleksjoner, øker CPU-bruk drastisk
- Når lyd spilles av i et rom som har litt/en del klang i seg selv, så kan denne klangen fort maskere early reflections fra viMiC. Jeg synes derfor ofte at de har begrenset bruksverdi, og bare gjør lydkilden mer sølete og uklar.
- Bruken av delay gjør at ViMiC har en form for innebygget doppler-effekt. Men denne effekten skjer på en “per høytaler” basis. I sum kan dette ofte gi nokså kunstige chorus-flanger-aktige farginger av lyden når den beveger seg i rommet, og dette blir mer markant dess flere høytalere som brukes. Når jeg er på leit etter realistiske effekter, er jeg defor forsiktig med å la ViMiC-kilder bevege seg noe særlig. På den andre siden kan dette også brukes som en “effekt”, f.eks. i kjøleskaplyden som vi lekte oss med. ViMiC ar flere alternativer for hvor detaljrik og prosessorkrevende delays skal være. Ulike settinger her kan påvirke lydlig resultat mye, og er vel verd å eksperimentere med.
- Lydnivå i gjengivelse avhenger av lokalisering til lydkilde og mikrofoner. Dersom man flytter til et annet rom med et annet høytaleroppsett, og endrer mic-konfigurering tilsvarende, vil man oppdage at miksingen, dvs. balansen mellom de ulike kildene, er radikalt endret. Spatiell miksing ved bruk av ViMiC er like mye et spørsmål om plassering i rom som nivå-setting. Før man begynner å mikse er det derfor viktig å ha bestemt seg for et mic-oppsett som kan gjenbrukes i andre rom hvor prosjektet vil finne sted (f.eks. ved turné).
ViMiC er en mer kompleks spatialiseringsmetode enn de øvrige, og har mange parametre som kan justeres. Dess mer man får arbeidet med ViMiC og prøvd ut med ulike settinger, mikrofon/høytaler-konfigureringer og i ulike rom, dess mer vil man få en følelse av hvilke muligheter teknikken byr på, og hvordan den best kan brukes.