Save 37% off PRO during our Black Friday Sale! »

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese

Presentation of the paper "Perceptual Properties of Data-based Wave Field Synthesis" given at the annual meeting of the German acoustical society (DAGA) in Oldenburg, Germany.

8a13fa13872a1ff4a5cc85e9101161f2?s=128

Sascha Spors

March 12, 2014
Tweet

Transcript

  1. Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese Sascha Spors 1 and Hagen

    Wierstorf 2 1Universität Rostock, Institut für Nachrichtentechnik 2Technische Universität Berlin, Assessment of IP-based Applications 12.März 2014
  2. Datenbasierte Wellenfeldsynthese [Hulsebos et al. 2001] Aufnahme natürlicher Schallfelder mittels

    Mikrofonarray und Synthese des Schallfeldes durch die Wellenfeldsynthese Plane Wave Decomposition Driving Signals / M / Npw / L Hier: Untersuchung der perzeptiven Eigenschaften datenbasierter Wellenfeldsynthese Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Einleitung 1
  3. Intrinsische Dimensionalität von Schallfeldern [Kennedy et al. 2007] Die Darstellung

    eines Schallfeldes mit beschränkten Fehler in einem beschränkten quellenfreien Bereich benötigt nur eine endliche Anzahl von Expansionskoeffizienten. Sphärischer/kreisförmiger Bereich Sphärische Harmonische als Expansionsbasis Fehler sinkt exponentiell mit steigender Ordnung Nsph Ordnung Nsph steigt linear mit Frequenz und Radius Darstellung als Superposition von ebene Wellen Spektrum der ebenen Wellen aus Darstellung in sphärischen Harmonischen Endliche Anzahl Npw von (unabhängigen) ebenen Wellen Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 2
  4. Modales Beamforming mit sphärischen Mikrofonarrays Expansion des aufgenommen Schallfeldes in

    sphärische Harmonische endlicher Ordnung Spherical Harmonics Decomposition Plane Wave Expansion Modal Beamforming / M / Nsph / Npw Realisierung des modalen Beamformings 1. Räumliche Abtastung Wiederholung des räumlichen Spektrums [Ahrens et al. 2012] Typischerweise Begrenzung der Ordnung Nsph 2. Eigenrauschen des Equipments 3. Mikrofonabweichungen- und Positionsungenauigkeiten Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 3
  5. Ansteuerungsfunktionen für die Wellenfeldsynthese Gerichtete Ableitung des aufgenommenen Schallfeldes an

    der Lautsprecherposition Vorfilterung der Signals der virtuellen Quelle Translation der ebene Wellen zur Lautsprecherposition und Summation Illustration 0 ¯ P(φ, θ, ω) ∂V n x0 Alternativ: Synthese von ebenen Wellen mit Spektrum der jeweiligen ebene Welle Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 4
  6. Versuchsdesign Eine monofrequente/breitbandige ebenen Welle als virtuelle Quelle Kontinuierliches modales

    Beamforming [Rafaely 2005] 2.5-dimensionale Wellenfeldsynthese mit zirkulären Lautsprecherarray Continuous Modal Beamforming Driving Signals / Npw / L Nsph Einfluss der Ordnung auf synthetisiertes Schallfeld Lokalisation und Klangfarbe Simulationsparameter Nsph 750 28 10 5 1 28 Npw 2 · Nsph + 1 1501 L 56 Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 5
  7. Synthetisiertes Schallfeld - Monofrequent Nsph = 750, f = 1000

    Hz (Volle Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  8. Synthetisiertes Schallfeld - Monofrequent Nsph = 28, f = 1000

    Hz (Beschränkte Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  9. Synthetisiertes Schallfeld - Monofrequent Nsph = 28, f = 2000

    Hz (Beschränkte Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  10. Synthetisiertes Schallfeld - Monofrequent Nsph = 10, f = 2000

    Hz (Beschränkte Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  11. Synthetisiertes Schallfeld - Monofrequent Nsph = 5, f = 2000

    Hz (Beschränkte Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  12. Synthetisiertes Schallfeld - Monofrequent Nsph = 1, f = 2000

    Hz (Beschränkte Ordnung) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  13. Synthetisiertes Schallfeld - Monofrequent Nsph = 28, Npw = 1501,

    f = 2000 Hz (Interpolation) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6
  14. Synthetisiertes Schallfeld - Breitbandig Nsph = 750 (Volle Ordnung) x

    / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  15. Synthetisiertes Schallfeld - Breitbandig Nsph = 28 (Beschränkte Ordnung) x

    / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  16. Synthetisiertes Schallfeld - Breitbandig Nsph = 10 (Beschränkte Ordnung) x

    / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  17. Synthetisiertes Schallfeld - Breitbandig Nsph = 5 (Beschränkte Ordnung) x

    / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  18. Synthetisiertes Schallfeld - Breitbandig Nsph = 1 (Beschränkte Ordnung) x

    / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  19. Synthetisiertes Schallfeld - Breitbandig Nsph = 28, Npw = 1501

    (Interpolation) x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7
  20. Frequenzgang Mittig x = (0, 0, 0) m 102 103

    104 −140 −120 −100 −80 −60 −40 −20 0 frequency (Hz) level (dB) N sph =750 (Volle Ordnung) N sph =28 (Beschränkte Ordnung) N sph =10 N sph =5 N sph =1 N sph =28, N pw =1501 (Interpolation) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8
  21. Frequenzgang Außermittig x = (1, 0, 0) m 102 103

    104 −140 −120 −100 −80 −60 −40 −20 0 frequency (Hz) level (dB) N sph =750 (Volle Ordnung) N sph =28 (Beschränkte Ordnung) N sph =10 N sph =5 N sph =1 N sph =28, N pw =1501 (Interpolation) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8
  22. Eigenschaften des synthetisierten Schallfeldes Überlagerung einer endlichen Anzahl von ebene

    Wellen Volle Ordnung: Synthese einer ebenen Welle Beschränkte Ordnung: amplitude-panning higher-order Ambisonics (APA) Interpolation: near-field compensated higher-order Ambisonics (NFC-HOA) Lokalisation der virtuellen Schallquelle Volle Ordnung ⇒ Wellenfeldsynthese [Wierstorf et al. 2013] Beschränkte Ordnung: Mittig ⇒ datenbasierte binauraler Synthese [Spors et al. 2012] Außermittig ⇒ Abschätzung durch binaurales Modell Interpolation ⇒ NFC-HOA [Wierstorf et al. 2013] Klangfarbe Beschränkte Ordnung/Interpolation ⇒ Klangverfärbungen für außermittige Positionen Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 9
  23. Vorhersage der Lokalisation durch binaurales Modell Nsph = 28 (Beschränkte

    Ordnung) (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10
  24. Vorhersage der Lokalisation durch binaurales Modell Nsph = 10 (Beschränkte

    Ordnung) (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10
  25. Vorhersage der Lokalisation durch binaurales Modell Nsph = 5 (Beschränkte

    Ordnung) (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10
  26. Vorhersage der Lokalisation durch binaurales Modell Nsph = 1 (Beschränkte

    Ordnung) (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10
  27. Vorhersage der Lokalisation durch binaurales Modell Nsph = 28, Npw

    = 1500 (Interpolation) (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013]) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10
  28. Zusammenfassung und Ausblick Für eine typische Ordnung von Nsph ≥

    5 ergeben sich Gute Ergebnisse für mittige Zuhörerposition Gute Lokalisation aber Klangverfärbungen für außermittige Positionen Ausblick Einfluss des Amplitudenfehlers bei 2.5-dimensionaler Synthese Einfluss von Abtastung und Eigenrauschen Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 11
  29. Ausblick – Amplitudenabweichungen 2.5-dimensionale Synthese einer ebene Welle f =

    1000 Hz x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 level (dB) −15 −10 −5 0 5 10 (2.5D, L = 56, R = 1.5 m, φpw = 270o) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 12
  30. Sphärisches Mikrofonarray ohne Eigenrauschen Synthetisiertes Schallfeld für Nsph = 23

    x / m y / m −2 −1 0 1 2 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 (2.5D, M = 770 Lebedev, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz) Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 13
  31. Vielen Dank! http://spatialaudio.net Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS

    | Ausblick 13