Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese

Perzeptive Eigenschaften der datenbasierten Wellenfeldsynthese

Presentation of the paper "Perceptual Properties of Data-based Wave Field Synthesis" given at the annual meeting of the German acoustical society (DAGA) in Oldenburg, Germany.

Sascha Spors

March 12, 2014
Tweet

More Decks by Sascha Spors

Other Decks in Science

Transcript

  1. Perzeptive Eigenschaften
    der datenbasierten Wellenfeldsynthese
    Sascha Spors 1 and Hagen Wierstorf 2
    1Universität Rostock, Institut für Nachrichtentechnik
    2Technische Universität Berlin, Assessment of IP-based Applications
    12.März 2014

    View Slide

  2. Datenbasierte Wellenfeldsynthese
    [Hulsebos et al. 2001]
    Aufnahme natürlicher Schallfelder mittels Mikrofonarray und
    Synthese des Schallfeldes durch die Wellenfeldsynthese
    Plane Wave
    Decomposition
    Driving
    Signals
    /
    M
    /
    Npw
    /
    L
    Hier:
    Untersuchung der perzeptiven Eigenschaften datenbasierter Wellenfeldsynthese
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Einleitung 1

    View Slide

  3. Intrinsische Dimensionalität von Schallfeldern
    [Kennedy et al. 2007]
    Die Darstellung eines Schallfeldes mit beschränkten Fehler in einem beschränkten
    quellenfreien Bereich benötigt nur eine endliche Anzahl von Expansionskoeffizienten.
    Sphärischer/kreisförmiger Bereich
    Sphärische Harmonische als Expansionsbasis
    Fehler sinkt exponentiell mit steigender Ordnung Nsph
    Ordnung Nsph steigt linear mit Frequenz und Radius
    Darstellung als Superposition von ebene Wellen
    Spektrum der ebenen Wellen aus Darstellung in sphärischen Harmonischen
    Endliche Anzahl Npw von (unabhängigen) ebenen Wellen
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 2

    View Slide

  4. Modales Beamforming mit sphärischen Mikrofonarrays
    Expansion des aufgenommen Schallfeldes in sphärische Harmonische endlicher Ordnung
    Spherical Harmonics
    Decomposition
    Plane Wave
    Expansion
    Modal Beamforming
    /
    M
    /
    Nsph
    /
    Npw
    Realisierung des modalen Beamformings
    1. Räumliche Abtastung
    Wiederholung des räumlichen Spektrums [Ahrens et al. 2012]
    Typischerweise Begrenzung der Ordnung Nsph
    2. Eigenrauschen des Equipments
    3. Mikrofonabweichungen- und Positionsungenauigkeiten
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 3

    View Slide

  5. Ansteuerungsfunktionen für die Wellenfeldsynthese
    Gerichtete Ableitung des aufgenommenen Schallfeldes an der Lautsprecherposition
    Vorfilterung der Signals der virtuellen Quelle
    Translation der ebene Wellen zur Lautsprecherposition und Summation
    Illustration
    0
    ¯
    P(φ, θ, ω)
    ∂V
    n
    x0
    Alternativ: Synthese von ebenen Wellen mit Spektrum der jeweiligen ebene Welle
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Datenbasierte Synthese 4

    View Slide

  6. Versuchsdesign
    Eine monofrequente/breitbandige ebenen Welle als virtuelle Quelle
    Kontinuierliches modales Beamforming [Rafaely 2005]
    2.5-dimensionale Wellenfeldsynthese mit zirkulären Lautsprecherarray
    Continuous Modal
    Beamforming
    Driving
    Signals
    /
    Npw
    /
    L
    Nsph
    Einfluss der Ordnung auf
    synthetisiertes Schallfeld
    Lokalisation und Klangfarbe
    Simulationsparameter
    Nsph 750 28 10 5 1 28
    Npw
    2 · Nsph
    + 1 1501
    L 56
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 5

    View Slide

  7. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 750, f = 1000 Hz (Volle Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  8. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 28, f = 1000 Hz (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  9. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 28, f = 2000 Hz (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  10. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 10, f = 2000 Hz (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  11. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 5, f = 2000 Hz (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  12. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 1, f = 2000 Hz (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  13. Synthetisiertes Schallfeld - Monofrequent
    Nsph
    = 28, Npw
    = 1501, f = 2000 Hz (Interpolation)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 6

    View Slide

  14. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 750 (Volle Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  15. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 28 (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  16. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 10 (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  17. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 5 (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  18. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 1 (Beschränkte Ordnung)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  19. Synthetisiertes Schallfeld - Breitbandig
    Nsph
    = 28, Npw
    = 1501 (Interpolation)
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 7

    View Slide

  20. Frequenzgang
    Mittig x = (0, 0, 0) m
    102
    103
    104
    −140
    −120
    −100
    −80
    −60
    −40
    −20
    0
    frequency (Hz)
    level (dB)
    N
    sph
    =750 (Volle Ordnung)
    N
    sph
    =28 (Beschränkte Ordnung)
    N
    sph
    =10
    N
    sph
    =5
    N
    sph
    =1
    N
    sph
    =28, N
    pw
    =1501 (Interpolation)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8

    View Slide

  21. Frequenzgang
    Außermittig x = (1, 0, 0) m
    102
    103
    104
    −140
    −120
    −100
    −80
    −60
    −40
    −20
    0
    frequency (Hz)
    level (dB)
    N
    sph
    =750 (Volle Ordnung)
    N
    sph
    =28 (Beschränkte Ordnung)
    N
    sph
    =10
    N
    sph
    =5
    N
    sph
    =1
    N
    sph
    =28, N
    pw
    =1501 (Interpolation)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 8

    View Slide

  22. Eigenschaften des synthetisierten Schallfeldes
    Überlagerung einer endlichen Anzahl von ebene Wellen
    Volle Ordnung: Synthese einer ebenen Welle
    Beschränkte Ordnung: amplitude-panning higher-order Ambisonics (APA)
    Interpolation: near-field compensated higher-order Ambisonics (NFC-HOA)
    Lokalisation der virtuellen Schallquelle
    Volle Ordnung ⇒ Wellenfeldsynthese [Wierstorf et al. 2013]
    Beschränkte Ordnung:
    Mittig ⇒ datenbasierte binauraler Synthese [Spors et al. 2012]
    Außermittig ⇒ Abschätzung durch binaurales Modell
    Interpolation ⇒ NFC-HOA [Wierstorf et al. 2013]
    Klangfarbe
    Beschränkte Ordnung/Interpolation ⇒ Klangverfärbungen für außermittige Positionen
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 9

    View Slide

  23. Vorhersage der Lokalisation durch binaurales Modell
    Nsph
    = 28 (Beschränkte Ordnung)
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013])
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

    View Slide

  24. Vorhersage der Lokalisation durch binaurales Modell
    Nsph
    = 10 (Beschränkte Ordnung)
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013])
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

    View Slide

  25. Vorhersage der Lokalisation durch binaurales Modell
    Nsph
    = 5 (Beschränkte Ordnung)
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013])
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

    View Slide

  26. Vorhersage der Lokalisation durch binaurales Modell
    Nsph
    = 1 (Beschränkte Ordnung)
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013])
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

    View Slide

  27. Vorhersage der Lokalisation durch binaurales Modell
    Nsph
    = 28, Npw
    = 1500 (Interpolation)
    (2.5D, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz, binaurales Modell nach [Dietz et al. 2011], [Wierstorf et al. 2013])
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ergebnisse 10

    View Slide

  28. Zusammenfassung und Ausblick
    Für eine typische Ordnung von Nsph
    ≥ 5 ergeben sich
    Gute Ergebnisse für mittige Zuhörerposition
    Gute Lokalisation aber Klangverfärbungen für außermittige Positionen
    Ausblick
    Einfluss des Amplitudenfehlers bei 2.5-dimensionaler Synthese
    Einfluss von Abtastung und Eigenrauschen
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 11

    View Slide

  29. Ausblick – Amplitudenabweichungen
    2.5-dimensionale Synthese einer ebene Welle f = 1000 Hz
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    level (dB)
    −15
    −10
    −5
    0
    5
    10
    (2.5D, L = 56, R = 1.5 m, φpw = 270o)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 12

    View Slide

  30. Sphärisches Mikrofonarray ohne Eigenrauschen
    Synthetisiertes Schallfeld für Nsph
    = 23
    x / m
    y / m
    −2 −1 0 1 2
    −2
    −1.5
    −1
    −0.5
    0
    0.5
    1
    1.5
    2
    −1
    −0.8
    −0.6
    −0.4
    −0.2
    0
    0.2
    0.4
    0.6
    0.8
    1
    (2.5D, M = 770 Lebedev, L = 56, R = 1.5 m, φpw = 270o, fs = 44.1 kHz)
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 13

    View Slide

  31. Vielen Dank!
    http://spatialaudio.net
    Spors, Wierstorf | Perzeptive Eigenschaften datenbasierter WFS | Ausblick 13

    View Slide