Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Karl H. Müller (WISDOM): Visuelle Datenanalyse als sozialwissenschaftliche Methode

Karl H. Müller (WISDOM): Visuelle Datenanalyse als sozialwissenschaftliche Methode

Vortrag am Symposium: Infografik und Datenjournalismus
2.-3.12.2013, #dataviz13
Department Medien und Design, FH JOANNEUM Graz
http://datablog.fh-joanneum.at/symposium

More Decks by FH JOANNEUM - Journalism & Public Relations

Other Decks in Education

Transcript

  1. Karl H. Müller
    WISDOM (Wien)
    2. Dezember 2013
    FH Joanneum
    Visualisierung als sozialwissenschaftliche
    Methode

    View Slide

  2. 0.29"2
    Übersicht in fünf Etrappen
    Ø Otto Neurath (1982 – 1945) als Referenzpunkt im Bereich
    Visualisierung
    Ø Zwei „große Transformationen“ bzw. „lange Revolutionen“
    in Wissenschaft und Gesellschaft
    Ø Visualisierung als sozialwissenschaftliche Methode
    Ø Komparative Vorteile der sozialwissenschaftlichen
    Datenvisualisierung
    Ø Verbindungen zum Datenjournalismus

    View Slide

  3. 0.29"3
    Otto Neurath als Visionär der
    Visualisierung
    Otto Neurath, 1882 – 1945:
    Wien, Den Haag, Oxford
    Mitglied des „Wiener Kreises“,
    Begründer einer neuen „Wissenschafts-
    enzyklopädie“, Pionier der Visualisierung
    u.va.m.
    Gesellschafts- und Wirtschaftsmuseum, Wien (1925 – 1934),
    Zusammenarbeit mit Gerd Arntz (1900 – 1988)
    „Modern Man in the Making“ (1939) als Höhepunkt der
    ISOTYPE-Visualisierung („Mengensymbole“)

    View Slide

  4. 0.29"4
    Modern Man in the Making I:
    Industrialisierungsprozesse

    View Slide

  5. 0.29"5
    Modern Man in the Making II:
    Weltbevölkerung und Weltreiche

    View Slide

  6. 0.29"6
    Zwei „große Transformationen“ in
    Wissenschaft und Gesellschaft
    Science I → Science II
    (Wissenschaften zwischen (Wissenschaften seit
    dem 17. und dem frühen 20. 1940/60)
    Jahrhundert)
    Piaget-Gesellschaften → Turing-Gesellschaften
    (Sprach- und schriftbasiert) (Maschinencodebasiert)

    View Slide

  7. 0.29"7
    Wechsel von Science I zu
    Science II
    Dimensionen Science I
    Science II
    Leitwissenschaften Klassische Physik “Life
    Sciences”
    und Komplexi-
    tätswissen-
    schaften

    View Slide

  8. 0.29"8
    Wechsel von Science I zu
    Science II (Fortsetzung)
    Dimensionen Science I Science II
    Visualisierung Peripher Zentral
    Methodenspektrum dual, offen, triadisch (quant.,
    unvermittelt quali., visuell),
    geschlossen,
    visuell vermittelt

    View Slide

  9. 0.29"9
    Evolutionär starke Brüche in
    Gesellschaftsformationen
    Darwingesellschaften → Polanyigesellschaften
    (Genetischer Code (lernfähig, basierend auf
    als Wissensbasis) neuronalen Code)
    Polanyigesellschaften → Piagetgesellschaften
    („implizites Wissen“) (Sprache und schrift-
    codierte Wissensbasiss
    Piagetgesellschaften → Turing-Gesellschaften
    (Sprach- und schriftbasiert) (Maschinencodebasiert,
    digitale Wissensbasis)

    View Slide

  10. 0.29"10
    Bausteine von Turing-Gesellschaften
    Turing-Kreaturen und ihre technologischen Trajektorien
    Transformation der Wissensbasis der Piaget-Gesellschaften in
    die Turing-Gesellschaften
    Neue Potenziale: Globale Reichweite, globale
    Reproduzierbarkeit
    Jahr 2000: Verhältnis von Turingkreaturen zu Menschen 10:1
    Jahr 2012: Verhältnis steigert sich auf rund 30:1
    „Big Data“: Gegenwärtige Gesellschaften produzieren enorme
    Datenmengen und vernichten sie auch wieder

    View Slide

  11. 0.29"11
    Probleme mit der Visualisierung in der
    vergleichenden europäischen Forschung
    Ø  Große Datenmengen (Europäischer Sozialer Survey
    (ESS), Survey of Health, Ageing and Retirement
    (SHARE), etc.)
    Ø  Stark unterschiedliche Ländergrößen (Karten sind
    kaum zu verwenden (Luxemburg, San Marino, etc.)
    Ø  Traditionelle Verfahren der Visualisierung eignen sich nur
    sehr begrenzt für komplexe europäisch-vergleichende
    Musterbildungen (ESS-Fiasko, 2003)
    Ø  Kein kognitiver Mehrwert von üblichen
    Datenvisualisierungen zu normalen Tabellen
    Ø  Datenvisualisierung als “Behübschung” und nicht als
    erkenntnisleitende Methode

    View Slide

  12. 0.29"12
    Sozialwissenschaften und Visuali-
    sierungen: Three Grand Challenges
    Drei große Herausforderungen im Bereich von Daten,
    Methoden und Räumen:
    Ø “Big Data”: Zugang, Anonymität, Auswertungs-
    techniken, explorative visuelle Verfahren
    Ø Visuelle Methoden: Datenvisualisierungen als eigenständige
    Methoden zur Unterstützung von komparativen Analysen
    (Vergleichende Analysen als “experimentelle Methode” in den
    Sozialwissenschaften)
    Ø Europäischer Kontext: Vergleichende Visualisierungen
    speziell für den europäischen Kontext (viele Länder, mehrere
    Zeitpunkte, etc.)

    View Slide

  13. 0.29"13
    Aufbau von Visualisierungen als
    sozialwissenschaftliche Methode
    Ø Visuelle Methoden: Aufbau eines Begriffsapparats,
    der einen Tansformationsprozess emöglicht:
    Daten → Musterbildungen/Mustererkennungen
    Ø Lösung des Raumproblems: z.B. Relationale Karten,
    gleiche Größen pro regionaler Unit (Länder,
    Bundesländer, Bezirke, etc.)
    Ø Grundbegriffe:
    Modus: Modus I (ein einzelner Datensatz); Modus II (zwei
    oder mehrere Datensätze)
    Kontexte (ein/mehrere Beobachtungspunkte/eine/mehrere
    Variablen (Vier Kontexte)
    Ø Visuelle Prototypen (“Mustergeneratoren”)

    View Slide

  14. 0.29"14
    Eigenschaften visueller Methoden
    Ø Interaktiv (im Gegensatz zu sequentiellen quantitativen
    und qualitativen Methoden)
    Ø Beobachterabhängig (keine Mustererkennung versus
    vielfache Mustererkennungen)
    Ø Fokussierung auf spezifische Problemstellungen:
    Ähnlichkeiten, Distanzen, Kohärenzen, Korrelationen,
    Outliers, Mekmale einer Verteilung, etc.
    Ø Explorativ: Mustererkennung benötigt Zeit; viele Lösungen
    möglich, offener Suchprozess
    Ø Rekursivität (Muster entstehen in der Interaktion)
    Ø Kognitiver Mehrwert: Schnelle Mustererkennung speziell bei
    hoher Komplexität von Daten

    View Slide

  15. 0.29"15
    0.29"
    8
    Rekursivität von Beobachtungen und
    visuelle “Gleichgewichte”

    View Slide

  16. 0.29"16
    Beispiele für visuelle Datenanalysen für
    die Sozialwissenschaften
    Ø Vier Beispiele für Kohärenzen, Clusterbildungen,
    Distanzen, Korrelationen
    Ø Europäischer Rahmen: Daten des Europäischen
    Sozialen Survey 2003 und 2011
    Ø Zwei Prototypen (Kohärenzen, multiple Bereiche/
    multiple Dimensionen pro Bereich
    Ø Zwei Kontexte: ein Zeitpunkt/mehrere Dimensionen und
    Bereiche sowie mehrere Zeitpunkte und mehrere
    Dimensionen und Bereiche
    Ø Kognitiver Mehrwert: Muster können in tabellarischer Form
    oder mit statistischen Verfahren sehr schwer entdeckt werden
    Ø Geringe Eingewöhnungszeit notwendig

    View Slide

  17. 0.29"17
    Kohärenzen zwischen zwei Bereichen:
    Subjektive/objektive Arbeitswelt

    View Slide

  18. 0.29"18
    0.29"
    9
    Clustern von Ländergruppen I : Das
    soziale Europa 2011 (ESS, 5. Welle)

    View Slide

  19. 0.29"19
    0.29"
    10
    Clustern von Ländergruppen II: Das
    soziale Europa 2003 (ESS, 1. Welle)

    View Slide

  20. 0.29"20
    0.29"
    11
    Clustern von Ländergruppen III:
    Veränderungen 2003 - 2011

    View Slide

  21. 0.29"21
    Sozio-ökonomische Distanzen in Europa
    2003 (7 Bereiche, 7 Dimensionen)

    View Slide

  22. 0.29"22
    22
    Visuelle geschlechtsspezifische
    Korrelationen 2011 (ESS, 5. Welle)

    View Slide

  23. 0.29"23
    23
    Visuelle altersspezifische Korrelationen
    2011 (ESS, 5. Welle)

    View Slide

  24. 0.29"24
    Visuelle Methoden und
    Datenjournalismus
    Ø Vorteil visueller Methoden: Geinge Lernzeit, relativ leicht
    verständlich und handhabbar (im Gegensatz zu statistischen
    Verfahren und Programmen)
    Ø Verwendung visueller Methoden als “Geschichtengeneratoren”
    mit unterschiedlichen Themen: Abweichungen, Kohärenzen,
    Distanzen, Korrelationen (Zusammenhänge zwischen Sub-
    populationen wie Geschlecht, Alter, etc.)
    Ø Permanente Verfügbarkeit und Erweiterbarkeit (neue Wellen von
    ESS, SHARE, etc.)
    Ø Hoher Neuigkeitswert (im Vergleich zur journalistischen
    Aufbereitung von Umfragen)

    View Slide

  25. 0.29"25
    Ende
    Ø Danke für die audio-visuelle
    Aufmerksamkeit
    Ø Kontakt:
    [email protected]
    Ø Wiener Institut für sozialwissenschaftliche Dokumentation und
    Methodik (WISDOM)
    Liechtensteinstraße 22a/2/17
    1090 Wien

    View Slide

  26. 0.29"26
    WISDOMIZE_2.0
    online data visualization
    —  web-application
    —  ruby on rails
    (web-application development framework ::backend)
    —  extjs
    (javascript library for rich user interfaces ::frontend)
    —  mysql (data storage)
    —  svg (graphic format > current version)
    —  flash based charts (graphic format >> upcoming version)
    —  xml (data/settings exchange format

    View Slide

  27. 0.29"27
    Ø Generate visual patterns
    Ø on the basis of survey data
    Ø on the basis of graphic prototypes
    Ø online and on demand
    WISDOMIZE_beta
    Online Data Visualization

    View Slide

  28. 0.29"28
    WISDOMIZE_beta
    Online Data Visualization
    http://linux.wisdom.at/wisdomize

    View Slide

  29. 0.29"29
    WISDOMIZE_beta
    Online Data Visualization

    View Slide

  30. 0.29"30
    WISDOMIZE_beta
    Minimum/Maximum Values

    View Slide

  31. 0.29"31
    WISDOMIZE_beta
    Above 90% of the Maximum Level and Below 10% of the
    Minimum Level

    View Slide

  32. 0.29"32
    WISDOMIZE_beta
    Upper Quartil and Lower Quartil

    View Slide

  33. 0.29"33
    WISDOMIZE_beta
    Online Data Visualization

    View Slide

  34. 0.29"34
    WISDOMIZE_beta
    Online Data Visualization

    View Slide