Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Sommersemester 2012 -- Blockseminar Daten- und Metadatenstandards | 08: Semantic Web

Jan Wieners
September 26, 2012

Sommersemester 2012 -- Blockseminar Daten- und Metadatenstandards | 08: Semantic Web

Jan Wieners

September 26, 2012
Tweet

More Decks by Jan Wieners

Other Decks in Education

Transcript

  1. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Daten- und Metadatenstandards Sommersemester 2012 [Blockseminar] 27. September 2012 – Semantic Web
  2. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     Ausgangspunkt: Das World Wide Web (WWW) ◦ Einschränkungen des WWW  Semantic Web ◦ Problemstellung, Intention ◦ Wissensrepräsentation ◦ Ontologien ◦ Mikroformate ◦ RDF ◦ RDF / XML ◦ Anwendung: FOAF Sitzungsüberblick
  3. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     Internet vs. WWW  WWW: Sehr großer Ressourcenfundus: ◦ Dokumente bzw. Textuelle Information (HTML- Dokumente, PDF, etc.) ◦ Bilder ◦ Videodateien ◦ …  1989 am CERN entwickelt  Intention: Austausch von Forschungsergebnissen  Konzepte: Das WWW… ◦ bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL ◦ bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks) World Wide Web
  4. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     Aufruf einer Website - HTTP ◦ Client stellt Anfrage an Server ◦ Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück  HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll World Wide Web
  5. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     „Magic“: ◦ Rechtschreibfehler: „accidentally“ vs. „acidentally“ It‘s magic?
  6. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     „Magic“ II: ◦ Ranking: Sortierung der Treffer von hochrelevanten zu weniger relevanten Treffern  „Magic“ III: ◦ Performance: It‘s magic?
  7. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    „What‘s wrong with the web?“ – die Grenzen des WWW  I. „Wer ist Jan Wieners?“ ◦ Suchanfrage: Wieners ◦ [Wer], [ist] weniger relevante Suchterme World Wide Web
  8. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Probleme:  Prüfung der Suchergebnisse auf Benutzerseite - daran haben wir uns gewöhnt  Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert  Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein  Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W. World Wide Web
  9. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    „What‘s wrong with the web?“ – die Grenzen des WWW  II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen: ◦ Dateiname ◦ Text, der sich in Bildnähe befindet
  10. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    „What‘s wrong with the web?“ – die Grenzen des WWW  III. „Finde Musik, die ich mögen könnte“ ◦ Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter) World Wide Web
  11. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Oh weh, was meint sie / er damit bloß??? Den Computermechanismen mangelt‘s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer
  12. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte) Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“  Das derzeitige WWW dreht sich um Dokumente  Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten Semantic Web
  13. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Ach so ist das gemeint! …hätte sie / er das nicht gleich sagen können?!? Wissenslücke zwischen Benutzer und Computer mindern  Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann  Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, etc.)
  14. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    “Home pages typically say things such as:” ◦ "My name is..." ◦ "I work for..." ◦ "I'm interested in..." ◦ "I live near..." ◦ "My blog is..." ◦ "I write in this weblog..." ◦ "You can see me in this picture..." ◦ "My Public Key is ..." “FOAF is a way to say all those things, but so that computers can interpret it. Computers can't understand English yet, so we have to be a little more precise in how we say these things. FOAF is a way of saying these things for computers.” Friend-of-A-Friend (FOAF)
  15. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Bild + Metadaten  Schlüsselwörter  Georeferenzierung ◦ Adresskodierung (Postanschrift) ◦ Zuweisung von Koordinaten (Geotagging) ◦ …
  16. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee  Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen entwickelt im Forschungsfeld der Künstlichen Intelligenz.  Standards: W3C  Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten Semantic Web
  17. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

     Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen  Bei Webseiten: Mikroformate Semantic Web
  18. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate) : XHTML, einfach: <div> <div>Max Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div> Semantic Web
  19. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Wissensrepräsentation: Ontologien und Ontologiesprachen ◦ Ontologien werden formuliert in formalen Sprachen mit einer wohldefinierten Syntax ◦ Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)  RDF und OWL = am häufigsten verwendete Sprachen Ontologien ◦ Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte ◦ Schwergewichtige: Machen‘s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind  In der Praxis: leichtgewichtige Ontologien Semantic Web
  20. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    The Resource Description Framework (RDF)  Erfunden, um Ressourcen im WWW zu beschreiben  RDF ist domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben  RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL RDF
  21. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    W3C (http://www.w3schools.com/rdf/rdf_intro.asp): ◦ RDF stands for Resource Description Framework ◦ RDF is a framework for describing resources on the web ◦ RDF is designed to be read and understood by computers ◦ RDF is not designed for being displayed to people ◦ RDF is written in XML ◦ RDF is a part of the W3C's Semantic Web Activity ◦ RDF is a W3C Recommendation RDF
  22. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Unterscheidung:  Ressourcen: Alles, was über einen Uniform Resource Identifier (URI) referenziert werden kann  Eigenschaften (properties): Eigenschaften von Ressourcen  Ausdrücke (Expressions) werden geformt mit Tripeln in der Form (Subjekt, Prädikat, Objekt)  Ausdrücke (statements) = resource + properties RDF
  23. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Uniform Resource Identifier  Globaler, eindeutiger Bezeichner für Entitäten  Unterklassen: URL, URN  Beispiele:  http://de.wikipedia.org/wiki/Uniform_Resource_Ide ntifier  urn:isbn:4-7980-1224-6  mailto:[email protected]  geo:48.33,14.122;u=22.5 RDF
  24. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Beispiele: Statement: „Der Wikipedia-Beitrag über Köln wurde zuletzt am 23.10.2011 bearbeitet.“  (http://de.wikipedia.org/wiki/Köln,lastModified,2011 -06-10)  resource  http://de.wikipedia.org/wiki/Köln property  lastModified value  2011-10-23 RDF
  25. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Beispiele: Statement: „Köln hat 1.007.119 Einwohner“ (urn:example:city:cologne,inhabitants,1007119) RDF
  26. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Beziehungen zwischen Ressourcen Statement: „Der Wikipedia Artikel über Köln beschreibt die Stadt Köln.“ (http://de.wikipedia.org/wiki/Köln,isAbout,urn:exampl e:city:cologne) resource property value  Subjekt Verb Objekt RDF
  27. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Visualisierung: Graphdarstellung (http://de.wikipedia.org/wiki/Köln,lastModified,2011-10-23) (urn:example:city:cologne,inhabitants,1007119) (http://de.wikipedia.org/wiki/Köln,isAbout,urn:example:city:cologne) RDF
  28. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Problem: (http://de.wikipedia.org/wiki/Köln,lastModified,2011-10- 23) oder (http://de.wikipedia.org/wiki/Köln,lastMod,2011-10-23) oder (http://de.wikipedia.org/wiki/Köln,letzteÄnderung,2011- 10-23) Lösung: Auch Properties erhalten URIs Beispiel: (http://de.wikipedia.org/wiki/Köln, http://purl.org/dc/elements/1.1/date,2011-10-23) RDF
  29. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Klassen  Auch Klassen sind Ressourcen und besitzen URIs.  Die Zugehörigkeit einer Ressource zu einer Klasse wird mit der Property http://www.w3.org/1999/02/22-rdf-syntax-ns#type ausgedrückt. Beispiele: (urn:example:city:cologne, http://www.w3.org/1999/02/22-rdf-syntax-ns#type, http://dbpedia.org/ontology/City) RDF
  30. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Namespaces / Namensräume  Klassen und Eigenschaften unterhalb des gleichen URI bilden einen Namespace. Beispiel: Dublin Core  http://purl.org/dc/elements/1.1/title  http://purl.org/dc/elements/1.1/creator  http://purl.org/dc/elements/1.1/date FOAF  http://xmlns.com/foaf/0.1 RDF
  31. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    <urn:example:city:cologne> <http://dbpedia.org/property/name> "Köln". In RDF / XML: <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:dbpedia="http://dbpedia.org/property/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dbpedia:name>Köln</dbpedia:name> </rdf:Description> </rdf:RDF> RDF / XML – ein Beispiel
  32. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Eine feine Sache: Der W3C RDF-Validator  http://www.w3.org/RDF/Validator RDF / XML
  33. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    <urn:example:city:cologne> <http://purl.org/dc/elements/1.1/description> <http://de.wikipedia.org/wiki/Köln>. RDF ermöglicht die gleichzeitige Nutzung unterschiedlicher Vokabulare für die Beschreibung von Metadaten. In RDF / XML mit Dublin Core: <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dc:description rdf:resource="http://de.wikipedia.org/wiki/Köln"/> </rdf:Description> </rdf:RDF> RDF / XML – ein weiteres Beispiel
  34. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    „The FOAF ("Friend of a Friend") project is a community driven effort to define an RDF vocabulary for expressing metadata about people, and their interests, relationships and activities.” Grundaufbau eines FOAF-Dokumentes: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF / XML und FOAF
  35. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Hinzufügen einer Person und eines Namens: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Dan Brickley</foaf:name> </foaf:Person> </rdf:RDF> RDF / XML und FOAF
  36. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Hinzufügen einer Email-Adresse: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@.."/> </foaf:Person> </rdf:RDF> RDF / XML und FOAF
  37. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Relationen zu anderen Personen ergänzen: […] <foaf:Person rdf:nodeID="Joyce"> <foaf:name>James Joyce</foaf:name> <rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/> </foaf:Person> <foaf:Person rdf:nodeID="Jan"> <foaf:name>Jan Wieners</foaf:name> <foaf:knows rdf:nodeID="Joyce"/> <foaf:knows> <foaf:Person rdf:nodeID="Murakami"> <foaf:name>Haruki Murakami</foaf:name> </foaf:Person> </foaf:knows> </foaf:Person> […] RDF / XML und FOAF
  38. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Beschreiben Sie sich selbst mit den Begriffen aus FOAF in RDF / XML. Ergänzen Sie Freund- und Bekanntschaften. Das FOAF- Vokabular finden Sie erläutert unter http://xmlns.com/foaf/spec/. Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter http://www.w3.org/RDF/Validator Startpunkt: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF - Übung
  39. Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners, MA <[email protected]>

    Bilden Sie ein Werk Ihrer Wahl (Buch, Film, Literatur, o.ä.) unter Verwendung von XML/RDF und Dublin Core ab. Informationen zu Dublin Core und RDF/XML finden sich unter http://dublincore.org/documents/dcq-rdf- xml/ RDF/XML + Dublin Core