Upgrade to Pro — share decks privately, control downloads, hide ads and more …

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Semantic Web: RDF, FOAF & Co.

Jan Wieners
January 16, 2013

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Semantic Web: RDF, FOAF & Co.

Jan Wieners

January 16, 2013
Tweet

More Decks by Jan Wieners

Other Decks in Education

Transcript

  1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // [email protected]

    Daten- und Metadatenstandards Wintersemester 2012 / 2013 16. Januar 2013 – Semantic Web
  2. Ausgangspunkt: Das World Wide Web (WWW)  Einschränkungen des WWW

    Semantic Web  Problemstellung, Intention, Worum geht‘s?  Wissensrepräsentation  Ontologien  Mikroformate  RDF  RDF / XML  Anwendung: FOAF Sitzungsüberblick
  3.  Internet vs. WWW  WWW: Sehr großer Ressourcenfundus: 

    Dokumente bzw. Textuelle Information (HTML-Dokumente, PDF, etc.)  Bilder  Videodateien  …  1989 am CERN entwickelt  Intention: Austausch von Forschungsergebnissen  Konzepte: Das WWW…  bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL  bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks) World Wide Web
  4. Aufruf einer Website - HTTP  Client stellt Anfrage an

    Server  Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück  HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll World Wide Web
  5. „Magic“ II:  Ranking: Sortierung der Treffer von hochrelevanten zu

    weniger relevanten Treffern „Magic“ III:  Performance: It‘s magic?
  6. „What‘s wrong with the web?“ – die Grenzen des WWW

    I. „Wer ist Jan Wieners?“  Suchanfrage: Wieners  [Wer], [ist] weniger relevante Suchterme World Wide Web
  7. Probleme:  Prüfung der Suchergebnisse auf Benutzerseite - daran haben

    wir uns gewöhnt  Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert  Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein  Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W. World Wide Web
  8. „What‘s wrong with the web?“ – die Grenzen des WWW

     II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen:  Dateiname  Text, der sich in Bildnähe befindet
  9. „What‘s wrong with the web?“ – die Grenzen des WWW

     III. „Finde Musik, die ich mögen könnte“  Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter) World Wide Web
  10. Oh weh, was meint sie / er damit bloß??? Den

    Computermechanismen mangelt‘s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer
  11. Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte)

    Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“  Das derzeitige WWW dreht sich um Dokumente  Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten Semantic Web
  12. Ach so ist das gemeint! …hätte sie / er das

    nicht gleich sagen können?!? Wissenslücke zwischen Benutzer und Computer mindern  Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann  Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, etc.)
  13. “Home pages typically say things such as:”  "My name

    is..."  "I work for..."  "I'm interested in..."  "I live near..."  "My blog is..."  "I write in this weblog..."  "You can see me in this picture..."  "My Public Key is ..." “FOAF is a way to say all those things, but so that computers can interpret it. Computers can't understand English yet, so we have to be a little more precise in how we say these things. FOAF is a way of saying these things for computers.” Friend-of-A-Friend (FOAF)
  14.  Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee

     Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen) entwickelt im Forschungsfeld der Künstlichen Intelligenz.  Standards: W3C  Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten Semantic Web
  15. Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer

    müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen Bei Webseiten: Mikroformate Semantic Web
  16. Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate) : XHTML, einfach: <div> <div>Max

    Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div> Semantic Web
  17. Wissensrepräsentation: Ontologien und Ontologiesprachen  Ontologien werden formuliert in formalen

    Sprachen mit einer wohldefinierten Syntax  Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)  RDF und OWL = am häufigsten verwendete Sprachen Ontologien  Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte  Schwergewichtige: Machen‘s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind  In der Praxis: leichtgewichtige Ontologien Semantic Web
  18. The Resource Description Framework (RDF)  Erfunden, um Ressourcen im

    WWW zu beschreiben  Domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben  RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL RDF
  19. W3C (http://www.w3schools.com/rdf/rdf_intro.asp):  RDF stands for Resource Description Framework 

    RDF is a framework for describing resources on the web  RDF is designed to be read and understood by computers  RDF is not designed for being displayed to people  RDF is written in XML  RDF is a part of the W3C's Semantic Web Activity  RDF is a W3C Recommendation RDF
  20. Unterscheidung:  Ressourcen: Alles, was über einen Uniform Resource Identifier

    (URI) referenziert werden kann  Eigenschaften (properties): Eigenschaften von Ressourcen  Ausdrücke (Expressions) werden geformt mit Tripeln in der Form (Subjekt, Prädikat, Objekt)  Ausdrücke (statements) = resource + properties RDF
  21. Uniform Resource Identifier  Globaler, eindeutiger Bezeichner für Entitäten 

    Unterklassen: URL, URN  Beispiele:  http://de.wikipedia.org/wiki/Uniform_Resource_Ide ntifier  urn:isbn:4-7980-1224-6  mailto:[email protected]  geo:48.33,14.122;u=22.5 RDF
  22. Tripel-Beispiel: Statement: „Der Wikipedia-Beitrag über Köln wurde zuletzt am 23.10.2011

    bearbeitet.“  (http://de.wikipedia.org/wiki/Köln,lastModified,2011 -06-10)  resource  http://de.wikipedia.org/wiki/Köln property  lastModified value  2011-10-23 RDF
  23. Beziehungen zwischen Ressourcen Statement: „Der Wikipedia Artikel über Köln beschreibt

    die Stadt Köln.“ (http://de.wikipedia.org/wiki/Köln,isAbout,urn:exampl e:city:cologne) resource property value  Subjekt Verb Objekt RDF
  24. Klassen  Auch Klassen sind Ressourcen und besitzen URIs. 

    Die Zugehörigkeit einer Ressource zu einer Klasse wird mit der Property http://www.w3.org/1999/02/22-rdf-syntax-ns#type ausgedrückt. Beispiele: (urn:example:city:cologne, http://www.w3.org/1999/02/22-rdf-syntax-ns#type, http://dbpedia.org/ontology/City) RDF
  25. Namespaces / Namensräume  Klassen und Eigenschaften unterhalb des gleichen

    URI bilden einen Namespace. Beispiel: Dublin Core  http://purl.org/dc/elements/1.1/title  http://purl.org/dc/elements/1.1/creator  http://purl.org/dc/elements/1.1/date FOAF  http://xmlns.com/foaf/0.1 RDF
  26. <urn:example:city:cologne> <http://dbpedia.org/property/name> "Köln". In RDF / XML: <?xml version="1.0" encoding="UTF-8"?>

    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:dbpedia="http://dbpedia.org/property/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dbpedia:name>Köln</dbpedia:name> </rdf:Description> </rdf:RDF> RDF / XML – ein Beispiel
  27. <urn:example:city:cologne> <http://purl.org/dc/elements/1.1/description> <http://de.wikipedia.org/wiki/Köln>. RDF ermöglicht die gleichzeitige Nutzung unterschiedlicher Vokabulare

    für die Beschreibung von Metadaten. In RDF / XML mit Dublin Core: <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dc:description rdf:resource="http://de.wikipedia.org/wiki/Köln"/> </rdf:Description> </rdf:RDF> RDF / XML – ein weiteres Beispiel
  28. „The FOAF ("Friend of a Friend") project is a community

    driven effort to define an RDF vocabulary for expressing metadata about people, and their interests, relationships and activities.” Grundaufbau eines FOAF-Dokumentes: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF / XML und FOAF
  29. Hinzufügen einer Person und eines Namens: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-

    schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Dan Brickley</foaf:name> </foaf:Person> </rdf:RDF> RDF / XML und FOAF
  30. Relationen zu anderen Personen ergänzen: […] <foaf:Person rdf:nodeID="Joyce"> <foaf:name>James Joyce</foaf:name>

    <rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/> </foaf:Person> <foaf:Person rdf:nodeID="Jan"> <foaf:name>Jan Wieners</foaf:name> <foaf:knows rdf:nodeID="Joyce"/> <foaf:knows> <foaf:Person rdf:nodeID="Murakami"> <foaf:name>Haruki Murakami</foaf:name> </foaf:Person> </foaf:knows> </foaf:Person> […] RDF / XML und FOAF
  31. Beschreiben Sie sich selbst mit den Begriffen aus FOAF in

    RDF / XML. Ergänzen Sie Freund- und Bekanntschaften. Das FOAF- Vokabular finden Sie erläutert unter http://xmlns.com/foaf/spec/. Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter http://www.w3.org/RDF/Validator Startpunkt: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF - Übung
  32. Bilden Sie ein Werk Ihrer Wahl (Buch, Film, Literatur, o.ä.)

    unter Verwendung von XML/RDF und Dublin Core ab. Informationen zu Dublin Core und RDF/XML finden sich unter http://dublincore.org/documents/dcq-rdf- xml/ RDF/XML + Dublin Core
  33. /