WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Semantic Web: RDF, FOAF & Co.

WS12/13 -- IT-Zertifikat: Daten- und Metadatenstandards | Semantic Web: RDF, FOAF & Co.

45498a716669c6ac165af19c34525ece?s=128

Jan G. Wieners

January 16, 2013
Tweet

Transcript

  1. Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // jan.wieners@uni-koeln.de

    Daten- und Metadatenstandards Wintersemester 2012 / 2013 16. Januar 2013 – Semantic Web
  2. Ausgangspunkt: Das World Wide Web (WWW)  Einschränkungen des WWW

    Semantic Web  Problemstellung, Intention, Worum geht‘s?  Wissensrepräsentation  Ontologien  Mikroformate  RDF  RDF / XML  Anwendung: FOAF Sitzungsüberblick
  3. World Wide Web

  4.  Internet vs. WWW  WWW: Sehr großer Ressourcenfundus: 

    Dokumente bzw. Textuelle Information (HTML-Dokumente, PDF, etc.)  Bilder  Videodateien  …  1989 am CERN entwickelt  Intention: Austausch von Forschungsergebnissen  Konzepte: Das WWW…  bietet Mechanismen, um auf Dokumente des Internets zugreifen zu können  HTTP, sowie die Eindeutige Referenzierung von Inhalten: URL  bietet eine Syntax (HTML), um Dokumente anzuzeigen und miteinander zu verknüpfen (Hyperlinks) World Wide Web
  5. Aufruf einer Website - HTTP  Client stellt Anfrage an

    Server  Server beantwortet Anfrage, d.h. liefert ein Dokument / eine Ressource zurück  HTML definiert eine Syntax, die von Rechnern verstanden werden kann  HTML sagt dem Rechner, wie das Dokument angezeigt werden soll World Wide Web
  6. …die Nadel im Heuhaufen…?

  7. Suchmaschinen: Google

  8. Suchmaschinen: Google

  9. „Magic“:  Rechtschreibfehler: „accidentally“ vs. „acidentally“ It‘s magic?

  10. „Magic“ II:  Ranking: Sortierung der Treffer von hochrelevanten zu

    weniger relevanten Treffern „Magic“ III:  Performance: It‘s magic?
  11. „What‘s wrong with the web?“ – die Grenzen des WWW

    I. „Wer ist Jan Wieners?“  Suchanfrage: Wieners  [Wer], [ist] weniger relevante Suchterme World Wide Web
  12. Probleme:  Prüfung der Suchergebnisse auf Benutzerseite - daran haben

    wir uns gewöhnt  Gefahr / Dilemma: Die Suchanfrage ist überspezifiziert  Durch Angabe weiterer Suchterme schränken wir die Trefferliste erneut ein  Weiteres Problem: Es könnten Seiten im WWW existieren, die sich mit dem Suchbegriff beschäftigen, ihn jedoch nicht nennen, z.B. Jan W. World Wide Web
  13. „What‘s wrong with the web?“ – die Grenzen des WWW

     II. „Zeige mir Fotos von Paris“  Suchmaschinen versuchen (mitunter), die Bedeutung eines Bildes / das im Bild dargestellt durch den Kontext zu erschließen:  Dateiname  Text, der sich in Bildnähe befindet
  14. „What‘s wrong with the web?“ – die Grenzen des WWW

     III. „Finde Musik, die ich mögen könnte“  Knackpunkt: Hintergrundwissen – Welche Musik mag ich derzeit? (Musikgeschmack verändert sich mitunter) World Wide Web
  15. Oh weh, was meint sie / er damit bloß??? Den

    Computermechanismen mangelt‘s an Wissen! „knowledge gap“:  Probleme im Verständnis natürlicher Sprache  Interpretation des Inhaltes von Bildern oder anderen multimedialen Dingen  Computer verfügt nicht über Hintergrundwissen über das der Benutzer / die Benutzerin verfügt  Computer verfügt nicht über Hintergrundwissen über die Benutzerin / den Benutzer
  16. Paradigmenwechsel: von passiver Rechenleistung zu aktiver Rechenleistung (Verständnis der Inhalte)

    Das Semantic Web will Computern helfen, die Bedeutung hinter den Webseiten zu "verstehen“  Das derzeitige WWW dreht sich um Dokumente  Das Semantic Web dreht sich um Dinge (Menschen, Musik, Filme), um Konzepte Eine Möglichkeit: Einbettung semantischer Information in HTML-Seiten Semantic Web
  17. Semantic Web

  18. Ach so ist das gemeint! …hätte sie / er das

    nicht gleich sagen können?!? Wissenslücke zwischen Benutzer und Computer mindern  Bereitstellung von Wissen in einer Art und Weise, in der es von Computern verarbeitet werden und für weiteres Schließen verwendet werden kann  Z.B.: Bereitstellung von (semantischen) Metainformationen, die die Inhalte der Website beschreiben (description, keywords, etc.)
  19. None
  20. “Home pages typically say things such as:”  "My name

    is..."  "I work for..."  "I'm interested in..."  "I live near..."  "My blog is..."  "I write in this weblog..."  "You can see me in this picture..."  "My Public Key is ..." “FOAF is a way to say all those things, but so that computers can interpret it. Computers can't understand English yet, so we have to be a little more precise in how we say these things. FOAF is a way of saying these things for computers.” Friend-of-A-Friend (FOAF)
  21. Bild + Metadaten  Schlüsselwörter  Georeferenzierung ◦ Adresskodierung (Postanschrift)

    ◦ Zuweisung von Koordinaten (Geotagging) ◦ …
  22.  Konzept des Semantic Web formuliert 1996 von Tim Berners-Lee

     Kerntechnologien (logikbasierte Sprachen zur Representation von Wissen und (automatisiertem) Schließen) entwickelt im Forschungsfeld der Künstlichen Intelligenz.  Standards: W3C  Ursprüngliche Intention: Annotation – Anreicherung der Inhalte im WWW durch Metadaten Semantic Web
  23. Ein Knackpunkt: Das Semantic Web macht Arbeit. Benutzerinnen und Benutzer

    müssen neben Inhalten auch Metadaten, d.h. beschreibende Inhalte bereitstellen Bei Webseiten: Mikroformate Semantic Web
  24. Beispiel: Mikroformat „hCard“ (vgl. http://de.wikipedia.org/wiki/Mikroformate) : XHTML, einfach: <div> <div>Max

    Mustermann</div> <div>Musterfirma</div <div>01234/56789</div> <a href="http://example.com/">http://example.com/</a> </div> Im Mikroformat „hCard“: <div class="vcard"> <div class="fn">Max Mustermann</div> <div class="org">Musterfirma</div> <div class="tel">01234/56789</div> <a class="url" href="http://example.com/">http://example.com/</a> </div> Semantic Web
  25. Wissensrepräsentation: Ontologien und Ontologiesprachen  Ontologien werden formuliert in formalen

    Sprachen mit einer wohldefinierten Syntax  Ontologien gründen auf der Arbeit von Gemeinschaften (Communities)  RDF und OWL = am häufigsten verwendete Sprachen Ontologien  Leichtgewichtige: Unterscheidungen zwischen Klassen, Instanzen und Eigenschaften, jedoch nur minimale Beschreibung der Konzepte  Schwergewichtige: Machen‘s möglich, präziser zu beschreiben, wie Klassen von anderen Klassen abgeleitet sind  In der Praxis: leichtgewichtige Ontologien Semantic Web
  26. None
  27. The Resource Description Framework (RDF)  Erfunden, um Ressourcen im

    WWW zu beschreiben  Domänenunabhängig, d.h. kann auch dazu verwendet werden, Entitäten der realen Welt zu beschreiben  RDF ist eine einfache Modellierungssprache, ist jedoch die Grundlage für komplexere Sprachen wie OWL RDF
  28. W3C (http://www.w3schools.com/rdf/rdf_intro.asp):  RDF stands for Resource Description Framework 

    RDF is a framework for describing resources on the web  RDF is designed to be read and understood by computers  RDF is not designed for being displayed to people  RDF is written in XML  RDF is a part of the W3C's Semantic Web Activity  RDF is a W3C Recommendation RDF
  29. <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:si="http://www.w3schools.com/rdf/"> <rdf:Description rdf:about="http://www.w3schools.com"> <si:title>W3Schools.com</si:title> <si:author>Jan Egil

    Refsnes</si:author> </rdf:Description> </rdf:RDF>  http://www.w3schools.com/rdf/rdf_example.asp RDF + XML
  30. W3C RDF Validation Service

  31. Unterscheidung:  Ressourcen: Alles, was über einen Uniform Resource Identifier

    (URI) referenziert werden kann  Eigenschaften (properties): Eigenschaften von Ressourcen  Ausdrücke (Expressions) werden geformt mit Tripeln in der Form (Subjekt, Prädikat, Objekt)  Ausdrücke (statements) = resource + properties RDF
  32. Uniform Resource Identifier  Globaler, eindeutiger Bezeichner für Entitäten 

    Unterklassen: URL, URN  Beispiele:  http://de.wikipedia.org/wiki/Uniform_Resource_Ide ntifier  urn:isbn:4-7980-1224-6  mailto:birgit.mustermann@example.org  geo:48.33,14.122;u=22.5 RDF
  33. Tripel-Beispiel: Statement: „Der Wikipedia-Beitrag über Köln wurde zuletzt am 23.10.2011

    bearbeitet.“  (http://de.wikipedia.org/wiki/Köln,lastModified,2011 -06-10)  resource  http://de.wikipedia.org/wiki/Köln property  lastModified value  2011-10-23 RDF
  34. Tripel-Beispiel: Statement: „Köln hat 1.007.119 Einwohner“ (urn:example:city:cologne,inhabitants,1007119) RDF

  35. Beziehungen zwischen Ressourcen Statement: „Der Wikipedia Artikel über Köln beschreibt

    die Stadt Köln.“ (http://de.wikipedia.org/wiki/Köln,isAbout,urn:exampl e:city:cologne) resource property value  Subjekt Verb Objekt RDF
  36. Visualisierung: Graphdarstellung (http://de.wikipedia.org/wiki/Köln,lastModified,2011-10-23) (urn:example:city:cologne,inhabitants,1007119) (http://de.wikipedia.org/wiki/Köln,isAbout,urn:example:city:cologne) RDF

  37. Problem: (http://de.wikipedia.org/wiki/Köln,lastModified,2011-10- 23) oder (http://de.wikipedia.org/wiki/Köln,lastMod,2011-10-23) oder (http://de.wikipedia.org/wiki/Köln,letzteÄnderung,2011- 10-23) Lösung: Auch

    Properties erhalten URIs Beispiel: (http://de.wikipedia.org/wiki/Köln, http://purl.org/dc/elements/1.1/date,2011-10-23) RDF
  38. Klassen  Auch Klassen sind Ressourcen und besitzen URIs. 

    Die Zugehörigkeit einer Ressource zu einer Klasse wird mit der Property http://www.w3.org/1999/02/22-rdf-syntax-ns#type ausgedrückt. Beispiele: (urn:example:city:cologne, http://www.w3.org/1999/02/22-rdf-syntax-ns#type, http://dbpedia.org/ontology/City) RDF
  39. Namespaces / Namensräume  Klassen und Eigenschaften unterhalb des gleichen

    URI bilden einen Namespace. Beispiel: Dublin Core  http://purl.org/dc/elements/1.1/title  http://purl.org/dc/elements/1.1/creator  http://purl.org/dc/elements/1.1/date FOAF  http://xmlns.com/foaf/0.1 RDF
  40. RDF / XML

  41. <urn:example:city:cologne> <http://dbpedia.org/property/name> "Köln". In RDF / XML: <?xml version="1.0" encoding="UTF-8"?>

    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:dbpedia="http://dbpedia.org/property/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dbpedia:name>Köln</dbpedia:name> </rdf:Description> </rdf:RDF> RDF / XML – ein Beispiel
  42. RDF / XML

  43. <urn:example:city:cologne> <http://purl.org/dc/elements/1.1/description> <http://de.wikipedia.org/wiki/Köln>. RDF ermöglicht die gleichzeitige Nutzung unterschiedlicher Vokabulare

    für die Beschreibung von Metadaten. In RDF / XML mit Dublin Core: <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/"> <rdf:Description rdf:about="urn:example:city:cologne"> <dc:description rdf:resource="http://de.wikipedia.org/wiki/Köln"/> </rdf:Description> </rdf:RDF> RDF / XML – ein weiteres Beispiel
  44. RDF/XML und die Praxis: FOAF

  45. „The FOAF ("Friend of a Friend") project is a community

    driven effort to define an RDF vocabulary for expressing metadata about people, and their interests, relationships and activities.” Grundaufbau eines FOAF-Dokumentes: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF / XML und FOAF
  46. Hinzufügen einer Person und eines Namens: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-

    schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person> <foaf:name>Dan Brickley</foaf:name> </foaf:Person> </rdf:RDF> RDF / XML und FOAF
  47. Hinzufügen einer Email-Adresse: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf- syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf- schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <foaf:Person>

    <foaf:name>Jan Wieners</foaf:name> <foaf:mbox rdf:resource="mailto:jan.wieners@.."/> </foaf:Person> </rdf:RDF> RDF / XML und FOAF
  48. Relationen zu anderen Personen ergänzen: […] <foaf:Person rdf:nodeID="Joyce"> <foaf:name>James Joyce</foaf:name>

    <rdfs:seeAlso rdf:resource="http://www.example.com/jamesjoyce.rdf"/> </foaf:Person> <foaf:Person rdf:nodeID="Jan"> <foaf:name>Jan Wieners</foaf:name> <foaf:knows rdf:nodeID="Joyce"/> <foaf:knows> <foaf:Person rdf:nodeID="Murakami"> <foaf:name>Haruki Murakami</foaf:name> </foaf:Person> </foaf:knows> </foaf:Person> […] RDF / XML und FOAF
  49. Beschreiben Sie sich selbst mit den Begriffen aus FOAF in

    RDF / XML. Ergänzen Sie Freund- und Bekanntschaften. Das FOAF- Vokabular finden Sie erläutert unter http://xmlns.com/foaf/spec/. Prüfen Sie Ihre Arbeit mit dem W3C-Validator unter http://www.w3.org/RDF/Validator Startpunkt: <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:foaf="http://xmlns.com/foaf/0.1/"> <!-- FOAF data goes here --> </rdf:RDF> RDF - Übung
  50. RDF/XML und die Praxis: Dublin Core

  51. Bilden Sie ein Werk Ihrer Wahl (Buch, Film, Literatur, o.ä.)

    unter Verwendung von XML/RDF und Dublin Core ab. Informationen zu Dublin Core und RDF/XML finden sich unter http://dublincore.org/documents/dcq-rdf- xml/ RDF/XML + Dublin Core
  52. /