Fabian M. Suchanek The Semantic Web 100
Semantic IE You are here 2 Source Selection and Preparation Entity Recognition Entity Disambiguation singer Fact Extraction Reasoning Instance Extraction singer Elvis
Overview 3 •   Motivation •   Knowledge Representation •   URIs •   Standard Vocabularies •   Linked Data •   SPARQL & OWL •   RDFa, JSON-LD & friends •   Applications
We can do I.E. — what now? 4 Airport Heathrow Location London
Sources of incompatility 5 Airport Heathrow Location London <airport>   <placeOrCity> ? ? ? Airport Name Heathrow Airport City Londres
Sources of incompatility <airport>   <placeOrCity> 6 Airport Heathrow ? ? ? Location London Airport Name Heathrow Airport City Londres [Images form Wikicommons, except Oracle]
Sources of incompatility <airport>   <placeOrCity> 7 Airport Heathrow ? ? ? Location London Airport Name Heathrow Airport City Londres [Images form Wikicommons, except Oracle. Company logos for illustration only] > more
Where do we need interaction? • Booking a flight   Interaction between office computer, flight company, travel agency,   shuttle services, hotel, my calendar • Finding a restaurant   Interaction between mobile device, map service,   recommendation service, restaurant reservation • Intelligent home   Fridge knows my calendar, orders food if   I am planning a dinner 8 > more
Where do we need interaction? • Web service composition   Interaction between client and Web services   and Web services themselves • Personal assistant   Connects calendar, email, restaurants, secretary, etc. • Intelligent cars   Car knows my schedule, where and when   to get gas, how not to hit other cars, what   are the legal regulations 9 > more
Where do we need interaction? • Adding data to a database   From XML files, from other databases • Merging data after company mergers   (e.g. Apple buys Microsoft)   Different terminology has to be bridged,   accounts to be merged • Merging data in research   e.g. biochemical, genetic , pharmaceutical research data 10
Def: Semantic Web Idea: We need an infrastructure that allows computers to “understand” their data.   This infrastructure shall •  allow machines to process data from others •  ensure interoperability between schemas,    devices and organizations •  allow data to describe data •  allow machines to reason on the data •  allow machines to answer semantic queries 11 This is what the Semantic Web aims at The  Semantic Web  is an evolving extension of the World Wide Web, in which data is made available in one standardized semantic format.
The Semantic Web 12 •   Motivation •   Knowledge Representation •   URIs •   Standard Vocabularies •   Linked Data •   SPARQL & OWL •   RDFa, JSON-LD & friends •   Applications
Def: RDF RDF  (Resource Description Framework) is a knowledge representation based on • entities • classes • binary relations • labels 13 singer 1935 person born type “Elvis” label subclassOf ->knowledge-representation >details
Knowledge Representation in SW <person>   <occupation> 14 Job Elvis Person singer Birth 1935 ->knowledge-bases singer 1935 born type
The Semantic Web 15 •   Motivation •   Knowledge Representation •   URIs •   Standard Vocabularies •   Linked Data •   SPARQL & OWL •   RDFa, JSON-LD & friends •   Applications
Globally identifying entities 16 Elvis Elvis Elvis Elvis KB1 KB2 KB3 KB4 >details
Def: Namespace / Qualified Name namespace  is a named set of (so‐called “local”) names. [ Wikipedia/Namespace ] namespace: KB1 contains local names: Elvis, Priscilla, Lisa   namespace: KB2 contains local names: Elvis, Michael 17 qualified name  consists of a namespace name and a local name. KB1:Elvis KB1:Priscilla KB2:Elvis Examples
What if KBs have the same name? 18 Elvis Elvis Elvis Elvis ElvisKB ElviPedia ElvisKB ElviPedia
Def: URI URI  (Uniform Resource Identifier) is a string that follows the syntax 19 <scheme name> : <hierarchical part> [ <query> ] [ # <fragment> ] Examples: • URLs   • File identifiers   • FTP   • MailTo      http://elvis.com/biography.html#Birth      file:///c:/users/elvis/tripToMoon.txt     ftp://elvis@nsa.gov     mailto:him@elvis.com?subject=Where%20%are%20you All URLs are URIs, but not all URIs are URLs (“dereferenceable”) >details
Each KB & each entity has a URI ElviPedia:  http://elvis-alive.org/ ElviPedia':  http://elvipedia.com/ ElvisKB: http://elvis.org/kb/ YAGO: http://yago-knowledge.org/ Each of them forms a namespace. 20      http://elvis.org/kb/      Elvis      http://elvis.org/kb/Elvis    (again a URI) URI of ElviPedia:   Name in that namespace:   Qualified name of Elvis in ElviPedia: Each KB on the Semantic Web has a URI: Each entity in a KB has a qualified name, which is also a URI:
21 http://elvis- alive.org/Elvis Each KB & each entity has a URI http://elvis-alive.org/ http://elvipedia.com/ >namespace&ambig >namespace http://elvis.org/kb/ http://yago-knowledge.org/ http://elvipe dia.com/Elvis http://elvis. org/kb/Elvis http://yago- knowledge. org/Elvis => Every entity has a globally unique id
Namespaces http://elvis.is/king/of/sing World-wide unique mapping to domain owner in the responsibility of the domain owner • a company can create URIs to identify its products • an organization can assign sub-domains   and each sub-domain can define URIs • individual people can create URIs from their homepage • people can create URIs from any URL for which they have   exclusive rights to create URIs 22 => There should be no overlap
URIs are never ambiguous A URI always refers to one entity, never to more entities. 23 http://kb.org/Priscilla
A URI always refers to one entity, never to more entities. 24 http://kb.org/Priscilla http://onto.org/Priscilla One entity can be referred to by several URIs. URIs can be synonymous
Def: Namespace prefix, CURIE, base  namespace prefix  is an abbreviation for the first part of a URI. A prefix with a local name yields a  CURIE  (also:Qname). @prefix dbp: <http://dbpedia.org/> .   dbp:Elvis = <http://dbpedia.org/Elvis> CURIE (Compact URI) or Qname (qualified name) 25 base URI  is a URI relative to which URIs in the same document are interpreted. @base <http://yago-knowledge.org/> . <Elvis> = <http://yago-knowledge.org/Elvis> (It is disputed whether the last character of the KB URI should be / or #. In any case, you need one of them.)
Def: Turtle Turtle  (Terse RDF Triple Language) is a particular syntax for writing RDF facts. 26 Turtle can declare namespace prefixes and a base as follows:   A simple Turtle fact has the form Example: @prefix y: <http://yago-knowledge.org/> y:Elvis y:loves  y:Priscilla . y:Priscilla y:loves <http://kb.org/cake>. y:Elvis y:isCalled "The King" . URI|Curie   URI|Curie    URI|Curie|literal . @prefix P: <URI> . @base <URI> . see Example Each line is a triple of 3 URIs. Each URI identitifies an entity. The URI in the middle identifies a relation entity. Each URI can be given explicitly or as a Curie. The object can also be a literal. >literals
Literals with data types 27 Turtle allows attaching a  datatype  to a literal in the form      "literal"^^datatype The datatype is given by a URI or Curie. It is common to use the XML datatypes  see them xsd:boolean xsd:decimal xsd:integer xsd:double xsd:float xsd:date xsd:time xsd:dateTime ... true, false Arbitrary-precision decimal numbers Arbitrary-size integer numbers IEEE floating-point 64-bit floating point numbers incl. ±Inf, ±0, NaN 32-bit floating point numbers incl. ±Inf, ±0, NaN Dates (yyyy-mm-dd) with or without timezone Times (hh:mm:ss.sss…) with or without timezone Date and time with or without timezone
Summary: URIs & Turtle • URIs are identifiers for entities, often look like URLs   • Curies abbreviate URIs   • Turtle is a syntax for RDF facts 28 http://sing.it/elvis y:Elvis <http://kb.org/Elvis> y:sings y:AllShookUp . ( TriG , an extension of Turtle, allows dealing with named graphs) ( IRIs , an extension of URIs, allow internationalized characters) ->total-2018
The Semantic Web 29 •   Motivation •   Knowledge Representation •   URIs •   Standard Vocabularies •   Linked Data •   SPARQL & OWL •   RDFa, JSON-LD & friends •   Applications
Cross‐referencing A KB can make statements about entities defined in other KBs. @prefix y: <http://yago-knowledge.org/> @prefix d: <http://dbpedia.org/>   y:Priscilla y:loves d:MikeStone .