CC-BY Fabian M. Suchanek Disambiguation 56
Semantic IE You are here 2 Source Selection and Preparation Entity Recognition Entity Disambiguation singer Fact Extraction          KB construction Entity Typing singer Elvis
Overview Disambiguation Basic approach Local features Global features 3
4 When was Roosevelt born (the one who oversaw the drafting of the Human Rights)?  Language Model How can the language model make the link between the entities in the question and the entities in the KB? With a little help from my friends... A language model can resort to a knowledge base (KB) for factual information. ?
The Problem of Ambiguity 5 After having recognized and typed entity names, we want to identify the entities. Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
The Problem of Ambiguity 6 ? After having recognized and typed entity names, we want to identify the entities. Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
7 Wikipedia: Eleanor Roosevelt [National Archives] After having recognized and typed entity names, we want to identify the entities. The Problem of Ambiguity Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
Def: Disambiguation 8 (Named Entity) Disambiguation (NED) is the task of mapping an identified mention of an entity in a corpus to the intended entity in a knowledge base. Entity Linking (EL) is the task of entity recognition (NERC) and disambiguation.  Anna_Eleanor_Roosevelt “Roosevelt” label nationality United_States born 1884 occupation diplomat Corpus Knowledge base Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
Def: Disambiguation 9 entity mention surface form: “Roosevelt” This is the unique identifier of the entity in the knowledge base. This is the human‐readable label of the entity. Several entities can have the same label! desired mapping Anna_Eleanor_Roosevelt “Roosevelt” label (Named Entity) Disambiguation (NED) is the task of mapping an identified mention of an entity in a corpus to the intended entity in a knowledge base. Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
Def: Disambiguation 10 This is the human‐readable label of the entity. Several entities can have the same label! “Roosevelt” label (Named Entity) Disambiguation (NED, Entity Linking, EL) is the task of mapping an identified mention of an entity in a corpus to the intended entity in a knowledge base.  This is the unique identifier of the entity in the knowledge base. It can be an illegible string of characters! Q_Roosv_89970AC57F7 >examples Roosevelt oversaw the drafting of the UN Declaration of Human Rights.
Where Disambiguation is needed 11 Disambiguation is essential for information extraction. Roosevelt served as the First Lady of the US during the four terms in office of her husband Franklin D. Roosevelt, making her the longest‐serving First Lady of the United States.