Tehnici de Ingineria Limbajului Natural Curs 4
Tehnologiile textului
Prelucrări semantice
Curs: Dan Cristea
Laboratoare: Diana Trandabăț, Mihaela Onofrei, Daniela Gîfu, Ionuț Pistol
The semantic layer
INITIAL PROCESSING
text SYNTACTIC
PROCESSING SUB-SYNTACTIC
PROCESSING
SEMANTIC
PROCESSING DISCOURSE
PROCESSING PRAGMATIC result
PROCESSING
The semantic layer
WORD-SENSE DISAMBIGUATION
GENERATE ONTOLOGIES INITIAL
PROCESSING
text SYNTACTIC
PROCESSING SUB-SYNTACTIC
PROCESSING
SEMANTIC
PROCESSING DISCOURSE
PROCESSING PRAGMATIC result
PROCESSING
SEMANTIC RELATIONS SEMANTIC SIMILARITIES SEMANTIC ROLES
Identificarea automată a rolurilor semantice
• Despre o acțiune: cine, pe cine, unde, când, în ce scop, cum Grupul NLP vă invită cu drag vineri, 8 martie, în Acvariu,
la o prezentare a proiectelor Metanet4U și ATLAS, pentru a vă mulțumi pentru suportul acordat.
• Teză doctorat Diana Trandabăț: rezultate (disponibile pe METASHARE):
– Resursă adnotată cu roluri semantice
– Program de adnotare automată a rolurilor
Cuvintele îşi precizează sensul în context
• Ion se prinse în horă cu o fată cu cosiţe lungi.
• Când fată iapa ta?
• Mă mai dau o dată pe pârtia roşie.
• I-am dat una peste mână.
• Maria a dat cartea înapoi.
• M-am scos…
• Mi-am scos măseaua de minte.
Ontologies
• Rich conceptual schemas:
– give formally defined meanings to the terms used in
annotations, transforming them into semantic annotations – “Ontologies serve as metadata schemas, providing a
controlled vocabulary of concepts, each with explicitly defined and machine-processable semantics. By defining shared and common domain theories, ontologies help
people and machines to communicate concisely—supporting semantics exchange, not just syntax. Hence, the Semantic
Web’s success and proliferation depends on quickly and cheaply constructing domain-specific ontologies.”
A. Maedche and S. Staab. Ontology learning for the semantic web. IEEE Intelligent Systems, 16(2):72–79, 2001.
Ed Hovy (1998). Combining and Standardizing Large-Scale, Practical Ontologies for Machine Translation and Other Uses . LREC, Granada
Ontologie: definiție formală
• Definiție: O ontologie (de bază) este un tuplu O: = (C; is_a; R; s), unde C este un set ale cărui elemente se numesc concepte, is_a este o
ordine parțială pe C (adică o relație binară is_a Í CC, reflexivă, tranzitivă și antisimetrică), R
este un set ale cărui elemente sunt numite
nume de relații (sau, pe scurt, relații), iar s: R à C+ este o funcție care atribuie fiecărui
nume de relație aritatea sa.
Ontology
• The study of ontology
– traced back to the work of Plato and Aristotle – development of hierarchical categorisations of
different kinds of entities and their distinguishing features:
• the well known “tree of Porphyry” identifies animals and plants as sub-categories of living things distinguished by animals being sensitive, and plants being insensitive
Plasarea conceptului bone într-o ontologie
http://www.ontobee.org/ontology/AEO?iri=http://purl.obolibrary.org/obo/AEO_0000085
OWL – un limbaj de descriere a ontologiilor
• The World Wide Web Consortium (W3C) set
up a standardisation working group to develop a standard for a web ontology language =>
OWL ontology language standard
• OWL is based on Description Logics (DLs): a family of logic-based knowledge
representation formalisms that are
descendants of Semantic Networks and KL- ONE, but that have a formal semantics based on first order logic
Basic things in OWL
Ian Horrocks: Ontologies and the Semantic Web
Concepts (classes)
Instances (individuals) Properties (roles)
Now-a-days web
• Web content consists mainly of distributed hypertext and hypermedia accessed via a
combination of keyword based search and link navigation
• Its simplicity contributed to its large dissemination and use
• But, search engines are still not capable to answer complex queries
Semantic Web
• The goal of semantic web research: to allow the vast range of web-accessible information and services to be more effectively exploited by both humans and automated tools.
• Exploitation of the vast web
– through RDF and OWL: standard formats for the sharing and integration of data and knowledge—
the latter in the form of rich conceptual schemas called ontologies
Examples of queries that necessitate semantic processing
• The list of presidents of EU countries
– for each c, country in EU, find president of c
German writers contemporary with Beethoven
• One possible solution:
– When did Beethoven live? => between T1 and T2 – What are the German writters whose lives
intersect with the interval [T1, T2]?
Key idea behind the semantic web
• Addresses the problem of offering automated
reasoning by giving the machine the possibility to achieve semantic reasoning through annotations added to texts and images.
– through ontologies
• Areas:
– knowledge representation and reasoning, databases, computational linguistics, computer vision, agent
systems
Aplicație: Tutore Inteligent
• Un sistem care să ajute studentul în actul de învățare
– capabil să-și organizeze cunoașterea din domeniu ca o ontologie
– capabil să poarte o conversație asupra domeniului
Funcționare Situația 1
• Am un text dintr-un domeniu medical => un program e capabil să extragă din el o
reprezentare semantică
– Și dacă același lucru îl exprim altfel?
– Dar dacă aproximativ aceeași informație o găsesc în două tratate diferite?
Funcționare Situația 2
• Există o reprezentare semantică a unui domeniu => un program mă ajută să-mi înșusesc acele noțiuni
– pot pune întrebări => sistemul răspunde – sistemul întreabă => eu răspund
– sistemul generează teste cu opțiuni de răspunsuri – sistemul e capabil să gestioneze corect imagini în
Î/R și în teste
Funcționare Situația 3
• Protégé e capabil să lucreze cu ontologii => o interfață îi va adăuga funcționalitatea de a
“citi” un text
– textul descrie o realitate în limbaj natural, care va fi copiată în ontologie
Funcționare Situația 4
• MOODLE este un sistem capabil să asiste în procesul de învățare
– o interfață îi va adăuga capacitatea de a dialoga cu studentul și de a genera teste
Achiziția ontologiei din text
Extragerea de ontologii din texte
Determinarea relației de hyponimie
The bow lute, such as the Bambara
ndang, is plucked and has an individual curved neck for each string.
Lăuta cu arc, precum Bambara ndang, este întinsă și are un gât curbat
individual pentru fiecare strună.
Din: M. Hearst (1992). Automatic Acquisition of Hyponyms from Large Text Corpora, ACL
Patternuri lexicale
NP0 ... such as {NP1, NP2 . . . . (and | or)} NPn implică
for all NPi 1 < i< n, hyponym(NPi, NP0) Din exemplul de mai sus rezultă:
hyponym ("Barmbara ndang", "bow lute”)
Patternuri lexicale
such NP as {NP ,}* {(or | and)} NP ... works by such authors as Herrick, Goldsmith, and Shakespeare.
=>
hyponym("author", "Herrick")
hyponym("author", "Goldsmith") hyponym("author", "Shakespeare")
Patternuri lexicale
NP {, NP}* {,} and other NP
... temples, treasuries, and other important civic buildings.
=>
hyponym("temple", "civic building") hyponym("treasury ", "civic building")
Patternuri lexicale
NP {,} including {NP {,}} * {or | and} NP All common-law countries, including Canada and England ...
=>
hyponym("Canada", "common-law country") hyponym ("England", "common-law country")
Patternuri lexicale
NP {,} especially {NP ,}* {or] and} NP
. . . most European countries, especially France, England, and Spain.
=>
hyponym("France", "European country") hyponym("England", "European country") hyponym("Spain", "European country")
Cum se pot găsi noi patternuri?
1. Decideți asupra unei relații lexicale, R, care este de interes, de exemplu, "grup – membru"
2. Colectați o listă de termeni pentru care această relație este cunoscută, de exemplu, ”Uniunea Europeană – Franța".
– Lista poate fi găsită automat prin bootstrapping pornind de la patternuri găsite manual sau de la un lexic ori o bază de
cunoștințe existente.
3. Găsiți apariții în corpus în care aceste expresii apar
sintactic una lângă cealaltă și înregistrați aceste contexte.
4. Găsiți părțile comune ale acestor contexte și ipotezați că acestea formează tipare care indică relația de interes.
5. Odată ce un pattern nou a fost identificat, utilizați-l pentru a aduna mai multe exemple ale relației țintă și continuați cu Pasul 2.
optional
Cum se pot găsi noi patternuri?
1. Antrenare:
(a) Exportați exemple din toate perechile de hipernime (perechi de cuvinte aflate într-o relație hipernimie / hiponimie) din WordNet.
(b) Pentru fiecare pereche hipernimică, găsiți fraze în care apar ambele cuvinte.
(c) Parsați frazele și extrageți automat patternuri din arborele de parsare, care reprezintă indicii bune pentru relația hipernimică.
(d) Instruiți un clasificator hipernimic bazat pe aceste caracteristici.
2. Test:
(a) Fiind dată o pereche de cuvinte din setul de testare, extrageți
caracteristicile și utilizați clasificatorul pentru a decide dacă perechea de cuvinte se află în relația hipernim / hiponim sau nu.
Din: Snow, Juravsky and Ng (2004). Learning syntactic patterns for automatic hypernym discovery, in NIPS.
Patternuri lexico-sintactice
“...such authors as Herrick and Shakespeare”
Trăsăturile sunt reprezentate ca triplete:
(word1, CATEGORY1:RELATION:CATEGORY2, word2)
unde word1 și word2 sunt rădăcini de cuvinte
Toate căile minime, de lungime ≤ 4, între oricare două substantive dintr-un arbore de dependență
Generalizarea patternurilor:
notația dependențelor extinse
• Reține cea mai scurtă cale: authors – Herrick
• Adaugă sateliți: authors – such
• Distribuie legăturile de dependență în jurul elementelor conjuncționate
Patternuri trasee
(word1, CAT1:REL12:CAT2, word2) (word2, CAT2:REL23:CAT3, word3) (word1, CAT1:REL12:CAT2, word2) (word2, CAT2:REL23:CAT3, word3)
CAT1:REL12:CAT2, word2 , word2, CAT2:REL23:CAT3
word1 REL12 word2 REL23 word3
CAT1 CAT2 CAT3
Representările patternurilor lui Hearst ca trasee de dependență
• NPX and other NPY : (and,U:PUNC:N),-N:CONJ:N, (other,A:MOD:N)
• NPX or other NPY : (or,U:PUNC:N),-N:CONJ:N, (other,A:MOD:N)
• NPY such as NPX: N:PCOMP-N:PREP,such as,such as,PREP:MOD:N
• Such NPY as NPX: N:PCOMP-
N:PREP,as,as,PREP:MOD:N,(such,PREDET:PRE:N)
• NPY including NPX:
N:OBJ:V,include,include,V:I:C,dummy node,dummy node,C:REL:N
• NPY , especially NPX: -N:APPO:N,(especially,A:APPO- MOD:N)
word1, CATEGORY1:RELATION:CATEGORY2, word2)
Clasificator
• Intrare: o pereche ordonată de cuvinte
• Ieșire: o decizie binară cu privire la faptul dacă substantivele sunt în legătură de hipernimie ori nu
• Caracteristici: căi (trasee) pe care primul și ultimul cuvânt sunt înlocuite de categoria N (substantiv)
• Corpus: 6 milioane de fraze de știri
– corpus parsat cu MINIPAR
– sunt extrase toate perechile de substantive care apar în aceeași frază
Clasificator
– 752.311 perechi de substantive au fost etichetate drept Cunoscut-ca-Hipernim sau Cunoscut-ca-Non- Hipernim folosind WN:
• o pereche de substantive (n1, n2) este etichetă Cunoscut-ca- Hipernim dacă n2 este un strămoș al primului sens al lui n1 în taxonomia de hipernimie din WN și dacă relația
hypernym* din WN ține între primele sensuri ca substantive enumerate în WordNet (care reprezintă cele mai “frecvent utilizate" sensuri ale fiecărui cuvânt)
• o pereche de substantive este etichetată Cunoscut-ca-Non- Hipernim dacă ambele substantive sunt conținute în WN, dar niciunul dintre cuvinte nu este un strămoș al celuilalt în taxonomia hipernimică din WN pentru orice sens al fiecărui cuvânt
Evaluarea patternurilor
• Care dintre traseele de dependență (patternuri
lexico-sintactice) se dovedesc a fi caracteristici utile pentru clasificatori:
– a fost construit câte un clasificator binar pentru fiecare pattern: patternul este reprezentativ pentru a clasifica o pereche de substantive ca hipernime / hiponime dacă și numai dacă patternul respectiv apare cel puțin o dată
pentru o pereche de substantice care se întâmplă să fie în relația hipernim / hiponim, conform WN
=> printre multe altele, modelele găsite manual de Hearst au fost "redescoperite"
Descoperirea de noi patternuri
• Alte patternuri de scor mare:
NPY like NPX: N:PCOMP-N:PREP,like,like,PREP:MOD:N NPY called NPX: N:DESC:V,call,call,V:VREL:N
NPX is a NPY: N:S:VBE,be,be,-VBE:PRED:N NPX, a NPY (appositive): N:APPO:N
Combinarea de ontologii
Combinarea (fuziunea) de ontologii
Fuziunea de ontologii – definiție
• Procesul de fuziune ontologică primește în
intrare două (sau mai multe) ontologii sursă și returnează o ontologie care combină
ontologiile sursă date.
Gerd Stumme, Alexander Maedche. Ontology Merging for Federated Ontologies on the Semantic Web
Abordări
• Abordările se bazează pe euristici de potrivire sintactică și semantică care derivă din
comportamentul inginerilor ontologi atunci când se confruntă cu sarcina de a îmbina ontologii.
• Tehnici statistice ori neuronale, care judecă
similaritatea conceptelor și asemănarea brută a instanțelor.
Viziuni comune ori diferite asupra
lumii, combinare
• Fiind dați doi termeni apropiați, câte unul din fiecare ontologie:
– Cei doi termeni sunt echivalenți è ei pot fi direct aliniați;
Ax m Ay
Ay1 Ay2 Ay3
Ay
Ay1 Ay2 Ay3
Cum se pot combina termenii?
Cum se pot combina termenii?
• Fiind dați doi termeni, câte unul din fiecare ontologie:
– Un termen este mai general decât celălalt è termenul mai specific (și toți subordonații, posibil și frații lui) pot fi integrați sub termenul mai general;
Ay
m
Ax1
Ay2 Ay3
Ay
Ay2 Ay3 Ax2 Ax3
Ax1
Ax2 Ax3
• Fiind dați doi termeni, câte unul din fiecare ontologie:
– Termenii sunt incompatibili (i.e., identificarea acestora ar cauza probleme de definire și relaționale între ceilalți
termeni) - caz în care:
(1) unul dintre termeni trebuie respins și nu trebuie încorporat, (2) unul dintre termeni și alții care depind de el trebuie să fie
redefiniți,
(3) trebuie creată o "microteorie" separată, în care termenii și toți ceilalți termeni care depind de ea există în paralel
(4) poate fi încorporată o versiune mai slabă a termenului infracțional, fără definițiile sau relațiile care au cauzat inconsecvența
Cum se pot combina termenii?
Sugestii de euristici de aliniere
1. Potriviri pe șiruri de litere, e.g.:
– Potriviri ale numelor de concepte (cognate
matching): nume suficient de asemănătoare (în aceeași limbă) sunt dovezi că utilizatorii limbii
consideră conceptele respective ca fiind similare.
– Potriviri în definiții (prin procesare de text și măsuri de suprapuneri): definiții similare în limbaj natural ar trebui fie considerate, de asemenea, dovezi ale
similarității conceptelor.
Sugestii de euristici de aliniere
2. Potrivirile ierarhice exploatează structura de taxonomizare a ontologiilor. Ele includ:
– Filtrarea ambiguității prin superconcepte partajate:
atunci când un concept poate fi aliniat la mai multe alternative, se iau în considerare cele ale căror
superconcepte sunt cumva aliniate la superconceptele conceptului țintă.
– Măsuri bazate pe distanțe semantice (număr de legături) (v. (Agirre et al., 1994)).
Măsuri de aliniere
• Potrivire de nume (cognate match): compară numele N1 și N2 ale două concepte.
– Consideră subșiruri descrescătoare ale lui N1, tăind din stânga. Numele formate din cuvinte compuse
sunt împărțite în cuvinte separate, se întoarce scorul maxim. Numele mai mici de 3 litere sunt ignorate.
• NAMESCORE: = numărul de litere
potrivite la pătrat + 20 de puncte dacă cuvintele sunt exact egale sau 10
puncte dacă cuvintele coincid la sfârșit
Măsuri de aliniere:
exemple de sugestii de potriviri de nume cu scoruri
(alignval ‘|S@cuisine| ‘(
(NAME M@LIMOUSINE 26) (NAME M@VINE 19)
(NAME M@MORPHINE 19)
(NAME M@ENGINE-GOVERNOR 19)
(NAME M@BUSINESS-COVERAGE-OF 16) (NAME M@AGRIBUSINESS-ACTIVITY 16) (NAME M@TABLE-LINEN 9)
(NAME M@TRAINER 9) ... 120 more ... )) (alignval ‘|S@Free World| ‘(
(NAME M@PERCENT-OF-WORLD-POPULATION 46) (NAME M@WORLD 35) ))
Măsuri de aliniere
• Potriviri pe definiții: compară definițiile în engleză D1 și D2 ale două concepte. Mai întâi, ambele
definiții sunt separate in cuvinte separate (se îndepărtează apostroafele, limioarele de unire etc.) și toate cuvintele sunt lematizate.
– definiția lui M@FOOD: ("any" "substance" "that" "can" "be"
"metabolized" "organism" "give" "energy" "build" "tissue") – apoi, se calculează 3 valori:
• strength = raportul dintre numărul de cuvinte care apar în ambele definiții și numărul de cuvinte ale definiției cele mai scurte,
• reliability = numărul de cuvinte comune,
• defscore = strength * reliability: .
• DEFSCORE := (Shared(D1,D2) / min{D1,D2})*Shared(D1,D2)
Măsuri de aliniere:
exemple de sugestii de potriviri de definiții cu scoruri
(strength, reliability, score):
(alignval ‘|S@cuisine| ‘(
(DEF M@KITCHEN (0.62 5 3.12)) (DEF M@CHEESE (0.62 5 3.12))
(DEF M@FOODSTUFF (0.62 5 3.12)) (DEF M@PET-FOOD (0.62 5 3.12)) (DEF M@CUTLERY (0.50 4 2.00))
(DEF M@RACETRACK ( 0.37 3 1.12))
(DEF M@COOK ( 0.40 2 0.80)) ... 5 more ... ))
Măsuri de aliniere
• Potrivire TAXONOMICĂ (între ontologiile
SENSUS și MIKROKOSMOS): pentru un anumit concept SENSUS, colectează toate conceptele din MIKROKOSMOS care sunt "mai apropiate"
de 10 link-uri de el. Algoritmul traversează
taxonomia atât în direcțiile superconcept cât și în subconcepte.
– Scorul de potrivire este dat de inversa link- distanței:
– TAXSCORE := 1 / number-of-links
Măsuri de aliniere:
exemple de sugestii de potriviri de taxonomie cu scoruri
(alignval ‘|S@end>come out|
‘((TAX M@SOCIAL-EVENT 0.17) (TAX M@EMANATE 0.17)
(TAX M@EMIT-LIGHT 0.17) (TAX M@EMIT-SOUND 0.17)
(TAX M@REFLECT-LIGHT 0.17) (TAX M@EXTRACT 0.17)
(TAX M@APPLY-FORCE 0.20) (TAX M@PACK 0.20)
... 22 more ...
))
Combinarea scorurilor
• Caracteristicile formulelor de combinare:
– să crească cu valori în creștere ale NAME, DEF și TAX – să normalizeze scorurile euristicilor
– să diminueze tendința scorurilor NAME de a crește rapid
– să atenuarea tendința scorurilor de TAXONOMIE de diminuare rapidă
– să întoarcă un scor nenul dacă cel puțin o euristică întoarce un scor nenul
• SCORE := sqrt(NAMESCORE) * DEFSCORE * (10 * TAXSCORE)
cu grija că dacă NAMESCORE sau DEFSCORE sunt zero, ele sunt înlocuite prin 1, și dacă TAXSCORE e 0, el e înlocuit prin 0.01.
Uzual, scorurile de aliniere se plasează în scara 0 – 16.
Protégé
• Mediu online de construire și editare de ontologii și creare de sisteme inteligente
– Protégé Desktop supports creation and editing of one or more ontologies in a single workspace via a completely customizable user interface.
– Visualization tools allow for interactive navigation of ontology relationships.
– Advanced explanation support aids in tracking down inconsistencies.
– Operations available include: ontology merging, moving axioms between ontologies, rename of multiple entities, and more.
https://protege.stanford.edu/
Protégé
Representing medical knowledge in Protégé
“Fluxul sanghin cerebral la adult este de circa 750-1000ml/min, reprezentând 15-20% din debitul cardiac.”
Generare de teste plecând de la o
ontologie
Generarea întrebărilor
Generarea întrebărior
(question generation – QG):
un subdomeniu al IA
• Generarea de întrebări multi-variante din ontologii (MCQG)
– pentru evaluarea studenților – beneficii pentru instructori:
• sarcina de a construi manual MCQ pentru teste este greoaie și consumatoare de timp
• este adesea dificil să se dezvolte MCQ de înaltă calitate
– sisteme de MCQ care pleacă de la ontologii reușesc să genereze articole MCQ
• DAR: cât de bine slujesc aceste sisteme procesul educațional?
Generatorul de întrebări
• Scopul întrebărilor:
– evaluare,
– revizuiri sau întrebări de studiu, – exercițiul de a pune întrebări,
– întrebări de rezolvare a problemelor,
– întrebări generale într-un domeniu specific, cum ar fi turismul,
– sau întrebări dintr-un domeniu deschis
Sisteme de QG
• Pe bază de sintaxă (unele dintre primele):
– parser de limbaj natural folosit pentru a analiza sintaxa frazei și a identifica componentele majore care pot fi folosite pentru a forma o întrebare.
– dezavantaje:
• propoziții sintactic ambigue (singura modalitate de a analiza corect astfel de propoziții este de a înțelege semnificația lor)
• sistemul este dependent de limbă
– avantaje:
• este independent de domeniu, astfel încât pentru a formula o
întrebare în orice domeniu trebuie formulată o propoziție în limba naturală dată
QG systems
• Abordări bazate pe semantică - de obicei,
dependente de domeniu: folosesc un model
semantic al domeniului pentru a genera întrebări.
– OntAWare:
• folosește o ontologie și generează întrebări bazate pe
cunoașterea relațiilor dintre clasă-subclasă și dintre clasă- instanță.
• oferă, printre alte funcționalități pentru redactarea conținutului educațional, generarea semiautomată a obiectelor de învățare, inclusiv întrebări.
• folosește relațiile de subsumare între clase pentru a genera întrebări, cum ar fi: "Care dintre următoarele elemente este (sau nu este) un exemplu al conceptului X?”
Patternuri în generarea testelor
• Teste generate pe baza cunoștințelor de domeniu exprimate în ontologii OWL:
– un număr de șabloane definite pentru întrebări sunt utilizate de sistem pentru a genera
elementele de testare
Žitko B, Stankov S, Rosić M, Grubišić A. (2009) Dynamic test generation over ontology-based knowledge representation in authoring shell. Expert Systems with Applications. 36:8185–8196.
Exemple de patternuri care generează teste
Care dintre următoarele elemente:
shuffle(someOf(desc(B)),
someOf(desc(siblingOf(B))) sunt B-uri?
B1
B C
A
B2 B3 C1 C2
Exemple de patternuri care generează teste
Care dintre următoarele propietăți:
setOfPropertiesOf(B) caracterizează:
random(descOf(B))
și care sunt valorile corespunzătoare?
B1
B VP2B
B2 B3
property P2
VP1B
property P1
VP2B2
property P2
Chatbot
MOODLE
• Mediu educațional open-source pentru crearea de cursuri online și educație la distanță
• Moodle (modular object-oriented dynamic learning environment) allows for extending and tailoring learning environments using community sourced plugins (Wikipedia)
https://moodle.org/
Generate student exam tests from medical manuals
3rd year AI term project October 2017 – January 2018
Relații semantice
QuoVadis – a corpus of
book characters and their relations
• H. Sienkiewicz’s Quo Vadis
• A corpus and a technology
– The corpus: developed with master students in CL:
• entities of type person and god
• relations: coreference, kinship, affective, social
– The technology: recognising entities and relations
I T.A.K.E Unconference, 7 June 2018
A corpus semantic entities and relations
• Type of entities:
– persons – gods
– groups of persons and gods – body parts
• Semantic relations among entities of these types
75
Relations
• Anaphoric relations: co-referential;
• Non-anaphoric relations:
– kinship;
– affective;
– social.
76
Anaphoric relations
• coref
• coref-interpret
• member-of, has-as-member (inverse)
• isa, class-of (inverse)
• part-of, has-as-part (inverse)
• subgroup-of, has-as-subgroup (inverse)
• has-name, name-of (inverse)
Example:
[Lygia]1 was unable to answer, for weeping seized [her]2 anew. Acte gathered [the maiden]3 to her bosom, and strove to calm [her]4 excitement.
[2] coref [1]; [3] coref-interpret [2]; [4] coref [3]
77
Kinship relations
• parent-of
• child-of (inverse of parent-of)
• grandparent-of and grandchild-of (inverse)
• sibling (symmetrical)
• ant-uncle-of, nephew-of (inverse relation)
• cousin-of (symmetrical)
• spouse-of (symmetrical)
• unknown
Example:
"Pardon me, Lygia. For me thou art [<the daughter> [of a king]2]1 and [<the adopted child> [of Plautius]4]3.“
[1] child-of [2]; [3] child-of [4]
78
Social relations
• superior-of
• inferior-of
• in cooperation-with
• colleague-of
• in competition-with
• opposite-to
Example:
[Petronius]1…but to [his]2 misfortune [he]3 <surpassed in conversation> [Cæsar himself]4, hence [he]5 roused [his]6 jealousy.
[3] in competition-with [4];
[3] coref [2]; [5] coref [4]; [6] coref [4]
79
Affective relations
• love
• loved-by
• rec-love
• hate
• hated by
• upset
• friendship
• worship
Example:
Vinicius entered Lygia's dungeon and remained there till daylight…Both changed by degrees into sad souls <in love> with [each]1 [other]2.
[1] rec-love [2]
80
Relations
• Anaphoric: coref
John met Maria on the ski slope. He raced her.
anafor antecedent
81
Relations
• Anaphoric: coref
John met Maria on the ski slope. He raced her .
anafor antecedent
82
Arguments and triggers in relations
• Kinship: parent-of
… her father …
trigger destination
source
83
Arguments and triggers in relations
• Social: inferior-of
Cesar
’
s principal courtiers …trigger
destination source
84
Arguments and triggers in relations
• Affective: worship
Lygia dropped on her knees to implore someone else .
trigger
destination source
85
Entities
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
86
Anaphoric relations: coref
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
87
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
Anaphoric relations: coref
88
Anaphoric relations: coref
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
89
Anaphoric relations: class-of
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
90
Kinship relations: sibling
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
91
Kinship relations: child-of
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
92
Kinship relations: parent-of
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
93
Kinship relations: spouse-of
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
94
Social relations: inferior-of
Petroniu…
Vinicius was
the son of his oldest sister ,
who years before had married his father ,
a man of consular dignity from the time of Tiberius .
95
General statistics over the corpus
• 7,281 sentences
• 146,822 tokens, punctuation included
• 171,029 tokens summed up under all relations
• 24,636 entity mentions
• 22,301 referential relations
• 755 AKS relations (Affective + Kinship + Social)
• 752 triggers
96
Example: affective relations love and worship
97
Example: affective relations fear-of and hate
98
Vinicius’ links with other characters
99
Semantic relations involving Vinicius
100