• Nu S-Au Găsit Rezultate

The semantic layer

N/A
N/A
Protected

Academic year: 2022

Share "The semantic layer"

Copied!
100
0
0

Text complet

(1)

Tehnici de Ingineria Limbajului Natural Curs 4

Tehnologiile textului

Prelucrări semantice

Curs: Dan Cristea

Laboratoare: Diana Trandabăț, Mihaela Onofrei, Daniela Gîfu, Ionuț Pistol

(2)

The semantic layer

INITIAL PROCESSING

text SYNTACTIC

PROCESSING SUB-SYNTACTIC

PROCESSING

SEMANTIC

PROCESSING DISCOURSE

PROCESSING PRAGMATIC result

PROCESSING

(3)

The semantic layer

WORD-SENSE DISAMBIGUATION

GENERATE ONTOLOGIES INITIAL

PROCESSING

text SYNTACTIC

PROCESSING SUB-SYNTACTIC

PROCESSING

SEMANTIC

PROCESSING DISCOURSE

PROCESSING PRAGMATIC result

PROCESSING

SEMANTIC RELATIONS SEMANTIC SIMILARITIES SEMANTIC ROLES

(4)

Identificarea automată a rolurilor semantice

Despre o acțiune: cine, pe cine, unde, când, în ce scop, cum Grupul NLP vă invită cu drag vineri, 8 martie, în Acvariu,

la o prezentare a proiectelor Metanet4U și ATLAS, pentru a vă mulțumi pentru suportul acordat.

Teză doctorat Diana Trandabăț: rezultate (disponibile pe METASHARE):

Resursă adnotată cu roluri semantice

Program de adnotare automată a rolurilor

(5)

Cuvintele îşi precizează sensul în context

Ion se prinse în horă cu o fată cu cosiţe lungi.

Când fată iapa ta?

Mă mai dau o dată pe pârtia roşie.

I-am dat una peste mână.

Maria a dat cartea înapoi.

M-am scos…

Mi-am scos măseaua de minte.

(6)

Ontologies

Rich conceptual schemas:

give formally defined meanings to the terms used in

annotations, transforming them into semantic annotations “Ontologies serve as metadata schemas, providing a

controlled vocabulary of concepts, each with explicitly defined and machine-processable semantics. By defining shared and common domain theories, ontologies help

people and machines to communicate concisely—supporting semantics exchange, not just syntax. Hence, the Semantic

Web’s success and proliferation depends on quickly and cheaply constructing domain-specific ontologies.”

A. Maedche and S. Staab. Ontology learning for the semantic web. IEEE Intelligent Systems, 16(2):72–79, 2001.

Ed Hovy (1998). Combining and Standardizing Large-Scale, Practical Ontologies for Machine Translation and Other Uses . LREC, Granada

(7)

Ontologie: definiție formală

Definiție: O ontologie (de bază) este un tuplu O: = (C; is_a; R; s), unde C este un set ale cărui elemente se numesc concepte, is_a este o

ordine parțială pe C (adică o relație binară is_a Í CC, reflexivă, tranzitivă și antisimetrică), R

este un set ale cărui elemente sunt numite

nume de relații (sau, pe scurt, relații), iar s: R à C+ este o funcție care atribuie fiecărui

nume de relație aritatea sa.

(8)

Ontology

• The study of ontology

traced back to the work of Plato and Aristotle development of hierarchical categorisations of

different kinds of entities and their distinguishing features:

the well known “tree of Porphyry” identifies animals and plants as sub-categories of living things distinguished by animals being sensitive, and plants being insensitive

(9)
(10)

Plasarea conceptului bone într-o ontologie

http://www.ontobee.org/ontology/AEO?iri=http://purl.obolibrary.org/obo/AEO_0000085

(11)

OWL – un limbaj de descriere a ontologiilor

• The World Wide Web Consortium (W3C) set

up a standardisation working group to develop a standard for a web ontology language =>

OWL ontology language standard

• OWL is based on Description Logics (DLs): a family of logic-based knowledge

representation formalisms that are

descendants of Semantic Networks and KL- ONE, but that have a formal semantics based on first order logic

(12)

Basic things in OWL

Ian Horrocks: Ontologies and the Semantic Web

Concepts (classes)

Instances (individuals) Properties (roles)

(13)

Now-a-days web

• Web content consists mainly of distributed hypertext and hypermedia accessed via a

combination of keyword based search and link navigation

• Its simplicity contributed to its large dissemination and use

• But, search engines are still not capable to answer complex queries

(14)

Semantic Web

• The goal of semantic web research: to allow the vast range of web-accessible information and services to be more effectively exploited by both humans and automated tools.

• Exploitation of the vast web

through RDF and OWL: standard formats for the sharing and integration of data and knowledge—

the latter in the form of rich conceptual schemas called ontologies

(15)

Examples of queries that necessitate semantic processing

• The list of presidents of EU countries

for each c, country in EU, find president of c

(16)

German writers contemporary with Beethoven

• One possible solution:

When did Beethoven live? => between T1 and T2 What are the German writters whose lives

intersect with the interval [T1, T2]?

(17)

Key idea behind the semantic web

• Addresses the problem of offering automated

reasoning by giving the machine the possibility to achieve semantic reasoning through annotations added to texts and images.

through ontologies

• Areas:

knowledge representation and reasoning, databases, computational linguistics, computer vision, agent

systems

(18)

Aplicație: Tutore Inteligent

• Un sistem care să ajute studentul în actul de învățare

capabil să-și organizeze cunoașterea din domeniu ca o ontologie

capabil să poarte o conversație asupra domeniului

(19)

Funcționare Situația 1

• Am un text dintr-un domeniu medical => un program e capabil să extragă din el o

reprezentare semantică

Și dacă același lucru îl exprim altfel?

Dar dacă aproximativ aceeași informație o găsesc în două tratate diferite?

(20)

Funcționare Situația 2

• Există o reprezentare semantică a unui domeniu => un program mă ajută să-mi înșusesc acele noțiuni

pot pune întrebări => sistemul răspunde sistemul întreabă => eu răspund

sistemul generează teste cu opțiuni de răspunsuri sistemul e capabil să gestioneze corect imagini în

Î/R și în teste

(21)

Funcționare Situația 3

• Protégé e capabil să lucreze cu ontologii => o interfață îi va adăuga funcționalitatea de a

“citi” un text

textul descrie o realitate în limbaj natural, care va fi copiată în ontologie

(22)

Funcționare Situația 4

• MOODLE este un sistem capabil să asiste în procesul de învățare

o interfață îi va adăuga capacitatea de a dialoga cu studentul și de a genera teste

(23)

Achiziția ontologiei din text

(24)

Extragerea de ontologii din texte

(25)

Determinarea relației de hyponimie

The bow lute, such as the Bambara

ndang, is plucked and has an individual curved neck for each string.

Lăuta cu arc, precum Bambara ndang, este întinsă și are un gât curbat

individual pentru fiecare strună.

Din: M. Hearst (1992). Automatic Acquisition of Hyponyms from Large Text Corpora, ACL

(26)

Patternuri lexicale

NP0 ... such as {NP1, NP2 . . . . (and | or)} NPn implică

for all NPi 1 < i< n, hyponym(NPi, NP0) Din exemplul de mai sus rezultă:

hyponym ("Barmbara ndang", "bow lute”)

(27)

Patternuri lexicale

such NP as {NP ,}* {(or | and)} NP ... works by such authors as Herrick, Goldsmith, and Shakespeare.

=>

hyponym("author", "Herrick")

hyponym("author", "Goldsmith") hyponym("author", "Shakespeare")

(28)

Patternuri lexicale

NP {, NP}* {,} and other NP

... temples, treasuries, and other important civic buildings.

=>

hyponym("temple", "civic building") hyponym("treasury ", "civic building")

(29)

Patternuri lexicale

NP {,} including {NP {,}} * {or | and} NP All common-law countries, including Canada and England ...

=>

hyponym("Canada", "common-law country") hyponym ("England", "common-law country")

(30)

Patternuri lexicale

NP {,} especially {NP ,}* {or] and} NP

. . . most European countries, especially France, England, and Spain.

=>

hyponym("France", "European country") hyponym("England", "European country") hyponym("Spain", "European country")

(31)

Cum se pot găsi noi patternuri?

1. Decideți asupra unei relații lexicale, R, care este de interes, de exemplu, "grup – membru"

2. Colectați o listă de termeni pentru care această relație este cunoscută, de exemplu, ”Uniunea Europeană – Franța".

Lista poate fi găsită automat prin bootstrapping pornind de la patternuri găsite manual sau de la un lexic ori o bază de

cunoștințe existente.

3. Găsiți apariții în corpus în care aceste expresii apar

sintactic una lângă cealaltă și înregistrați aceste contexte.

4. Găsiți părțile comune ale acestor contexte și ipotezați că acestea formează tipare care indică relația de interes.

5. Odată ce un pattern nou a fost identificat, utilizați-l pentru a aduna mai multe exemple ale relației țintă și continuați cu Pasul 2.

optional

(32)

Cum se pot găsi noi patternuri?

1. Antrenare:

(a) Exportați exemple din toate perechile de hipernime (perechi de cuvinte aflate într-o relație hipernimie / hiponimie) din WordNet.

(b) Pentru fiecare pereche hipernimică, găsiți fraze în care apar ambele cuvinte.

(c) Parsați frazele și extrageți automat patternuri din arborele de parsare, care reprezintă indicii bune pentru relația hipernimică.

(d) Instruiți un clasificator hipernimic bazat pe aceste caracteristici.

2. Test:

(a) Fiind dată o pereche de cuvinte din setul de testare, extrageți

caracteristicile și utilizați clasificatorul pentru a decide dacă perechea de cuvinte se află în relația hipernim / hiponim sau nu.

Din: Snow, Juravsky and Ng (2004). Learning syntactic patterns for automatic hypernym discovery, in NIPS.

(33)

Patternuri lexico-sintactice

“...such authors as Herrick and Shakespeare”

Trăsăturile sunt reprezentate ca triplete:

(word1, CATEGORY1:RELATION:CATEGORY2, word2)

unde word1 și word2 sunt rădăcini de cuvinte

Toate căile minime, de lungime ≤ 4, între oricare două substantive dintr-un arbore de dependență

(34)

Generalizarea patternurilor:

notația dependențelor extinse

• Reține cea mai scurtă cale: authors – Herrick

• Adaugă sateliți: authors – such

• Distribuie legăturile de dependență în jurul elementelor conjuncționate

(35)

Patternuri trasee

(word1, CAT1:REL12:CAT2, word2) (word2, CAT2:REL23:CAT3, word3) (word1, CAT1:REL12:CAT2, word2) (word2, CAT2:REL23:CAT3, word3)

CAT1:REL12:CAT2, word2 , word2, CAT2:REL23:CAT3

word1 REL12 word2 REL23 word3

CAT1 CAT2 CAT3

(36)

Representările patternurilor lui Hearst ca trasee de dependență

NPX and other NPY : (and,U:PUNC:N),-N:CONJ:N, (other,A:MOD:N)

NPX or other NPY : (or,U:PUNC:N),-N:CONJ:N, (other,A:MOD:N)

NPY such as NPX: N:PCOMP-N:PREP,such as,such as,PREP:MOD:N

Such NPY as NPX: N:PCOMP-

N:PREP,as,as,PREP:MOD:N,(such,PREDET:PRE:N)

NPY including NPX:

N:OBJ:V,include,include,V:I:C,dummy node,dummy node,C:REL:N

NPY , especially NPX: -N:APPO:N,(especially,A:APPO- MOD:N)

word1, CATEGORY1:RELATION:CATEGORY2, word2)

(37)

Clasificator

Intrare: o pereche ordonată de cuvinte

Ieșire: o decizie binară cu privire la faptul dacă substantivele sunt în legătură de hipernimie ori nu

Caracteristici: căi (trasee) pe care primul și ultimul cuvânt sunt înlocuite de categoria N (substantiv)

Corpus: 6 milioane de fraze de știri

corpus parsat cu MINIPAR

sunt extrase toate perechile de substantive care apar în aceeași frază

(38)

Clasificator

752.311 perechi de substantive au fost etichetate drept Cunoscut-ca-Hipernim sau Cunoscut-ca-Non- Hipernim folosind WN:

o pereche de substantive (n1, n2) este etichetă Cunoscut-ca- Hipernim dacă n2 este un strămoș al primului sens al lui n1 în taxonomia de hipernimie din WN și dacă relația

hypernym* din WN ține între primele sensuri ca substantive enumerate în WordNet (care reprezintă cele mai “frecvent utilizate" sensuri ale fiecărui cuvânt)

o pereche de substantive este etichetată Cunoscut-ca-Non- Hipernim dacă ambele substantive sunt conținute în WN, dar niciunul dintre cuvinte nu este un strămoș al celuilalt în taxonomia hipernimică din WN pentru orice sens al fiecărui cuvânt

(39)

Evaluarea patternurilor

Care dintre traseele de dependență (patternuri

lexico-sintactice) se dovedesc a fi caracteristici utile pentru clasificatori:

a fost construit câte un clasificator binar pentru fiecare pattern: patternul este reprezentativ pentru a clasifica o pereche de substantive ca hipernime / hiponime dacă și numai dacă patternul respectiv apare cel puțin o dată

pentru o pereche de substantice care se întâmplă să fie în relația hipernim / hiponim, conform WN

=> printre multe altele, modelele găsite manual de Hearst au fost "redescoperite"

(40)

Descoperirea de noi patternuri

• Alte patternuri de scor mare:

NPY like NPX: N:PCOMP-N:PREP,like,like,PREP:MOD:N NPY called NPX: N:DESC:V,call,call,V:VREL:N

NPX is a NPY: N:S:VBE,be,be,-VBE:PRED:N NPX, a NPY (appositive): N:APPO:N

(41)

Combinarea de ontologii

(42)

Combinarea (fuziunea) de ontologii

(43)

Fuziunea de ontologii – definiție

• Procesul de fuziune ontologică primește în

intrare două (sau mai multe) ontologii sursă și returnează o ontologie care combină

ontologiile sursă date.

Gerd Stumme, Alexander Maedche. Ontology Merging for Federated Ontologies on the Semantic Web

(44)

Abordări

Abordările se bazează pe euristici de potrivire sintactică și semantică care derivă din

comportamentul inginerilor ontologi atunci când se confruntă cu sarcina de a îmbina ontologii.

Tehnici statistice ori neuronale, care judecă

similaritatea conceptelor și asemănarea brută a instanțelor.

(45)

Viziuni comune ori diferite asupra

lumii, combinare

(46)

• Fiind dați doi termeni apropiați, câte unul din fiecare ontologie:

Cei doi termeni sunt echivalenți è ei pot fi direct aliniați;

Ax m Ay

Ay1 Ay2 Ay3

Ay

Ay1 Ay2 Ay3

Cum se pot combina termenii?

(47)

Cum se pot combina termenii?

• Fiind dați doi termeni, câte unul din fiecare ontologie:

Un termen este mai general decât celălalt è termenul mai specific (și toți subordonații, posibil și frații lui) pot fi integrați sub termenul mai general;

Ay

m

Ax1

Ay2 Ay3

Ay

Ay2 Ay3 Ax2 Ax3

Ax1

Ax2 Ax3

(48)

Fiind dați doi termeni, câte unul din fiecare ontologie:

Termenii sunt incompatibili (i.e., identificarea acestora ar cauza probleme de definire și relaționale între ceilalți

termeni) - caz în care:

(1) unul dintre termeni trebuie respins și nu trebuie încorporat, (2) unul dintre termeni și alții care depind de el trebuie să fie

redefiniți,

(3) trebuie creată o "microteorie" separată, în care termenii și toți ceilalți termeni care depind de ea există în paralel

(4) poate fi încorporată o versiune mai slabă a termenului infracțional, fără definițiile sau relațiile care au cauzat inconsecvența

Cum se pot combina termenii?

(49)

Sugestii de euristici de aliniere

1. Potriviri pe șiruri de litere, e.g.:

Potriviri ale numelor de concepte (cognate

matching): nume suficient de asemănătoare (în aceeași limbă) sunt dovezi că utilizatorii limbii

consideră conceptele respective ca fiind similare.

Potriviri în definiții (prin procesare de text și măsuri de suprapuneri): definiții similare în limbaj natural ar trebui fie considerate, de asemenea, dovezi ale

similarității conceptelor.

(50)

Sugestii de euristici de aliniere

2. Potrivirile ierarhice exploatează structura de taxonomizare a ontologiilor. Ele includ:

Filtrarea ambiguității prin superconcepte partajate:

atunci când un concept poate fi aliniat la mai multe alternative, se iau în considerare cele ale căror

superconcepte sunt cumva aliniate la superconceptele conceptului țintă.

Măsuri bazate pe distanțe semantice (număr de legături) (v. (Agirre et al., 1994)).

(51)

Măsuri de aliniere

• Potrivire de nume (cognate match): compară numele N1 și N2 ale două concepte.

Consideră subșiruri descrescătoare ale lui N1, tăind din stânga. Numele formate din cuvinte compuse

sunt împărțite în cuvinte separate, se întoarce scorul maxim. Numele mai mici de 3 litere sunt ignorate.

NAMESCORE: = numărul de litere

potrivite la pătrat + 20 de puncte dacă cuvintele sunt exact egale sau 10

puncte dacă cuvintele coincid la sfârșit

(52)

Măsuri de aliniere:

exemple de sugestii de potriviri de nume cu scoruri

(alignval ‘|S@cuisine| ‘(

(NAME M@LIMOUSINE 26) (NAME M@VINE 19)

(NAME M@MORPHINE 19)

(NAME M@ENGINE-GOVERNOR 19)

(NAME M@BUSINESS-COVERAGE-OF 16) (NAME M@AGRIBUSINESS-ACTIVITY 16) (NAME M@TABLE-LINEN 9)

(NAME M@TRAINER 9) ... 120 more ... )) (alignval ‘|S@Free World| ‘(

(NAME M@PERCENT-OF-WORLD-POPULATION 46) (NAME M@WORLD 35) ))

(53)

Măsuri de aliniere

• Potriviri pe definiții: compară definițiile în engleză D1 și D2 ale două concepte. Mai întâi, ambele

definiții sunt separate in cuvinte separate (se îndepărtează apostroafele, limioarele de unire etc.) și toate cuvintele sunt lematizate.

definiția lui M@FOOD: ("any" "substance" "that" "can" "be"

"metabolized" "organism" "give" "energy" "build" "tissue") apoi, se calculează 3 valori:

strength = raportul dintre numărul de cuvinte care apar în ambele definiții și numărul de cuvinte ale definiției cele mai scurte,

reliability = numărul de cuvinte comune,

defscore = strength * reliability: .

DEFSCORE := (Shared(D1,D2) / min{D1,D2})*Shared(D1,D2)

(54)

Măsuri de aliniere:

exemple de sugestii de potriviri de definiții cu scoruri

(strength, reliability, score):

(alignval ‘|S@cuisine| ‘(

(DEF M@KITCHEN (0.62 5 3.12)) (DEF M@CHEESE (0.62 5 3.12))

(DEF M@FOODSTUFF (0.62 5 3.12)) (DEF M@PET-FOOD (0.62 5 3.12)) (DEF M@CUTLERY (0.50 4 2.00))

(DEF M@RACETRACK ( 0.37 3 1.12))

(DEF M@COOK ( 0.40 2 0.80)) ... 5 more ... ))

(55)

Măsuri de aliniere

• Potrivire TAXONOMICĂ (între ontologiile

SENSUS și MIKROKOSMOS): pentru un anumit concept SENSUS, colectează toate conceptele din MIKROKOSMOS care sunt "mai apropiate"

de 10 link-uri de el. Algoritmul traversează

taxonomia atât în direcțiile superconcept cât și în subconcepte.

Scorul de potrivire este dat de inversa link- distanței:

TAXSCORE := 1 / number-of-links

(56)

Măsuri de aliniere:

exemple de sugestii de potriviri de taxonomie cu scoruri

(alignval ‘|S@end>come out|

‘((TAX M@SOCIAL-EVENT 0.17) (TAX M@EMANATE 0.17)

(TAX M@EMIT-LIGHT 0.17) (TAX M@EMIT-SOUND 0.17)

(TAX M@REFLECT-LIGHT 0.17) (TAX M@EXTRACT 0.17)

(TAX M@APPLY-FORCE 0.20) (TAX M@PACK 0.20)

... 22 more ...

))

(57)

Combinarea scorurilor

Caracteristicile formulelor de combinare:

să crească cu valori în creștere ale NAME, DEF și TAX să normalizeze scorurile euristicilor

să diminueze tendința scorurilor NAME de a crește rapid

să atenuarea tendința scorurilor de TAXONOMIE de diminuare rapidă

să întoarcă un scor nenul dacă cel puțin o euristică întoarce un scor nenul

SCORE := sqrt(NAMESCORE) * DEFSCORE * (10 * TAXSCORE)

cu grija că dacă NAMESCORE sau DEFSCORE sunt zero, ele sunt înlocuite prin 1, și dacă TAXSCORE e 0, el e înlocuit prin 0.01.

Uzual, scorurile de aliniere se plasează în scara 0 – 16.

(58)

Protégé

• Mediu online de construire și editare de ontologii și creare de sisteme inteligente

Protégé Desktop supports creation and editing of one or more ontologies in a single workspace via a completely customizable user interface.

Visualization tools allow for interactive navigation of ontology relationships.

Advanced explanation support aids in tracking down inconsistencies.

Operations available include: ontology merging, moving axioms between ontologies, rename of multiple entities, and more.

https://protege.stanford.edu/

(59)

Protégé

(60)

Representing medical knowledge in Protégé

“Fluxul sanghin cerebral la adult este de circa 750-1000ml/min, reprezentând 15-20% din debitul cardiac.”

(61)

Generare de teste plecând de la o

ontologie

(62)

Generarea întrebărilor

(63)

Generarea întrebărior

(question generation – QG):

un subdomeniu al IA

Generarea de întrebări multi-variante din ontologii (MCQG)

pentru evaluarea studenților beneficii pentru instructori:

sarcina de a construi manual MCQ pentru teste este greoaie și consumatoare de timp

este adesea dificil să se dezvolte MCQ de înaltă calitate

sisteme de MCQ care pleacă de la ontologii reușesc să genereze articole MCQ

DAR: cât de bine slujesc aceste sisteme procesul educațional?

(64)

Generatorul de întrebări

• Scopul întrebărilor:

evaluare,

revizuiri sau întrebări de studiu, exercițiul de a pune întrebări,

întrebări de rezolvare a problemelor,

întrebări generale într-un domeniu specific, cum ar fi turismul,

sau întrebări dintr-un domeniu deschis

(65)

Sisteme de QG

Pe bază de sintaxă (unele dintre primele):

parser de limbaj natural folosit pentru a analiza sintaxa frazei și a identifica componentele majore care pot fi folosite pentru a forma o întrebare.

dezavantaje:

propoziții sintactic ambigue (singura modalitate de a analiza corect astfel de propoziții este de a înțelege semnificația lor)

sistemul este dependent de limbă

avantaje:

este independent de domeniu, astfel încât pentru a formula o

întrebare în orice domeniu trebuie formulată o propoziție în limba naturală dată

(66)

QG systems

Abordări bazate pe semantică - de obicei,

dependente de domeniu: folosesc un model

semantic al domeniului pentru a genera întrebări.

OntAWare:

folosește o ontologie și generează întrebări bazate pe

cunoașterea relațiilor dintre clasă-subclasă și dintre clasă- instanță.

oferă, printre alte funcționalități pentru redactarea conținutului educațional, generarea semiautomată a obiectelor de învățare, inclusiv întrebări.

folosește relațiile de subsumare între clase pentru a genera întrebări, cum ar fi: "Care dintre următoarele elemente este (sau nu este) un exemplu al conceptului X?”

(67)

Patternuri în generarea testelor

• Teste generate pe baza cunoștințelor de domeniu exprimate în ontologii OWL:

un număr de șabloane definite pentru întrebări sunt utilizate de sistem pentru a genera

elementele de testare

Žitko B, Stankov S, Rosić M, Grubišić A. (2009) Dynamic test generation over ontology-based knowledge representation in authoring shell. Expert Systems with Applications. 36:8185–8196.

(68)

Exemple de patternuri care generează teste

Care dintre următoarele elemente:

shuffle(someOf(desc(B)),

someOf(desc(siblingOf(B))) sunt B-uri?

B1

B C

A

B2 B3 C1 C2

(69)

Exemple de patternuri care generează teste

Care dintre următoarele propietăți:

setOfPropertiesOf(B) caracterizează:

random(descOf(B))

și care sunt valorile corespunzătoare?

B1

B VP2B

B2 B3

property P2

VP1B

property P1

VP2B2

property P2

(70)

Chatbot

(71)

MOODLE

• Mediu educațional open-source pentru crearea de cursuri online și educație la distanță

• Moodle (modular object-oriented dynamic learning environment) allows for extending and tailoring learning environments using community sourced plugins (Wikipedia)

https://moodle.org/

(72)

Generate student exam tests from medical manuals

3rd year AI term project October 2017 – January 2018

(73)

Relații semantice

(74)

QuoVadis – a corpus of

book characters and their relations

• H. Sienkiewicz’s Quo Vadis

• A corpus and a technology

The corpus: developed with master students in CL:

entities of type person and god

relations: coreference, kinship, affective, social

The technology: recognising entities and relations

I T.A.K.E Unconference, 7 June 2018

(75)

A corpus semantic entities and relations

• Type of entities:

persons gods

groups of persons and gods body parts

• Semantic relations among entities of these types

75

(76)

Relations

Anaphoric relations: co-referential;

Non-anaphoric relations:

kinship;

affective;

social.

76

(77)

Anaphoric relations

coref

coref-interpret

member-of, has-as-member (inverse)

isa, class-of (inverse)

part-of, has-as-part (inverse)

subgroup-of, has-as-subgroup (inverse)

has-name, name-of (inverse)

Example:

[Lygia]1 was unable to answer, for weeping seized [her]2 anew. Acte gathered [the maiden]3 to her bosom, and strove to calm [her]4 excitement.

[2] coref [1]; [3] coref-interpret [2]; [4] coref [3]

77

(78)

Kinship relations

parent-of

child-of (inverse of parent-of)

grandparent-of and grandchild-of (inverse)

sibling (symmetrical)

ant-uncle-of, nephew-of (inverse relation)

cousin-of (symmetrical)

spouse-of (symmetrical)

unknown

Example:

"Pardon me, Lygia. For me thou art [<the daughter> [of a king]2]1 and [<the adopted child> [of Plautius]4]3.“

[1] child-of [2]; [3] child-of [4]

78

(79)

Social relations

superior-of

inferior-of

in cooperation-with

colleague-of

in competition-with

opposite-to

Example:

[Petronius]1…but to [his]2 misfortune [he]3 <surpassed in conversation> [Cæsar himself]4, hence [he]5 roused [his]6 jealousy.

[3] in competition-with [4];

[3] coref [2]; [5] coref [4]; [6] coref [4]

79

(80)

Affective relations

love

loved-by

rec-love

hate

hated by

upset

friendship

worship

Example:

Vinicius entered Lygia's dungeon and remained there till daylight…Both changed by degrees into sad souls <in love> with [each]1 [other]2.

[1] rec-love [2]

80

(81)

Relations

• Anaphoric: coref

John met Maria on the ski slope. He raced her.

anafor antecedent

81

(82)

Relations

• Anaphoric: coref

John met Maria on the ski slope. He raced her .

anafor antecedent

82

(83)

Arguments and triggers in relations

• Kinship: parent-of

… her father …

trigger destination

source

83

(84)

Arguments and triggers in relations

• Social: inferior-of

Cesar

s principal courtiers

trigger

destination source

84

(85)

Arguments and triggers in relations

• Affective: worship

Lygia dropped on her knees to implore someone else .

trigger

destination source

85

(86)

Entities

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

86

(87)

Anaphoric relations: coref

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

87

(88)

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

Anaphoric relations: coref

88

(89)

Anaphoric relations: coref

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

89

(90)

Anaphoric relations: class-of

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

90

(91)

Kinship relations: sibling

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

91

(92)

Kinship relations: child-of

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

92

(93)

Kinship relations: parent-of

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

93

(94)

Kinship relations: spouse-of

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

94

(95)

Social relations: inferior-of

Petroniu…

Vinicius was

the son of his oldest sister ,

who years before had married his father ,

a man of consular dignity from the time of Tiberius .

95

(96)

General statistics over the corpus

7,281 sentences

146,822 tokens, punctuation included

171,029 tokens summed up under all relations

24,636 entity mentions

22,301 referential relations

755 AKS relations (Affective + Kinship + Social)

752 triggers

96

(97)

Example: affective relations love and worship

97

(98)

Example: affective relations fear-of and hate

98

(99)

Vinicius’ links with other characters

99

(100)

Semantic relations involving Vinicius

100

Referințe

DOCUMENTE SIMILARE

În mod semnificativ, în stabilirea faptului dacă cineva este sau nu autentic ca „om în carne şi oase”, Unamuno foloseşte un criteriu pragmatist: operari sequitur

În situațiile în care materialul grafic care trebuie să conțină logoul Universitatății Politehnica Timișoara nu este emis de aceasta sau nu este un document oficial al

care este True dacă poate alege o valoare din S j care urmează după valoarea v, valoare notată prin nou şi False în cazul în care nu mai există alte valori în S j , deci

De asemenea, daca ambele subspatii ane se reduc la cate un punct, distanta dintre cele doua subspatii este distanta dintre punctele respective... Particularizari in

Pentru a analiza relația dintre spațiu și comunitate, propun termenul spațiu-în- comun, care, pe de o parte, este infuzat de imaginea grupului, fiind vorba de un spațiu

pentru un curent de 5V (dar nu puteţi scurge prin el mai mult de 40mA), caz în care + este pinul “5V” al Arduino [setaţi pinul LOW]. CosminVârlan – Facultatea de

 În cazul în care calculatorul nu “va vede” Arduino-ul, se poate ca o masură de siguranţă să fi intrat în acţiune (de fapt este o “siguranţă” automatizată – ce

• Dacă A şi B sunt unităŃi în care apare aceeaşi entitate semantică, referinŃa dintre cele două reprezentări lexicale ale entităŃii este directă dacă