1 / 37

Un Lessico Elettronico Multilivello dell’Italiano per applicazioni di

Istituto di Linguistica Computazionale “Antonio Zampolli” C.N.R. Un Lessico Elettronico Multilivello dell’Italiano per applicazioni di Tecnologie del Linguaggio Umano. Nilda Ruimy Istituto di Linguistica Computazionale del CNR Pisa, Italy nilda.ruimy@ilc.cnr.it

eric-grimes
Download Presentation

Un Lessico Elettronico Multilivello dell’Italiano per applicazioni di

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Istituto di Linguistica Computazionale “Antonio Zampolli” C.N.R. Un Lessico Elettronico Multilivello dell’Italiano per applicazioni di Tecnologie del Linguaggio Umano Nilda Ruimy Istituto di Linguistica Computazionale del CNR Pisa, Italy nilda.ruimy@ilc.cnr.it http://www.ilc.cnr.it/clips/CLIPS_ENGLISH.htm

  2. Un lessico elettronico : PAROLE-SIMPLE-CLIPS • Lessici Computazionali : infrastruttura indispensabile per lo sviluppo delle applicazioni nell’ambito delle Tecnologie del Linguaggio Umano • Un lessico computazionale fornisce informazione lessicale comprensibile alla macchina • PAROLE-SIMPLE-CLIPS: il più ampio lessico computazionale multi-livello della lingua italiana • Modello lessicale: standard de facto e ispiratore dello standard ISO LMF per lessici per il TAL • Quattro livelli di descrizione linguistica: • entrate: fonologia : 387.000; morfologia : 53.000; sintassi : 64.500; semantica : 57.500 (di cui 28.900 complete) • Ogni livello descrittivo è indipendente dagli altri ma le informazioni sono interconnesse tramite i legami che uniscono le entrate di una stessa unità lessicale attraverso i livelli • Informazione coerentemente strutturata e molto granulare • Dati annotati in un linguaggio descrittivo esplicito • Lessico costruito in una prospettiva multilingue e per un utilizzo nel TAL Nilda Ruimy

  3. Posizione accento Apertura vocali Pronuncia consonanti Unità fonologica Correspondenza Ufon-Umorf Cat. gram. Sottocategoria gram. Paradigma flessivo Unità morfologica Correspondenza Umorf-Usin proprietà elem. sottocategorizzati a. proprietà testa b. frame sottocat. struttura sintattica 1 Collegamento struttura sintattica 2 proprietà elem. sottocategorizzati a. proprietà testa b. frame sottocat. proprietà elem. sottocategorizzati a. proprietà testa b. frame sottocat. struttura sintattica Architettura del lessicoI primi tre livelli di rappresentazione : Contenuto informativo Unità sintattica Nilda Ruimy

  4. Il Livello Semantico : SIMPLE-CLIPS • Livello semantico basato sulla teoria del Lessico Generativo (Pustejovsky, 1995) • Lessico strutturato in base ad un’ontologia lessicale • Rappresentazione della conoscenza lessicale copre un largo ventaglio di aspetti cruciali della semantica lessicale: • aspetto composizionale del significato • tipo di evento denotato • contesto sintattico e semantico • relazioni con le altre unità semantiche del lessico Nilda Ruimy

  5. Rappresentare il significato implica : • Distinguere i diversi sensi di un lemma es. capo = testa, superiore gerarchico, estremità di q.csa, indumento, ecc. • Fornire un’informazione che consenta di fare delle inferenze : es.: strumento implica artefatto • Rappresentare le similitudini di significato con altre parole Nilda Ruimy

  6. polisemia Il Lessico Generativo • Le unità semantiche sono entità multidimensionali • I significati lessicali hanno vari livelli di complessità bambino: UMANO, età (infanzia), sesso (maschile) + funzione dottore: UMANO, età (adulta), sesso (maschile), giornale: 1. carta stampata / informazione 2. luogo 3. istituzione 4. gruppo di persone • Significati più semplici : definibili attraverso una relazione tassonomica • Per i più complessi, la relazione di iperonimia non basta a definirli : sono coinvolte altre dimensioni di significato • La multidimensionalità e i diversi livelli di complessità del significato sono rappresentati nel Lessico Generativo attraverso la Struttura Qualia Nilda Ruimy

  7. La Struttura Qualia • E’ uno dei quattro livelli di rappresentazione semantica nella teoria del Lessico Generativo • La Struttura Qualia consiste di 4 ruoli : Formale = che cos’è X? Qualia Costitutivo = di che cosa è fatto / composto X? Agentivo = come nasce X? Telico = qual’è la funzione di X? • La Struttura Qualia consente di : • modellare coerentemente la multidimensionalità del significato • rendere conto delle relazioni esistenti tra le unità semantiche • rappresentare uniformemente la semantica di unità lessicali di diversa complessità Nilda Ruimy

  8. Multidimensionalità del significato Ruolo formale che cos’è X? di che cosa è fatto X? Ruolo costitutivo Entità X Ruolo telico qual è la funzione di X? come nasce X? Ruolo agentivo Nilda Ruimy

  9. E X T E N D E D Q U A L I A S T R U C T U R E used_for used_as used_by used_against result_of agentive_prog agentive_cause agentive_experience caused_by source made_of is_a_follower_of has_as_member is_a_member_of has_as_part instrument kinship is_a_part_of resulting_state relates uses A G E N T I V E isa antonym_comp antonym_grad mult_opposition C O N S T I T U T I V E INSTRUMENTAL indirect_telic purpose TELIC disgusto, provare created_by derived_from ARTIFACTUAL AGENTIVE is_the_activity_of is_the_ability_of is_the_habit_of ACTIVITY casa, costruire DIRECT TELIC object_of_activity causes concerns affects constitutive_activity contains has_as_colour has_as_effect has_as_property measured_by measures produces produced_by property_of quantifies related_to successor_of precedes typical_of contains feeling pane, farina mohair, capra P R O P E R T Y senatore, senato proiettile, colpire bisturi, chirurgo manubrio, bicicletta medico, curare is_in lives_in typical_location LOCATION Formale Costitutivo Agentivo Telico

  10. Multidimensionalità del significato Ruolo formale is_a made_of has_as_part Ruolo costitutivo STRUMENTO Ruolo telico used_for used_by created_by Ruolo agentivo Nilda Ruimy

  11. is_a strumento_musicale has_as_part used_for used_by is_made_of legno corde violinista suonare created_by fabbricare Multidimensionalità del significato Ruolo formale violino Ruolo costitutivo Ruolo telico Ruolo agentivo Nilda Ruimy

  12. Relazioni Qualia e dimensioni di significato Formale: is_a recipiente botte Costitutivo: made_of legno Agentivo: created_by fabbricare recipiente Costitutivo: has_as_part doghe di legno Definizione di dizionario tradizionale fatto di doghe arcuate tenute unite da cerchi di ferro che serve per la conservazione e il trasporto Telico: used_for conservare di liquidi, specialmente vino Costitutivo: contains vino Nilda Ruimy

  13. Ontologia • ‘I use the term ontology to mean a specification of a conceptualization. That is, an ontology is a description (..) of the concepts and relationships that can exist for an agent or a community of agents. ’…. ‘The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. (T. R. Gruber, 1993) • ‘ …a set of knowledge terms, including the vocabulary, the semantic interconnections and some simple rules of inference and logic, for some particular topic.’ (J. Hendler, 2001) • ‘An ontology defines the terms used to describe and represent an area of knowledge.’ World Wide Web Consortium (W3C) Recommendation • ‘…sembra consolidata l'idea che in informatica, il termine ontologia debba riferirsi specificamente ad un tentativo di formulare una concettualizzazione esaustiva e rigorosa nell'ambito di un dato dominio. Si tratta generalmente di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi ed i vincoli specifici del dominio.’ Wikipedia • In parole povere: un’ontologia specifica le entità esistenti in una determinata porzione dello spazio semantico e le relazioni che intercorrono fra di loro • Nel Web Semantico, è l’elemento chiave che permette il ragionamento automatico sul contenuto dei testi Nilda Ruimy

  14. L’ Ontologia Lessicale SIMPLESIMPLE Core Ontology • Disegnata in modo consensuale combinando le strategie top-down e bottom-up • Adottata per la costruzione di lessici per 12 lingue europee • Composta da 157 tipi semantici indipendenti da lingue, domini specifici e applicazioni, creati per la classificazione e descrizione del contenuto semantico delle unità lessicali Le unità semantiche sono entità multidimensionali • Sistema di tipi multidimensionali che consiste di: • tipi semplici o monodimensionali (caratterizzati in termini di relazioni di iperonimia) • tipi unificati o multidimensionali (definibili solo attraverso la relazione di iperonimia + il riferimento a dimensioni ortogonali di significato) Nilda Ruimy

  15. TOP CAUSE • PART • GROUP • AMOUNT • Location • Material • Artifact • Food • Physical Object • Organic Object • Living Entity • Substance • Quality • Psych Property • Physi Property • Social Property • Domain • Time • Moral Standards • Cognitive Fact • Mvmt of Thought • Institution • Convention • Abstract Location • Language • Sign • Information • Number • Unit of measure • Metalanguage • Human • Animal • Vegetal Entity Phenomenon Aspectual State Act Psychological_event Change Cause_change • Cognitive Event • Experience Event • Rel. Change • Change Possession • Change Location • Natural Transition • Acquire Knowledge • Cause Rel. Change • Cause Change Location • Cause Natural Transition • Creation • Give Knowledge • Weather verbs • Disease • Stimuli Cause Aspect. • Exist • Rel. State • Non Rel. Act • Relational Act • Move • Cause Act • Speech Act Ontologia SIMPLE-CLIPS AGENTIVE TELIC CONSTITUTIVE ENTITY CONCRETE_ENTITY PROPERTY ABSTRACT_ENTITY REPRESENTATION EVENT • Artifact Material • Furniture • Clothing • Container • Artwork • Instrument • Money • Vehicle • Semiotic Artifact INSTRUMENT bisturi tipo unificato tipo semplice … is_a … created_by … used_for … used_by … … Nilda Ruimy

  16. Unità semantica Predicato lessicale argomenti ruolo sem.; restr. sem. Livello semantico: tipi d’informazioni T R A T T I S E M Tipo ontologico Extended Qualia Structure Rappresentaz. predicativa R E L A Z I O N I T R A U S E M Dominio d’uso Sinonimia Tipo di evento Derivazione Collegam. con U. Sint. Proprietà semantiche Polisemia regolare Nilda Ruimy

  17. vaporizzatore tipo ontologico definiz. & esempio tipo di evento tratti semantici relazioni semantiche Extended Qualia Structure polisemia regolare rappresentaz. predicativa semantic predicate: PRED_vaporizzare type of link: instrument nominalization arguments description: range semantic role select. restrictions arg0 Protoagent Human/Instrument arg1 Protopatient +liquid arg2 Location Concrete_entity Informazione semantica semantic type: Instrument inif. path: [Concrete_entity | ArtifactAgentive| Telic] gloss: apparecchio usato per ridurre in minuscole particelle un liquido example:un vaporizzatore per piante eventype: ===== domain: cleaning, gardening, cosmetics synonymy: nebulizzatore morpho. derivation:eventverbvaporizzare formal: vaporizzatoreisaapparecchio constitutive: vaporizzatorehas_as_part pulsante agentive: vaporizzatorecreated_by fabbricare telic: vaporizzatoreused_foratomizzare regular polysemy: ===== Nilda Ruimy

  18. spaventare definiz. & esempio tipo ontologico tipo di evento tratti semantici relazioni semantiche Extended Qualia Structure polisemia regolare rappresentaz. predicativa semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso bivalent arg0 Protoagent Entity arg1 Protopatient Animate Informazione semantica semantic type: Cause_Experience_Event unif_path: Psychological_event-Causeagentive gloss: incutere spavento, atterrire example: la tua partenza mi spaventa eventype: process / state agentive_cause:yes connotation:negative synonymy: impaurire synonymy: intimorire formal: spaventareisasuscitare constitutive: spaventarehas_as_effectspavento regular polysemy: Experience_Event -Cause_Experience_Event Nilda Ruimy

  19. spaventarsi definiz. & esempio tipo ontologico tipo di evento tratti semantici relazioni semantiche Extended Qualia Structure polisemia regolare rappresentaz. predicativa semantic predicate: PRED_spaventare type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: crossed bivalent arg0 Protoagent Entity arg1 Protopatient Animate Informazione semantica semantic type: Experience_Event unif_path: Psychological_event-Agentive gloss: essere preso da spavento, impaurirsi example: Leo si è spaventato per l'accaduto eventype: process / state connotation:negative synonymy: impaurirsi formal: spaventarsi isa emozione agentive: spaventarsi agentive_experience provare constitutive: spaventarsi feeling spavento regular polysemy: Experience_Event -Cause_Experience_Event Nilda Ruimy

  20. immenso tipo ontologico definiz. & esempio tratti semantici tratti constitutive relazioni semantiche Extended Qualia Structure rappresentaz. predicativa Informazione semantica semantic type: Physical_Property supertype: Extensional gloss: senza limiti, così esteso da non poter essere misurato example:casa immensa, spazio immenso adjective_type: subsective syntactic_type: attributive_predicative duration: persistent scalar:no meaning component: Dimension_Positive synonymy: enorme synonymy: sconfinato formal: immensoantonym_gradminuscolo semantic predicate: PRED_immenso type of link: master arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame:iso_monovalent arg0 underspecified Concrete_Entity Nilda Ruimy

  21. precedente tipo ontologico definiz. & esempio tratti semantici relazioni semantiche tratti constitutive Extended Qualia Structure rappresentaz. predicativa Informazione semantica semantic type: Temporal supertype: Intensional gloss: che precede, che viene prima example:il precedente governo syntactic_type: attributive temporality_type: durative aspect: past scalar:no meaning component: Past_Neutral synonymy: anteriore synonymy: antecedente formal: precedenteantonym_compsuccessivo semantic predicate: PRED_precedere type of link: VerbPresentParticiple arguments description: range semantic role select. restrictions correspondence semantic-syntactic frame: iso_bivalent arg0 Protoagent Entity arg1 Protopatient Entity Nilda Ruimy

  22. Soggetti Tipici used_for used_for contenere barile tanica vetrina cassettone recipiente scatola ….. Nilda Ruimy

  23. Oggetti Tipici CLOTHING is-a object_of_the_activity pullover pantalone impermeabile gonna … indumento indossare stivale mocassino pantofola sandalo … calzatura calzare cintura cravatta guanto borsa … accessorio portare anello collana braccialetto spilla … gioiello Nilda Ruimy

  24. Disambiguazione di Sintagmi Preposizionali made_of contains is_a_part_of ? duna di sabbia ? bombola di gas ? fetta di pane Nilda Ruimy Nilda Ruimy

  25. Disambiguazione di Sintagmi Preposizionali cannada pesca ruolo telico ……… cannaisaattrezzo cannaused_forpescare ……… Unità Semantica : canna Tipo semantico : INSTRUMENT Nilda Ruimy

  26. Disambiguazione di Sintagmi Preposizionali ferro da stiro mazza da golf marcatore di funzione spazzolino da denti canna da pesca ruolo telico Tipo semantico: INSTRUMENT cannaused_forpescare Nilda Ruimy Nilda Ruimy

  27. Disambiguazione di Sintagmi Preposizionali macedonia di frutta ruolo costitutivo …… macedoniaisacibo macedoniamade_of frutta …… succo di frutta ruolo agentivo …… succoisabevanda succoderived_from frutta …… USemmacedonia USemsucco Nilda Ruimy

  28. Disambiguazione di Sintagmi Preposizionali ruolo costitutivo composizione ruolo agentivo origine macedonia di frutta macedoniamade_of frutta succo di frutta succoderived_fromfrutta

  29. Disambiguazione di Sintagmi Preposizionali ruolo costitutivo ruolo costitutivo bicchieredi plastica materiale bicchieredi birra contenuto ONTOLOGIA • …….. • SUBSTANCE • ARTIFACTUAL_DRINK • ………. di bicchiere made_ofmateriale di bicchierecontainsliquido

  30. Rete Semantica typical_location derived_from capra kinship concerns is_part_of typical_of Semantic type Agentive qualia relation Constitutive qualia relation NATURAL SUBSTANCE LOCATION ARTIFACTUAL MATERIAL ovile lana mohair cachemire angora capra marocchino SUBSTANCE FOOD EARTH_ANIMAL capra becco capretta capretto capro caprone …. ARTIFACT FOOD caprino RELATIONAL ACT mungere mungitura tosare tosatura BODY_PART NON_ RELATIONAL ACT vello belare belato Nilda Ruimy

  31. zucchero Used_for Object_of_the_activity TELIC Is_the_activity_of AGENTIVE Created_by qualia role semantic feature qualia semantic relation semantic type Lessico di Dominio mangiare NATURAL_SUBSTANCE alloro +edible FLAVOURING tartufo cucinare cuocere VEGETAL_ENTITY mestolo mangiare friggere cucinare mangiare mangiare mangiare mangiare cucinarecuocerearrostirebollirelessarestufare friggere rosolaregrigliare…… mangiare bollire mangiare pentola mangiare friggitrice carne tavola forchetta ristorante mela BUILDING carota cuoco coniglio FURNITURE bollitore FOOD pesce FRUIT arrosto VEGETABLE pesciera SUBSTANCE_FOOD INSTRUMENT CONTAINER PROFESSION ARTIFACT _FOOD Nilda Ruimy

  32. PAROLE-SIMPLE-CLIPS • Basato su un modello lessicale ricco che coniuga complessità e rigore con aspetti innovativi • Soddisfa i requisiti per la portabilità, condivisione & riutilizzabilità: vasta copertura, genericità, strutturazione coerente dell’informazione, descrizione ricca ed esplicita, variabilità di granularità di descrizione, facile estensione e adattamento • Membro di una rete di 12 lessici monolingui => utilizzabilità in applicazioni multilingue nelle Technologie del Linguaggio Umano • Utilizzabile nell’analisi di testi, nell’estrazione di informazione, nella disambiguazione del significato, nel Question Answering • Ha i requisiti per contribuire all’implementazione del Web Semantico poiché è una risorsa basata su un’ontologia ed è in grado di fornire informazione comprensibile alla macchina per consentire la gestione del contenuto dei documenti sul Web Nilda Ruimy

  33. Istituto di Linguistica Computazionale “Antonio Zampolli” C.N.R. Un Lessico Elettronico Multilivello dell’Italiano per applicazioni di Tecnologie del Linguaggio Umano Nilda Ruimy Istituto di Linguistica Computazionale del CNR Pisa, Italy nilda.ruimy@ilc.cnr.it http://www.ilc.cnr.it/clips/CLIPS_ENGLISH.htm

  34. Semantic Unit predicato lessicale arguments: sem. role; sem. restr. argomenti: ruolo sem., restr. sem. Risoluzione dell’ambiguità lessicalein ambito multilingue ala = fr. aile, ailier… ala : tipo sem.: PART / BODY_PARTaile ala : tipo sem.: ROLEailier Extended Qualia Structure Rappresent. Predicativa Ontological Information Info. Ontologica Sinonimia Dominio Tipo di evento Derivazione Collegamento con U. sint. Polisemia regolare Proprietà semantiche E. Gola, N. Ruimy

  35. predicato lessicale argomenti: ruolo sem., restr. sem. Risoluzione dell’ambiguità lessicalein ambito multilingue borsa = fr. sac (gen.);bourse(econ.) calcolo = en. calculation(gen.);gallstone(med.) mouse = it. topo(gen.), mouse(inf.) Info. ontologica Extended Qualia Structure Rappresent. Predicativa Sinonimia Domain Dominio Tipo di evento Derivazione Collegamento con U. sint. Proprietà semantiche Polisemia regolare E. Gola, N. Ruimy

  36. predicato lessicale argomenti: ruolo sem., restr. sem. Risoluzione dell’ambiguità lessicalein ambito multilingue ferri (pl) = fr. aiguilles à tricoter, instruments du chirurgien ferri : tipo sem.:INSTR.used_forsferruzzareaiguilles à tricoter ferri : tipo sem.:INSTR. used_foroperareinstruments du chirurgien used_bychirurgo Rappresent. Predicativa Extended Qualia Structure Ext. Qualia Struct. Info. ontologica Sinonimia Dominio Tipo di evento Derivazione Collegamento con U. sint. Polisemia regolare Proprietà semantiche E. Gola, N. Ruimy

  37. lexical predicate lexical predicate arguments: sem. role; sem. restr. arguments: sem. role; sem. restr. Risoluzione dell’ambiguità lessicalein ambito multilingue mangiare = ger. essen, fressen mangiare: arg0 +humanessen mangiare: arg0 +animalfressen fr. louer = it. lodare, affittare louer:arg0, arg1 lodare louer:arg0, arg1, arg2affittare Pred. Represent. Predicative Representation Extended Qualia Structure Ontological Information Synonymy Domain Event Type Regular Polysemy alt. Link to syntactic unit Derivation Semantic properties E. Gola, N. Ruimy

More Related