1 / 91

Ontologick in en rstv

T

felix
Download Presentation

Ontologick in en rstv

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


    1. Ontologické inženýrství Vojtech Svátek, Miroslav Vacura Fakulta informatiky a statistiky VŠE v Praze

    2. Témata tutoriálu (cást I) Úvod Vymezení pojmu ontologického inženýrství „Novᓠhistorie OI, souvislost se sémantickým webem Filosofické aspekty OI Návaznost na filosofickou ontologii Základní vs. doménové ontologie Tvorba obsahu doménových ontologií Životní cyklus a metodiky Využití základních ontologií Obsahové návrhové vzory Práce s textovými podkladovými zdroji

    3. Témata tutoriálu (cást II) Logické pozadí ontologického inženýrství OWL-DL: struktura jazyka Odvozování v deskripcní logice Logické „paradoxy“ OWL-DL Strukturne-logické vzory a konvence Aplikace ontologií Strucný prehled Demo: anotování multimédií pomocí ontologie Interaktivní procvicení tvorby ontologie Návrh ontologie „porádání konference“ vycházející ze zkušeností s Datakonem

    4. Základní vymezení a historie ontologického inženýrství

    5. Ontologické inženýrství Soubor aktivit souvisejících s procesem vývoje ontologií, jejich životním cyklem, a s metodikami, nástroji a jazyky pro tvorbu ontologií Gomez-Perez, A., Fernandez-Lopez, M., Corcho, O.: Ontological Engineering: with Examples from the Areas of Knowledge Management, E-Commerce and the Semantic Web. Springer, 2003.

    6. Co je ontologie? Vedecká disciplína - soucást filosofie bude strucne rozebráno pozdeji Lidský artefakt používaný v oblasti informatiky; neexistuje jednotná definice Strukturovaná slovní zásoba Explicitní specifikace konceptualizace Logická teorie v jazyce podporujícím „definování konceptu“, zejména. deskripcní logice Grafová struktura nad pojmy

    7. Casté atributy („pravé“) ontologie Odpovídající realite Konsensuální, obecne prijímaná Srozumitelná cloveku, dále sdílitelná Znovupoužitelná, a to i nepredjímaným zpusobem Bohate strukturovaná Formální, strojove zpracovatelná Logicky konzistentní

    8. Príklad cásti ontologie – Foundational Model of Anatomy

    9. Príklad ontologie: FOAF

    10. Historické trendy (I) Polovina 90. let: etablování ontologií jako prostredku reprezentace znalostí v UI syntaxe Lisp sémantika predikátového kalkulu + rámcový model Ontolingua, OKBC, OCML soubežne jiné modely, zejména konceptuální grafy Konec 90. let: nástup XML a webu nativní XML: XOL, OML; v soucasnosti zejména Topic Maps webove orientované jazyky: SHOE, Ontobroker

    11. Historické trendy (II) Cca od r. 2000: v kontextu sémantického webu spojení s RDF, podpora W3C DAML-ONT, OIL, DAML+OIL, OWL posun k pojetí vetšího poctu ontologií, které je treba pružne kombinovat a vzájemne mapovat formálním základem deskripcní logika (+ zbytky rámcového prístupu) pragmatické kombinování s pravidlovým prístupem Soucasnost: mj. snaha o spojení s Web 2.0 ontologická podpora nad wiki, blogy, folksonomiemi…

    12. Prorustání do puvodne vzdálených komunit softwarové inženýrství UML metamodel pro definici ontologií (OMG) rada aplikací nad úložišti SW komponent SOA sémantika ve webových službách (WSMO) databáze RDF podporován nekterými DBMS (Oracle) soft computing rozšírení ontologických jazyku o neurcitost/vágnost (napr. FuzzyOWL, BayesOWL…)

    13. Výuka ontologického inženýrství Tradicne jako spíše okrajová oblast UI Nove v kontextu sémantického webu Specializované kurzy méne bežné, ale existuji i v komercní sfére Wilshire: 4 dny za cca $2000 Na VŠE Praha od r. 2000 soucást kurzu „Modelování znalostí“ a pozdeji „Reprezentace a zpracování znalostí na WWW“ od r. 2008 hlavní cást nového kurzu „Znalosti a ontologické inženýrství“ v rámci rovnež nového programu „Kognitivní informatika“

    14. Historie ontologie a ontologií

    15. Historie ontologie Parmenidés Platón Aristotelés Spisy Metafyzika a Kategorie Ve filosofii: metafyzika, ontologie, „první filosofie“.

    16. Vznik tradicní ontologie Aristotelés – 10 kategorií Substance Kvantita Kvalita Vztah Místo Cas Poloha Mít Cinnost Trpnost

    17. Vznik tradicní ontologie Aristotelská definice „definice“ Definitio per genus proximum et differentia specifica

    18. Viper = venomous Old World snakes characterized by hollow venom-conducting fangs in the upper jaw

    22. Taxonomie Hierarchická struktura Tradice: Klasické ontologie Thesaury Dnes: ISA hierarchy (Book is a document) Ontologie Lexicon (HPSG – head-driven phrase structure, ILEX, DATR)

    23. Porfyriuv strom ARBOR PORPHYRII První klasická ontologie Porfyrios z Tyru (232-301) Aristotelská tradice

    26. Témata tradicní ontologie Esenciální / neesenciální vlastnosti Problém zmeny (kdy je zmena entity taková, že je nutno ji reklasifikovat) Problém identity (kdy ruzné „identifikátory“ odkazují k téže entite) Leibnizuv zákon identity Problém obecnin

    27. Vlastnosti Esenciální Neesenciální (akcidentální) Esence - bytnost, „cost“, quidditas (quid lat. co) To, co delá danou vec, tím cím je. (Napríklad cloveka clovekem, strom stromem atd.) Jednotliví lidé se navzájem liší neesenciálními vlastnostmi (vek, pohlaví, výška, váha, barva…)

    28. Problém zmeny Zmena esenciální – daná vec se zmení v neco jiného, nutno reklasifikovat v rámci ontologie. Zmena akcidentální – daná vec zustává tím cím byla, mení se jen neesenciální vlastnost.

    29. Leibniz Zákon stejnosti identických Zákon identity stejných

    30. Ontologický závazek které entity jsme povinni zaradit do naší ontologie „Být znamená být hodnotou (vázané) promenné“ (Quine) Kritérium identity Pro „materiální“ entity Pro abstraktní entity (Frege) Obecné kriterium identity R pro entity typu F

    31. Tvorba ontologií shora dolu („top-down“) základní ontologie zdola nahoru („bottom-up“) „od stredu ven“ („middle-out“), doménové ontologie

    32. Klasifikace ontologií Operacionalizace hrubé (coarse) jemné (fine-grained) Expresivita težké (heavy-weight) lehké (light-weight)

    33. Klasifikace ontologií Specificnost obecná (generic) jádrová (core) doménová (domain) Základní ontologie (Foundational, Upper-level)

    34. Základní ontologie Poskytují referenci pro srovnávání ruzných ontologických prístupu, a rámec pro analýzu, harmonizaci a integraci ontologií a metadatových standardu. Poskytují výchozí bod pro tvorbu nových ontologií. Základní ontologie obsahují preddefinovanou skupinu ontologických entit, které mohou být znovu využity. „An ontology is a systematic formalization of concepts, definitions, relationships, and rules that captures the semantic content of a domain in a machine-readable format.“ „An ontology is a systematic formalization of concepts, definitions, relationships, and rules that captures the semantic content of a domain in a machine-readable format.“

    35. Základní ontologie V ideálním prípade také základní ontologie definuje návrhové vzory pro bežne se vyskytující prípady modelování. Pomáhají uživateli vyporádat se s typickými problémy, na které muže pri návrhu ontologií narazit.

    36. Klasifikace ontologii Problém abstraktních a konkrétních entit Problém obecnin a jednotlivin Pristup k jazyku a skutecnosti descriptive vs. revisionary Rozsah ontologie multiplicative vs. reductionist Reprezentace casu presentism vs. eternalism Reprezentace modalit actualism vs. possibilism Problém modelování zmen

    37. Upper level ontologie - príklady KR Ontology (J.F.Sowa) SUMO DOLCE Wordnet.OWL (http://taurus.unine.ch/knowler/) CYC (www.cyc.com) …

    38. KR Ontology J.F.Sowa: Knowledge Representation Influence: Ch. S. Peirce A. N. Whitehead (http://www.jfsowa.com/ontology/)

    39. KR Ontology – Základní kategorie Relace Independent - I Relative - R Mediating – M Podstata Physical - P Abstract - A Cas Continuant - C Occurent - O Kategorie primitivní termíny, nedefinovatelné v rámci dané ontologie.

    40. KR Ontology Independent „An entity characterized by some inherent Firstness, independent of any relationships it may have to other entities.“ Relative „An entity in a relationship to some other entity.“ Mediating „An entity characterized by some Thirdness that brings other entities into a relationship. An independent entity need not have any relationship to anything else, a relative entity must have some relationship to something else, and a mediating entity creates a relationship between two other entities.“

    41. KR Ontology Independent (?x:Independent) ~?(?y)(has(x,y) v has(y,x)). Relative (?x:Relative) ?(?y)(has(x,y) v has(y,x)). Mediating (?m:Mediating)(?x,y:Entity) ((?R,S:Relation)(R(m,x) & S(m,y))) & ?(?T:Relation)T(x,y).

    42. KR Ontology Endurant (continuant) – entity „celé“ prítomny v každém okamžiku své existence. Pendurant (occurent) – entity u nichž v každém okamžiku existuje jen temporální cást. Endurant (continuant) - entities that are ‘in time’, they are ‘wholly’ present (all their proper parts are present) at any time of their existence. Pendurant (occurent) - entities that ‘happen in time’, they extend in time by accumulating different ‘temporal parts’, so that, at any time t at which they exist, only their temporal parts at t are present. Endurant (continuant) - entities that are ‘in time’, they are ‘wholly’ present (all their proper parts are present) at any time of their existence. Pendurant (occurent) - entities that ‘happen in time’, they extend in time by accumulating different ‘temporal parts’, so that, at any time t at which they exist, only their temporal parts at t are present.

    43. KR Ontology Endurant „kniha“ „osoba“ Pendurant „cetba této knihy” „život cloveka“

    44. KR Ontology

    46. SUMO Suggested Upper Merged Ontology (http://ontology.teknowledge.com/) Formáty KIF, OWL, Protege, LOOM, Nekteré koncepty mohou mít více nadkonceptu, e.g. PsychologicalDysfunction is a child of both PsychologicalAttribute and DiseaseOrSyndrome.

    47. SUMO Top-level

    50. „Set can be an arbitrary set of things“ „Collection consists of disconnected parts, and the relation between these parts and the whole is known as member in the SUMO.“ SUMO

    53. DOLCE Descriptive Ontology for Linguistic and Cognitive Engineering (http://www.loa-cnr.it/DOLCE.html) WonderWeb project „…library of such foundational ontologies, systematically related to each other in a way that makes the rationales and alternatives underlying different ontological choices as explicit as possible.“

    55. DOLCE Library of modules Ontology Modules – ontologie v pocitacove zpracovatelném formátu Neformální informace o ontologických rozhodnutích prijatých pro daný modul Prehled základní logické axiomatizace prijaté v každém modulu Specification of differences and similarities existing among modules: An informal discussion on the differences between the ontological choices adopted. A logical specification of the formal links (i.e., syntactic and semantic correspondences) existing between the various modules. A mapping between ontology modules and natural language lexicons (WordNet) Specification of differences and similarities existing among modules: An informal discussion on the differences between the ontological choices adopted. A logical specification of the formal links (i.e., syntactic and semantic correspondences) existing between the various modules. A mapping between ontology modules and natural language lexicons (WordNet)

    56. DOLCE „not intended as a candidate for a “universal” standard ontology, but rather as a reference module, to be adopted as a starting point for comparing and elucidating the relationships with other future modules of the library.“

    57. DOLCE

    58. Tvorba obsahu (doménových) ontologií

    59. Doménové ontologie Vyvíjené pro dílcí oblast (doménu) Príklady viz text ve sborníku Dnes se casto predpokládá (a realizuje) tvorba informatiky bez dlouhodobých zkušeností Bežne známé nástroje (editory, odvozovací systémy) zajistí jen syntaktickou a formálne-logickou správnost ontologií Hlavními prostredky pro podporu adekvátnosti vecného obsahu jsou Strukturované metodiky Základní ontologie a obsahové (návrhové) vzory Metody ucení ontologií z textu

    60. Editory ontologií Nejznámejší Protégé Dále SWOOP, TopBraid, SemanticWorks, OntoEdit, OKS (pro Topic Maps)… Vetšinou umožnují propojení s odvozovacími nástroji (viz dále) Zejména Protégé dále vybaven zásuvnými moduly pro veškeré další myslitelné úlohy ontologického inženýrství Velmi rozsáhlá uživatelská komunita, porádání vlastních konferencí atd.

    63. Strukturované metodiky Popisují optimální proces vývoje a životního cyklu (zejména doménové) ontologie Zárodky se objevují se již cca od r. 1990 Zralé metodiky v polovine 90. let Uschold & Grüninger (metodika vycházející ze zkušenosti s tvorbou „ontologií firmy“) Gomez-Perez et al. (METHONTOLOGY) Od té doby se výrazne nezmenily, jen podrobnejší pokrytí speciálních fází vývoje kolaborativní tvorba ontologií, ucení ontologií z textu, využití základních ontologií (napr. OntoClean), mapování ontologií…

    64. Obvyklá posloupnost kroku Ujasnení úcelu a rozsahu ontologie Specifikace terminologické cásti Odlišení ontologických typu Specifikace taxonomie Vytvorení netaxonomických relací, atributu a instancí Specifikace pokrocilých axiomu Nasazení a údržba ontologie

    65. Ujasnení úcelu a rozsahu Formulace obecných scénáru a prípadu užití Konkrétní vzorové kompetencní otázky Co by melo být možné s pomocí ontologie zodpovedet? Vyvarovat se bezbrehosti (viz „hugeness problem“) Soucasne ale zachovat otevrenost pro prozatím nerešené aplikace (znovupoužití)

    66. Specifikace terminologické cásti Východiskem vývoje ontologie bývá seznam relevantních termínu Možnost již v této fázi využít podporu automatickým nástrojem – text mining / ucení ontologií Slovní definice pojmu – glosár – usnadnují i komunikaci mezi více vývojári navzájem

    67. Odlišení ontologických typu Trídy, instance, relace, atributy Zpravidla existuje více možností! Rozhodnutí, co jak modelovat se muže rídit mj. logickými vzory

    68. Specifikace taxonomie Taxonomie zpravidla tvorí páter ontologie Budovat se dá Shora dolu velmi obecné doménové ontologie, prímo navázané na základní ontologie Zdola nahoru napr. ontologie orientované na používanou terminologii Ze stredu „ven“ od nejfrekventovanejších pojmu – casto nejefektivnejší zpusob Nejobecnejší pojmy z doménové ontologie je každopádne vhodné navázat na nekterou základní ontologii resp. obsahový vzor Vedle taxonomie nadrazenosti pojmu se casto uplatní partonomie (celek-cást), struktury závislostí apod.

    69. Netaxonomické relace, atributy, instance Duležité je jejich umístení na vhodnou hierarchickou úroven Relace a atributy v ontologických jazycích nekdy do znacné míry splývají Napr. objektové a datotypové vlastnosti v OWL Instance se zpravidla zarazují jen tehdy, pokud mají v doméne zásadní postavení Zejména jsou-li potrebné pro definování tríd

    70. Specifikace pokrocilých axiomu Nedelá se vždy, jen pokud se nad ontologií predpokládá sofistikovanejší odvozování Napr. výrazy definující príslušnost instancí ke tríde, prípadne relaci; ekvivalence tríd; disjunktnost tríd; matematické vlastnosti relací… Zpravidla nejprve v predikátovém jazyce, teprve následne se reší napr. „orezání“ do deskripcní logiky

    71. Nasazení a údržba Ontologie zpravidla nejprve vzniká „na papíre“ (nejprve v podobe textových glosáru, pozdeji tabulek), teprve po ustálení struktury se kóduje ve zvoleném jazyce Pred vlastním nasazením je potreba provést evaluaci v prípade ontologií je objektivní formální evaluace velmi obtížná, spíše vstupují do hry subjektivní faktory Dlouhodobe se doména muže vyvíjet, bývá potreba napr. verzování

    72. Ucení ontologií Textové materiály jsou témer vždy významným vstupem; vedle využití jako vodítka pro lidského návrháre na ne lze aplikovat i automatické techniky Pokrocilé metody ucení ontologií do jisté míry replikují kroky rucní tvorby ontologií nalezení terminologie; rozlišení tríd a instancí; konstrukce taxonomie; nalezení a pojmenování netaxonomických relací; ucení axiomu Základem jsou techniky zejména z oblasti IR (TFIDF apod.) z oblasti NLP („Hearst patterns“ apod.) Lze použít od zacátku, nebo i pro doplnení již existující ontologie (ukázka na konci tutoriálu?)

    73. OntoClean Specializovaná metodologie, jejímž cílem je omezit výskyt nejbežnejších modelovacích chyb, a zajistit konzistenci výsledné ontologie. Vyvinutá N. Guarinem a C. Weltym. Vychází z obecne teoretických výzkumu v oblasti filosofické ontologie.

    74. OntoClean Metavlastnosti popisují jednotlivé soucástí navrhované ontologie. omezují další vývoj ontologie pouze na s ohledem na OntoClean konzistentní rozšírení. možnují vykázat existující nekonzistence v dané ontologii.

    75. OntoClean Esencialita Vlastnost je pro entitu esenciální, pokud ji daná entita musí mít. Rigidita Speciální typ esenciality. Vlastnost je rigidní, pokud je esenciální ve všech svých prípadech. Páterní taxonomie ontologie zahrnuje všechny rigidní vlastnosti.

    76. OntoClean Identita každá entita v ontologii by mela mít urcité kriterium identity a rigidní vlastnosti, které toto kritérium identity popisují. Jednota v jakém vztahu jsou cásti urcité entity k celku. Subsumpce, trída-instance, cást-celek.

    77. OntoClean Použití v praxi. Napr. plugin pro ontologický editor Protégé.

    79. Návrhové vzory v ontologickém inženýrství

    80. Co je návrhový vzor (pattern)? Historical sense, e.g. OED’s: middle-age Latin “patronus”, meaning “patron”, and, metonymically, “exemplar”: something proposed for imitation General sense, e.g. Webster's, (f) entry: Ťa discernible coherent system based on the intended interrelationship of component partsť Theoretical architecture, Alexander (1979): archetypal solutions to design problems in a certain context Software engineering, (Gamma et al. 1995, Baker et al. 1999, Maplesden et al. 2002): formatted guidelines in software reuse, recently also attempts at formalization Data modelling, e.g. Hay 1996: a convention of thought to be encoded in a modelling language like ER or UML, and then reused for local conceptual schemas Knowledge engineering, Clark 1997: Ťa theory ‘template’ or ‘schema’, which denotes a structure of objects and relationships, but whose axioms are not directly part of the global KBť Ontology engineering and the semantic web, (Reich 2000, Gangemi 2003,2005, W3C SWBPD 2003-5, Soshnikov 2003, Guizzardi et al. 2004, Svatek 2004, Vrandecic 2005): various schemas and macros for UML, OWL, core ontologies, etc.

    81. Peter Clark „A pattern is a theory template. It denotes a structure that is invariant under signature transformation.“ „Pattern validity in an application is then left to a subjective decision.“ “A pattern is a first-order theory whose axioms are not part of the target knowledge base, but can be incorporated via a renaming of their non-logical symbols” “A theory acquires its status as a pattern by the way it is used, rather than by having some intrinsic property” „A pattern is implemented “as an explicit, self-contained theory”, then is category-theoretically morphed “for each intended application in the target knowledge base”

    82. Typy návrhových vzoru Logické (formální) návrhové vzory Logical (formal) pattern Neobsahují specifický slovník Logical Ontology Design Patterns (LODeP) budeme se jim venovat po prestávce… Obsahové návrhové vzory Conceptual (content) pattern Obsahují specifický mimo-logický slovník Content Ontology Design Patterns (CODeP)

    83. Obsahové návrhové vzory Nalezení invariant (Formální) zakódování invariant Anotace jako metody pro rešení urcitého typu problému. Uložení anotovaného invariantu ve forme CODeP. Search for invariances (Formally) encode the invariance Annotate it as a method to help solving a usage problem Store the framed (annotated) invariance in the form of a CODeP Search for invariances (Formally) encode the invariance Annotate it as a method to help solving a usage problem Store the framed (annotated) invariance in the form of a CODeP

    84. Participation pattern “Vybraní uchazeci se budou úcastnit finále výberového rízení.” “Francesco Totti prihrál míc Zambrottovi a ten vystrelil a minul bránu.” “An object at rest tends to STAY AT REST and an object in motion tends to STAY IN MOTION with the same speed and in the same direction unless ACTED UPON BY an unbalanced force” “An object at rest tends to STAY AT REST and an object in motion tends to STAY IN MOTION with the same speed and in the same direction unless ACTED UPON BY an unbalanced force”

    85. Participation pattern

    86. Descriptions and Situations Pattern

    87. Descriptions and Situations Pattern

    88. Descriptions and Situations Pattern

    91. Po prestávce: Logické pozadí ontologického inženýrství OWL-DL: struktura jazyka Odvozování v deskripcní logice Logické „paradoxy“ OWL-DL Strukturne-logické vzory a konvence Aplikace ontologií Strucný prehled Demo: anotování multimédií pomocí ontologie Interaktivní procvicení tvorby ontologie Návrh ontologie „porádání konference“ vycházející ze zkušeností s Datakonem

More Related