E N D
1. Ontologické inenýrství Vojtech Svátek, Miroslav Vacura
Fakulta informatiky a statistiky
VE v Praze
2. Témata tutoriálu (cást I) Úvod
Vymezení pojmu ontologického inenýrství
Nová historie OI, souvislost se sémantickým webem
Filosofické aspekty OI
Návaznost na filosofickou ontologii
Základní vs. doménové ontologie
Tvorba obsahu doménových ontologií
ivotní cyklus a metodiky
Vyuití základních ontologií
Obsahové návrhové vzory
Práce s textovými podkladovými zdroji
3. Témata tutoriálu (cást II) Logické pozadí ontologického inenýrství
OWL-DL: struktura jazyka
Odvozování v deskripcní logice
Logické paradoxy OWL-DL
Strukturne-logické vzory a konvence
Aplikace ontologií
Strucný prehled
Demo: anotování multimédií pomocí ontologie
Interaktivní procvicení tvorby ontologie
Návrh ontologie porádání konference vycházející ze zkueností s Datakonem
4. Základní vymezení a historie ontologického inenýrství
5. Ontologické inenýrství Soubor aktivit souvisejících s procesem vývoje ontologií, jejich ivotním cyklem, a s metodikami, nástroji a jazyky pro tvorbu ontologiíGomez-Perez, A., Fernandez-Lopez, M., Corcho, O.: Ontological Engineering: with Examples from the Areas of Knowledge Management, E-Commerce and the Semantic Web. Springer, 2003.
6. Co je ontologie? Vedecká disciplína - soucást filosofie
bude strucne rozebráno pozdeji
Lidský artefakt pouívaný v oblasti informatiky; neexistuje jednotná definice
Strukturovaná slovní zásoba
Explicitní specifikace konceptualizace
Logická teorie
v jazyce podporujícím definování konceptu, zejména. deskripcní logice
Grafová struktura nad pojmy
7. Casté atributy (pravé) ontologie Odpovídající realite
Konsensuální, obecne prijímaná
Srozumitelná cloveku, dále sdílitelná
Znovupouitelná, a to i nepredjímaným zpusobem
Bohate strukturovaná
Formální, strojove zpracovatelná
Logicky konzistentní
8. Príklad cásti ontologie Foundational Model of Anatomy
9. Príklad ontologie: FOAF
10. Historické trendy (I) Polovina 90. let: etablování ontologií jako prostredku reprezentace znalostí v UI
syntaxe Lisp
sémantika predikátového kalkulu + rámcový model
Ontolingua, OKBC, OCML
soubene jiné modely, zejména konceptuální grafy
Konec 90. let: nástup XML a webu
nativní XML: XOL, OML;v soucasnosti zejména Topic Maps
webove orientované jazyky: SHOE, Ontobroker
11. Historické trendy (II) Cca od r. 2000: v kontextu sémantického webu
spojení s RDF, podpora W3C
DAML-ONT, OIL, DAML+OIL, OWL
posun k pojetí vetího poctu ontologií, které je treba prune kombinovat a vzájemne mapovat
formálním základem deskripcní logika (+ zbytky rámcového prístupu)
pragmatické kombinování s pravidlovým prístupem
Soucasnost: mj. snaha o spojení s Web 2.0
ontologická podpora nad wiki, blogy, folksonomiemi
12. Prorustání do puvodne vzdálených komunit softwarové inenýrství
UML metamodel pro definici ontologií (OMG)
rada aplikací nad úloiti SW komponent
SOA
sémantika ve webových slubách (WSMO)
databáze
RDF podporován nekterými DBMS (Oracle)
soft computing
rozírení ontologických jazyku o neurcitost/vágnost (napr. FuzzyOWL, BayesOWL
)
13. Výuka ontologického inenýrství Tradicne jako spíe okrajová oblast UI
Nove v kontextu sémantického webu
Specializované kurzy méne bené, ale existuji i v komercní sfére
Wilshire: 4 dny za cca $2000
Na VE Praha od r. 2000
soucást kurzu Modelování znalostí a pozdeji Reprezentace a zpracování znalostí na WWW
od r. 2008 hlavní cást nového kurzu Znalosti a ontologické inenýrství v rámci rovne nového programu Kognitivní informatika
14. Historie ontologie a ontologií
15. Historie ontologie Parmenidés
Platón
Aristotelés
Spisy Metafyzika a Kategorie
Ve filosofii: metafyzika, ontologie, první filosofie.
16. Vznik tradicní ontologie Aristotelés 10 kategorií
Substance
Kvantita
Kvalita
Vztah
Místo
Cas
Poloha
Mít
Cinnost
Trpnost
17. Vznik tradicní ontologie Aristotelská definice definice
Definitio per genus proximum et differentia specifica
18. Viper = venomous Old World snakes characterized by hollow venom-conducting fangs in the upper jaw
22. Taxonomie Hierarchická struktura
Tradice:
Klasické ontologie
Thesaury
Dnes:
ISA hierarchy (Book is a document)
Ontologie
Lexicon (HPSG head-driven phrase structure, ILEX, DATR)
23. Porfyriuv strom ARBOR PORPHYRII
První klasická ontologie
Porfyrios z Tyru (232-301)
Aristotelská tradice
26. Témata tradicní ontologie Esenciální / neesenciální vlastnosti
Problém zmeny
(kdy je zmena entity taková, e je nutno ji reklasifikovat)
Problém identity
(kdy ruzné identifikátory odkazují k tée entite)
Leibnizuv zákon identity
Problém obecnin
27. Vlastnosti
Esenciální
Neesenciální (akcidentální)
Esence - bytnost, cost, quidditas (quid lat. co)
To, co delá danou vec, tím cím je. (Napríklad cloveka clovekem, strom stromem atd.)
Jednotliví lidé se navzájem lií neesenciálními vlastnostmi (vek, pohlaví, výka, váha, barva
)
28. Problém zmeny
Zmena esenciální daná vec se zmení v neco jiného, nutno reklasifikovat v rámci ontologie.
Zmena akcidentální daná vec zustává tím cím byla, mení se jen neesenciální vlastnost.
29. Leibniz
Zákon stejnosti identických
Zákon identity stejných
30. Ontologický závazek
které entity jsme povinni zaradit do naí ontologie
Být znamená být hodnotou (vázané) promenné (Quine)
Kritérium identity
Pro materiální entity
Pro abstraktní entity (Frege)
Obecné kriterium identity R pro entity typu F
31. Tvorba ontologií shora dolu (top-down)
základní ontologie
zdola nahoru (bottom-up)
od stredu ven (middle-out),
doménové ontologie
32. Klasifikace ontologií Operacionalizace
hrubé (coarse)
jemné (fine-grained)
Expresivita
teké (heavy-weight)
lehké (light-weight)
33. Klasifikace ontologií Specificnost
obecná (generic)
jádrová (core)
doménová (domain)
Základní ontologie(Foundational, Upper-level)
34. Základní ontologie Poskytují referenci pro srovnávání ruzných ontologických prístupu, a rámec pro analýzu, harmonizaci a integraci ontologií a metadatových standardu.
Poskytují výchozí bod pro tvorbu nových ontologií. Základní ontologie obsahují preddefinovanou skupinu ontologických entit, které mohou být znovu vyuity.
An ontology is a systematic formalization of concepts, definitions, relationships, and rules that captures the semantic content of a domain in a machine-readable format. An ontology is a systematic formalization of concepts, definitions, relationships, and rules that captures the semantic content of a domain in a machine-readable format.
35. Základní ontologie V ideálním prípade také základní ontologie definuje návrhové vzory pro bene se vyskytující prípady modelování.
Pomáhají uivateli vyporádat se s typickými problémy, na které mue pri návrhu ontologií narazit.
36. Klasifikace ontologii Problém abstraktních a konkrétních entit
Problém obecnin a jednotlivin
Pristup k jazyku a skutecnosti
descriptive vs. revisionary
Rozsah ontologie
multiplicative vs. reductionist
Reprezentace casu
presentism vs. eternalism
Reprezentace modalit
actualism vs. possibilism
Problém modelování zmen
37. Upper level ontologie - príklady KR Ontology (J.F.Sowa)
SUMO
DOLCE
Wordnet.OWL (http://taurus.unine.ch/knowler/)
CYC (www.cyc.com)
38. KR Ontology J.F.Sowa: Knowledge Representation
Influence:
Ch. S. Peirce
A. N. Whitehead
(http://www.jfsowa.com/ontology/)
39. KR Ontology Základní kategorie Relace
Independent - I
Relative - R
Mediating M
Podstata
Physical - P
Abstract - A
Cas
Continuant - C
Occurent - O
Kategorie
primitivní termíny, nedefinovatelné v rámci dané ontologie.
40. KR Ontology Independent
An entity characterized by some inherent Firstness, independent of any relationships it may have to other entities.
Relative
An entity in a relationship to some other entity.
Mediating
An entity characterized by some Thirdness that brings other entities into a relationship. An independent entity need not have any relationship to anything else, a relative entity must have some relationship to something else, and a mediating entity creates a relationship between two other entities.
41. KR Ontology Independent
(?x:Independent) ~?(?y)(has(x,y) v has(y,x)).
Relative
(?x:Relative) ?(?y)(has(x,y) v has(y,x)).
Mediating
(?m:Mediating)(?x,y:Entity) ((?R,S:Relation)(R(m,x) & S(m,y))) & ?(?T:Relation)T(x,y).
42. KR Ontology Endurant (continuant) entity celé prítomny v kadém okamiku své existence.
Pendurant (occurent) entity u nich v kadém okamiku existuje jen temporální cást.
Endurant (continuant) - entities that are in time, they are wholly present (all their proper parts are present) at any time of their existence.
Pendurant (occurent) - entities that happen in time, they extend in time by accumulating different temporal parts, so that, at any time t at which they exist, only their temporal parts at t are present.
Endurant (continuant) - entities that are in time, they are wholly present (all their proper parts are present) at any time of their existence.
Pendurant (occurent) - entities that happen in time, they extend in time by accumulating different temporal parts, so that, at any time t at which they exist, only their temporal parts at t are present.
43. KR Ontology Endurant
kniha
osoba
Pendurant
cetba této knihy
ivot cloveka
44. KR Ontology
46. SUMO Suggested Upper Merged Ontology
(http://ontology.teknowledge.com/)
Formáty KIF, OWL, Protege, LOOM,
Nekteré koncepty mohou mít více nadkonceptu, e.g. PsychologicalDysfunction is a child of both PsychologicalAttribute and DiseaseOrSyndrome.
47. SUMOTop-level
50. Set can be an arbitrary set of things
Collection consists of disconnected parts, and the relation between these parts and the whole is known as member in the SUMO. SUMO
53. DOLCE Descriptive Ontology for Linguistic and Cognitive Engineering
(http://www.loa-cnr.it/DOLCE.html)
WonderWeb project
library of such foundational ontologies, systematically related to each other in a way that makes the rationales and alternatives underlying different ontological choices as explicit as possible.
55. DOLCE Library of modules
Ontology Modules ontologie v pocitacove zpracovatelném formátu
Neformální informace o ontologických rozhodnutích prijatých pro daný modul
Prehled základní logické axiomatizace prijaté v kadém modulu
Specification of differences and similarities existing among modules:
An informal discussion on the differences between the ontological choices adopted.
A logical specification of the formal links (i.e., syntactic and semantic correspondences) existing between the various modules.
A mapping between ontology modules and natural language lexicons (WordNet)
Specification of differences and similarities existing among modules:
An informal discussion on the differences between the ontological choices adopted.
A logical specification of the formal links (i.e., syntactic and semantic correspondences) existing between the various modules.
A mapping between ontology modules and natural language lexicons (WordNet)
56. DOLCE not intended as a candidate for a universal standard ontology, but rather as a reference module, to be adopted as a starting point for comparing and elucidating the relationships with other future modules of the library.
57. DOLCE
58. Tvorba obsahu (doménových) ontologií
59. Doménové ontologie Vyvíjené pro dílcí oblast (doménu)
Príklady viz text ve sborníku
Dnes se casto predpokládá (a realizuje) tvorba informatiky bez dlouhodobých zkueností
Bene známé nástroje (editory, odvozovací systémy) zajistí jen syntaktickou a formálne-logickou správnost ontologií
Hlavními prostredky pro podporu adekvátnosti vecného obsahu jsou
Strukturované metodiky
Základní ontologie a obsahové (návrhové) vzory
Metody ucení ontologií z textu
60. Editory ontologií Nejznámejí Protégé
Dále SWOOP, TopBraid, SemanticWorks, OntoEdit, OKS (pro Topic Maps)
Vetinou umonují propojení s odvozovacími nástroji (viz dále)
Zejména Protégé dále vybaven zásuvnými moduly pro vekeré dalí myslitelné úlohy ontologického inenýrství
Velmi rozsáhlá uivatelská komunita, porádání vlastních konferencí atd.
63. Strukturované metodiky Popisují optimální proces vývoje a ivotního cyklu (zejména doménové) ontologie
Zárodky se objevují se ji cca od r. 1990
Zralé metodiky v polovine 90. let
Uschold & Grüninger (metodika vycházející ze zkuenosti s tvorbou ontologií firmy)
Gomez-Perez et al. (METHONTOLOGY)
Od té doby se výrazne nezmenily, jen podrobnejí pokrytí speciálních fází vývoje
kolaborativní tvorba ontologií, ucení ontologií z textu, vyuití základních ontologií (napr. OntoClean), mapování ontologií
64. Obvyklá posloupnost kroku Ujasnení úcelu a rozsahu ontologie
Specifikace terminologické cásti
Odliení ontologických typu
Specifikace taxonomie
Vytvorení netaxonomických relací, atributu a instancí
Specifikace pokrocilých axiomu
Nasazení a údrba ontologie
65. Ujasnení úcelu a rozsahu Formulace obecných scénáru a prípadu uití
Konkrétní vzorové kompetencní otázky
Co by melo být moné s pomocí ontologie zodpovedet?
Vyvarovat se bezbrehosti (viz hugeness problem)
Soucasne ale zachovat otevrenost pro prozatím nereené aplikace (znovupouití)
66. Specifikace terminologické cásti Východiskem vývoje ontologie bývá seznam relevantních termínu
Monost ji v této fázi vyuít podporu automatickým nástrojem text mining / ucení ontologií
Slovní definice pojmu glosár usnadnují i komunikaci mezi více vývojári navzájem
67. Odliení ontologických typu Trídy, instance, relace, atributy
Zpravidla existuje více moností!
Rozhodnutí, co jak modelovat se mue rídit mj. logickými vzory
68. Specifikace taxonomie Taxonomie zpravidla tvorí páter ontologie
Budovat se dá
Shora dolu
velmi obecné doménové ontologie, prímo navázané na základní ontologie
Zdola nahoru
napr. ontologie orientované na pouívanou terminologii
Ze stredu ven
od nejfrekventovanejích pojmu casto nejefektivnejí zpusob
Nejobecnejí pojmy z doménové ontologie je kadopádne vhodné navázat na nekterou základní ontologii resp. obsahový vzor
Vedle taxonomie nadrazenosti pojmu se casto uplatní partonomie (celek-cást), struktury závislostí apod.
69. Netaxonomické relace, atributy, instance Duleité je jejich umístení na vhodnou hierarchickou úroven
Relace a atributy v ontologických jazycích nekdy do znacné míry splývají
Napr. objektové a datotypové vlastnosti v OWL
Instance se zpravidla zarazují jen tehdy, pokud mají v doméne zásadní postavení
Zejména jsou-li potrebné pro definování tríd
70. Specifikace pokrocilých axiomu Nedelá se vdy, jen pokud se nad ontologií predpokládá sofistikovanejí odvozování
Napr. výrazy definující príslunost instancí ke tríde, prípadne relaci; ekvivalence tríd; disjunktnost tríd; matematické vlastnosti relací
Zpravidla nejprve v predikátovém jazyce, teprve následne se reí napr. orezání do deskripcní logiky
71. Nasazení a údrba Ontologie zpravidla nejprve vzniká na papíre (nejprve v podobe textových glosáru, pozdeji tabulek), teprve po ustálení struktury se kóduje ve zvoleném jazyce
Pred vlastním nasazením je potreba provést evaluaci
v prípade ontologií je objektivní formální evaluace velmi obtíná, spíe vstupují do hry subjektivní faktory
Dlouhodobe se doména mue vyvíjet, bývá potreba napr. verzování
72. Ucení ontologií Textové materiály jsou témer vdy významným vstupem; vedle vyuití jako vodítka pro lidského návrháre na ne lze aplikovat i automatické techniky
Pokrocilé metody ucení ontologií do jisté míry replikují kroky rucní tvorby ontologií
nalezení terminologie; rozliení tríd a instancí; konstrukce taxonomie; nalezení a pojmenování netaxonomických relací; ucení axiomu
Základem jsou techniky zejména
z oblasti IR (TFIDF apod.)
z oblasti NLP (Hearst patterns apod.)
Lze pouít od zacátku, nebo i pro doplnení ji existující ontologie (ukázka na konci tutoriálu?)
73. OntoClean Specializovaná metodologie, jejím cílem je omezit výskyt nejbenejích modelovacích chyb, a zajistit konzistenci výsledné ontologie.
Vyvinutá N. Guarinem a C. Weltym.
Vychází z obecne teoretických výzkumu v oblasti filosofické ontologie.
74. OntoClean Metavlastnosti
popisují jednotlivé soucástí navrhované ontologie.
omezují dalí vývoj ontologie pouze na s ohledem na OntoClean konzistentní rozírení.
monují vykázat existující nekonzistence v dané ontologii.
75. OntoClean Esencialita
Vlastnost je pro entitu esenciální, pokud ji daná entita musí mít.
Rigidita
Speciální typ esenciality.
Vlastnost je rigidní, pokud je esenciální ve vech svých prípadech.
Páterní taxonomie ontologie
zahrnuje vechny rigidní vlastnosti.
76. OntoClean Identita
kadá entita v ontologii by mela mít urcité kriterium identity a rigidní vlastnosti, které toto kritérium identity popisují.
Jednota
v jakém vztahu jsou cásti urcité entity k celku.
Subsumpce, trída-instance, cást-celek.
77. OntoClean Pouití v praxi.
Napr. plugin pro ontologický editor Protégé.
79. Návrhové vzory v ontologickém inenýrství
80. Co je návrhový vzor (pattern)?
Historical sense, e.g. OEDs: middle-age Latin patronus, meaning patron, and, metonymically, exemplar: something proposed for imitation
General sense, e.g. Webster's, (f) entry: Ťa discernible coherent system based on the intended interrelationship of component partsť
Theoretical architecture, Alexander (1979): archetypal solutions to design problems in a certain context
Software engineering, (Gamma et al. 1995, Baker et al. 1999, Maplesden et al. 2002): formatted guidelines in software reuse, recently also attempts at formalization
Data modelling, e.g. Hay 1996: a convention of thought to be encoded in a modelling language like ER or UML, and then reused for local conceptual schemas
Knowledge engineering, Clark 1997: Ťa theory template or schema, which denotes a structure of objects and relationships, but whose axioms are not directly part of the global KBť
Ontology engineering and the semantic web, (Reich 2000, Gangemi 2003,2005, W3C SWBPD 2003-5, Soshnikov 2003, Guizzardi et al. 2004, Svatek 2004, Vrandecic 2005): various schemas and macros for UML, OWL, core ontologies, etc.
81. Peter Clark A pattern is a theory template. It denotes a structure that is invariant under signature transformation.
Pattern validity in an application is then left to a subjective decision.
A pattern is a first-order theory whose axioms are not part of the target knowledge base, but can be incorporated via a renaming of their non-logical symbols
A theory acquires its status as a pattern by the way it is used, rather than by having some intrinsic property
A pattern is implemented as an explicit, self-contained theory, then is category-theoretically morphed for each intended application in the target knowledge base
82. Typy návrhových vzoru Logické (formální) návrhové vzory
Logical (formal) pattern
Neobsahují specifický slovník
Logical Ontology Design Patterns (LODeP)
budeme se jim venovat po prestávce
Obsahové návrhové vzory
Conceptual (content) pattern
Obsahují specifický mimo-logický slovník
Content Ontology Design Patterns (CODeP)
83. Obsahové návrhové vzory Nalezení invariant
(Formální) zakódování invariant
Anotace jako metody pro reení urcitého typu problému.
Uloení anotovaného invariantu ve forme CODeP.
Search for invariances
(Formally) encode the invariance
Annotate it as a method to help solving a usage problem
Store the framed (annotated) invariance in the form of a CODeP
Search for invariances
(Formally) encode the invariance
Annotate it as a method to help solving a usage problem
Store the framed (annotated) invariance in the form of a CODeP
84. Participation pattern Vybraní uchazeci se budou úcastnit finále výberového rízení.
Francesco Totti prihrál míc Zambrottovi a ten vystrelil a minul bránu.
An object at rest tends to STAY AT REST and an object in motion tends to STAY IN MOTION with the same speed and in the same direction unless ACTED UPON BY an unbalanced force
An object at rest tends to STAY AT REST and an object in motion tends to STAY IN MOTION with the same speed and in the same direction unless ACTED UPON BY an unbalanced force
85. Participation pattern
86. Descriptions and Situations Pattern
87. Descriptions and Situations Pattern
88. Descriptions and Situations Pattern
91. Po prestávce: Logické pozadí ontologického inenýrství
OWL-DL: struktura jazyka
Odvozování v deskripcní logice
Logické paradoxy OWL-DL
Strukturne-logické vzory a konvence
Aplikace ontologií
Strucný prehled
Demo: anotování multimédií pomocí ontologie
Interaktivní procvicení tvorby ontologie
Návrh ontologie porádání konference vycházející ze zkueností s Datakonem