330 likes | 518 Views
Ontologie w systemach informacyjnych. Spis treści. Ontologia - definicje Ontologia w systemach informacyjnych Cele inżynierii ontologicznej Charakterystyka systemów ontologii Przykład – SUMO Zastosowania Problemy. Ontologia – definicje. Tries to answer the questions: What is being?
E N D
Spis treści • Ontologia - definicje • Ontologia w systemach informacyjnych • Cele inżynierii ontologicznej • Charakterystyka systemów ontologii • Przykład – SUMO • Zastosowania • Problemy
Ontologia – definicje Tries to answer the questions: • What is being? • What are the features common to all beings? • Representation Languages
Ontologia – definicje • Ontologia: • teoria bytu, podstawowy dział filozofii zajmujący się badaniem charakteru i struktury rzeczywistości (Aristotle, Metaphysics, IV, 1) • określa rodzaje istniejących obiektów, właściwości, zdarzeń, procesów, relacji • opis rzeczywistości umożliwiający wyczerpującą klasyfikację bytów • Kluczowe zagadnienia: • Istnienie, identyczność, właściwość, realność / hipotetyczność, zależność, możliwość, konieczność, powszechność / wyjątkowość, rzecz / proces, zdarzenie, czas, przestrzeń, przyczyna, ilość • Ontologia - opisanie rzeczywistości/związków (a nie wytłumaczenie) • Credo ontologiczne – aby stworzyć dobre reprezentacje należy mieć wiedzę o reprezentowanych obiektach i procesach – odnosić się do nich
Ontologie w systemach informacyjnych • Obszary informatyki odnoszące się do ontologii: • inżynieria programowania • Struktury danych – reprezentacje ‘rzeczy’ i programy - procesy • Model obiektowy • Współdzielenie kodu – biblioteki, moduły • Systemy baz danych • Projektowanie struktur baz danych – modelowanie konceptualne • Sztuczna inteligencja; przetwarzanie języka naturalnego (NLP), systemy eksperckie
Cele inżynierii ontologicznej • Spójna i jednorodna platforma reprezentacji i wymiany wiedzy • Oszczędność czasu – podstawowe pojęcia i relacje już zaprojektowane; uniknięcie modelowania ontologicznego ‘ad hoc’; rozjaśnienie problemów • Bogatsze narzędzia wyrazu - zbliżone do języka naturalnego • Integracja międzysystemowa • Wyszukiwanie informacji • Bardziej inteligentne systemy – dodanie odniesienia ontologicznego • Zorientowanie na cele – obiekty rzeczywistości – software bardziej elastyczny, adoptowalny • Umożliwienie automatycznego wnioskowania
Podstawowa charakterystyka systemu ontologii • Formalizmy modelu • Logika formalna, algebra, teoria kategorii, mereologia, teoria zbiorów, topologia, formalna analiza pojęć • Klasyfikacje (taksonomie) podstawowych pojęć • Forma drzewiasta (albo krata, graf) • Liście wyczerpujące wszystkie możliwości • Jeden korzeń – najbardziej ogólna kategoria • Ontologia jako rodzina drzew – różne perspektywy rzeczywistości, np. skala mikro / makro, stosunek do czasu, itd. • Język naturalny (np. angielski) – do ustalania nazw • Aksjomaty • relacje między podstawowymi pojęciami wyznaczające interpretacje pojęć • System dedukcyjny
Podstawowe elementy ontologii i przykładowa aksjomatyzacja • Całość / część • Ozn.: P(x,y) – x jest częścią y • (P1) P(x,x) • (P2) P(x,y) and P(y,x) -> x = y • (P3) P(x,y) and P(y,z) -> P(x,z) • Połączenie • (C1) C(x,x) • (C2) C(x,y) -> C(y,x) • (C3) P(x,y) -> forall z (C(z,x) -> C(z,y)) • Zależność / niezależność • (D1) D(x,x) • (D2) D(x,y) and D(y,z) -> D(x,z) • (D3) P(x,y) -> D(y,x) • Identyczność / różność; Jedność / wielość; podzielność / niepodzielność; złożoność / elementarność; • Czas, przestrzeń, ruch • Np. połączenie, rozdzielenie, zetknięcie, separacja, zawieranie, przecięcie • Procesy / zdarzenia • modalność
Perspektywa pragmatyczna • Metody wyznaczania kategorii • przez potrzeby, praktykę, doświadczenie, codzienność, postrzeganie • Język naturalny, części mowy • Metody ewolucyjne • Kryterium czytelności (na różnych poziomach) • Specjalizacja ontologii • Łączenie ontologii nie zawsze jest uzasadnione • ontologie domenowe, np. działalność przedsiębiorstwa, geografii, genomu człowieka, społeczeństwa, ekologii, finansów przedsiębiorstwa • zorientowanie na cele i zadania • Jednoczesne używanie kilku ontologii (języki obce) • Ontologia jako model przybliżony • Wydajność systemu • Wpływ na język reprezentacji • Ograniczenia ilościowe
Pierwsze systemy języków (formalnych) do reprezentowania ontologii • KL-ONE, sieci semantyczne • CyCL (1990) – http://www.opencyc.com • LOOM [MacGregor, 1991] • Conceptual Graphs [Sowa, 1993] • Ontolingua [Gruber, 1993] and KIF [Genesereth & Fikes,1992] • F-Logic [Kifer, Lausen, Wu, 1995] Important question: Are the represented ontologiesexecutable, is a reasoning service available?
Inne systemy języków (formalnych) do reprezentowania ontologii • OntoMap – http://www.OntoMap.org • Ontolingua • DAML+OIL (http://www.daml.org , http://www.ontoknowledge.org/oil ) • Systemy ‘description logics’: BACK, CLASSIC, CRACK, FLEX, K-REP,
Nowe systemy języków (formalnych) do reprezentowania ontologii • RDF / RDF-Schema [Brickley, Guha, 98] • UML: Unified Modeling Language • XOL: Ontology Exchange Language (cf. http://www.ai.sri.com/~pkarp/xol/) • DRDFS: Web-based Representation using Conceptual Graphs [Delteil et al., 01] • Rule Markup Language (http://www.dfki.uni-kl.de/ruleml/)
Nowe systemy języków (formalnych) do reprezentowania ontologii
Nowe systemy języków (formalnych) do reprezentowania ontologii • RDF Semantics • W3C Recommendation 10 February 2004 • This Version: • http://www.w3.org/TR/2004/REC-rdf-mt-20040210/ • Latest Version: • http://www.w3.org/TR/rdf-mt/ • Previous Version: • http://www.w3.org/TR/2003/PR-rdf-mt-20031215/ • Editor: • Patrick Hayes (IHMC)< phayes@ihmc.us> • Series Editor • Brian McBride (Hewlett Packard Labs)<bwm@hplb.hpl.hp.com> • Please refer to the errata for this document, which may include some normative corrections.
Przykład istniejącego systemu ontologii – SUO/SUMO • SUO – Standard Upper Ontology • SUO – grupa robocza IEEE mająca za zadanie stworzyć SUMO (http://suo.ieee.org) • SUMO – Suggested Upper Merged Ontology • SUMO powstała z integracji wielu publicznie dostępnych ontologii • SUMO ma docelowo zawierać 1000-2500 pojęć i około 10 zdań definiujących dla każdego pojęcia • Ontologia dostępna w sieci: http://ontology.teknowledge.com/ • SUO-KIF – język podstawowy SUMO • KIF (Knowledge Interchange Format) - 1992 Stanford – Mike Genesereth • Zaprojektowany jako narzędzie wymiany i integracji wiedzy; elastyczne, czytelne dla człowieka i maszyny • wariant rachunku predykatów 1 rzędu, podobny do LISPa • semantyka teorii zbiorów • Mechanizmy meta-językowe • ‘konceptualizacja’: 1.zbiór obiektów mających istnieć w świecie, 2.zbiór właściwości, relacji i funkcji jako zbiór uporządkowanych par • Obiekt: indywiduum, zbiór lub klasa • Świat zawiera: liczby zespolone, obiekt będący wartością funkcji dla niesensownej kombinacji argumentów funkcji, wszystkie skończone listy i zbiory obiektów, słowa kluczowe i wyrażenia KIF
SUO/SUMO –c.d. Moduły ontologii SUMO Szczyt hierarchii podstawowej SUMO Przykład aksjomatyzacji
SUO/SUMO –c.d. Przykład aksjomatyzacji
SUO/SUMO –wybrane elementy • Pojęcia podstawowe • Fizyczne, Abstrakcyjne • Obiekty • ZłożonyZCzęści, Region, Collection, Agent • Procesy • Dwuobiektowy, Intencjonalny, Ruch, ZmianaWewnętrzna, • Abstrakty • ZbiórLubKlasa, Relacja, Proposition, Ilość, • Struktury • M.in.: instancja, domena, poddomena, zakres, partycja, rozdzielny • Podstawowe relacje binarne • Symetryczne, asymetryczne, antysymetryczne, itd. • Role: agent, cel, źródło, itd. • Przedmioty • M.in.:Ubranie,dzieło sztuki, budynek • Urządzenia: instrument muzyczny, broń, maszyna, itd. • Liczby • Jednostki • Organizmy • Pojęcia czasowe • Przedział czasu • Punkt czasowy • Mereologia • Przestrzeń • Poniżej, powyżej, pomiędzy, odległość, położenie • Semiotyka • Słowo, zdanie
SUO/SUMO –przykład pojęcia ‘matka’ (<=> (sibling ?ANIMAL1 ?ANIMAL2) (and (not (equal ?ANIMAL1 ?ANIMAL2)) (exists (?FATHER ?MOTHER) (and (father ?ANIMAL1 ?FATHER) (father ?ANIMAL2 ?FATHER) (mother ?ANIMAL1 ?MOTHER) (mother ?ANIMAL2 ?MOTHER)))))
Wordnet • Wordnet (http://www.cogsci.princeton.edu/~wn) WordNet contains • 118.000 word forms • 90.000 word meanings • WordNet categorizes word into syntactic categories – (N, noun) – (V, verb) – (Adj, adjective) und – (Adv, adverb). WordNet additional contains semantic relations between word meanings
CyC • CyC • Initiated in the course of AI, making common-sense knowledge accessible and processable • groups concepts into micro theories; micro theories are a means to express context dependency of knowledge • upper-level ontology (3000 concepts) public available • http://www.cyc.com/cyc-2-1/index.html • recent development: „Bringing Cyc to the Web“ • http://www.e-cyc.com/ • Open source project is going: http://www.opencyc.org/
Sensus Architecture of SENSUS The Sensus ontology (formerly known as the Pangloss ontology) is a freely available `merged' ontology produced by the Information Sciences Institute (ISI) http://www.isi.edu/natural-language/resources/sensus.html
Sensus • Development of a wide ontology (SENSUS) for systems that analyze and understand natural language: • concepts are embedded into a is-a-hierarchy • SENSUS has been developed from different existing resources through integration and adap tation (1) very generic natural language ontologies (PENMAN Upper Model, ONTOS) (2) WordNet (3) machine readable dictionaries SENSUS contains approx. 50.000 concepts
UMLS (Unified Medical Language System) (I) Provided by the National Library of Medicine (NLM), a database of medical terminology. • terms from several medical databases (MEDLINE, SNOMED International, Read Codes, etc.) are unified so that different terms are identified as the same medical concept. • Access at http://umlsks.nlm.nih.gov/ • Documentation available at:http://www.nlm.nih.gov/research/umls/UMLSDOC.HTML
UMLS (II) • UMLS Knowledge Sources: • – Metathesaurus provides the concordance of medical concepts: • • 730.000 concepts • • 1.5 million concept names in different source vocabularies • – SPECIALIST Lexicon provides word synonyms, derivations, lexical variants, and grammatical forms of words used in MetaThesaurus terms • • 130,000 entries. • – Semantic Network codifies the relationships (e.g. causality, "is a", etc.) among medical terms. • • 134 semantic types, 54 relationships.
Kierunki badań / problemy • Automatyczne budowanie i specjalizowanie ontologii • Łączenie ontologii • Zastosowanie technik ontologicznych w istniejących systemach • Efektywne implementacje ontologii – bazy danych, reprezentacje, indeksy • Metody ewolucyjne / adaptacyjne • Zmienność rzeczywistości – stosunek ontologii do czasu • Od ontologii do inteligencji
Współdziałanie ontologii - IFF • IFF – The Information Flow Framework • Ontologia teorii integracji ontologii domenowych • Ontologie: współdziałanie, manipulowanie, morfizmy, partycjonowanie, zależności • Bazuje na teorii przepływu informacji, teorii formalnej analizy pojęć
Zastosowania • Integracja międzysystemowa • E-commerce • Edukacja • Medycyna, prawo, finanse, wojskowość • Technologie NLP