1 / 76

Semantika koolitus . Moodul 4 Semantikavarade haldamine

Semantika koolitus . Moodul 4 Semantikavarade haldamine. /koolituse koht, aeg, asutus/ /koolitajad/. Tellija: Euroopa Liidu struktuurifondide programm “Infoühiskonna teadlikkuse tõstmine”. K oolitusmooduli eesmärk. Selgitada semantikavarade haldamise olemust

Download Presentation

Semantika koolitus . Moodul 4 Semantikavarade haldamine

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Semantikakoolitus. Moodul 4Semantikavaradehaldamine /koolituse koht, aeg, asutus/ /koolitajad/ Tellija: Euroopa Liidu struktuurifondide programm “Infoühiskonna teadlikkuse tõstmine”

  2. Koolitusmooduli eesmärk • Selgitada semantikavarade haldamise olemust • Tutvustada haldamise protsesse ja töövõtteid • Tutvustada haldamisega seotud probleeme läbi praktiliste harjutuste • Aidata tuvastada semantikavarade haldamise edukaks läbiviimiseks vajalikud nõuded nende terve elutsükli jooksul koolitusel osaleja organisatsioonis

  3. Milleks haldamine Probleem

  4. Teenustepõhine arhitektuur (SOA) Dirk Krafzig, Karl Banke, and Dirk Slama. Enterprise SOA. Prentice Hall, 2005

  5. X-tee andmeteenustest* • Kokku ~4000 andmevälja • ~1400 erinevat tippelemendi nimetust • Ca 2000 defineeritud andmetüüpi/päringut • Top 10% mõistetest katab ca 50% annotatsioonidest – 20% ca 80% • Orienteeruv mõistete arv (andmeobjektid) – min 1000 (vaid andmed) - 2000 (kvaliteetne ontoloogia) *Ca 50% andmeteenuste baasil (24 WSDL dokumenti, 538 andmeteenust)

  6. X-tee kui andmekogu Haldamiseks on vaja organisatsiooni ja toetavaid protsesse

  7. Semantikavarad Part of Ontoloogiad Is a E207 Klassifikaatorid Part of Taksonoomiad Subclass Tesaurused numbriline kood, mis on ette nähtud katastriüksuste identifitseerimiseks Sõnaraamatud katastriüksus katastritunnus katastris iseseisva üksusena registreeritud maatükk

  8. Probleemid (1) • Andmete ja andmeteenuste kirjeldusi on palju • Andmeteenuste hulk on suur ning üha kasvav • Kirjeldused on omavahel seotud • Teenuste kirjeldused viitavad andmeobjektide kirjeldustele • Andmekoosseisude kirjeldused viitavad andmeobjektide kirjeldustele • Andmeobjektide kirjeldused on defineeritud ontoloogiates • Muudatused ühes kirjelduses tingivate seotud kirjelduste kaasajastamise

  9. Probleemid (2) • Kirjelduste kõrge kvaliteedi tagamine on keerukas • Eeldab vastava know-how olemasolu • Vajalik stabiilsus ja järjepidev haldamine • Erinev andmete/teenuste semantika erinevates valdkondades

  10. Semantikavarade haldamise põhimõtted Kirjelduste haldamine

  11. Standardid • WSDL – teenuste süntaktiline kirjeldamine • XSD – andmetüüpide süntaktiline kirjeldamine • OWL – valdkonnamudelite kirjeldamine • SA-WSDL – süntaktiliste kirjelduste (WSDL) sidumine semantikaga (OWL)

  12. Semantilise koosvõime võtmepõhimõtted (1) • Semantilisel kirjeldamisel rakendatakse järgnevaid keeli ning nende laiendusi: XSD, OWL, WSDL, SA-WSDL, WS-BPEL • Riigi infosüsteemide nii inim- kui masinloetavad semantilised kirjeldused on tasuta kättesaadavad • Iga ministeerium on kohustatud looma ning seejärel haldama oma valitsemisalaga seotud semantilisi varasid • Ontoloogiate ja valdkonnasõnastike valdkonniti kattuvate osade loomine ning haldamine toimub meeskonnatöö vormis

  13. Semantilise koosvõime võtmepõhimõtted (2) • Kõik institutsioonid on vabad oma infosüsteemide sisemise arhitektuuri ja koosvõime põhimõtete valikul, kuid nende omavahelisel seostamisel on kohustuslik on järgida raamistiku põhimõtteid (nn subsidiaarsuse põhimõte) • Infosüsteemide semantiline koosvõime Eestis on strateegiline valik, kusjuures avalik sektor näitab semantilise koosvõime põhimõtete järgimisel eeskuju • Semantiliste varade loomiseks ja haldamiseks vajalike tehnoloogiate väljatöötamisele suunatud tegevused seostatakse teadus- ja arendustegevusega Eestis • Semantiliste varade loomisel ja haldamisel arvestatakse korduvkasutatavuse põhimõtteid

  14. Semantilise koosvõime võtmepõhimõtted (3) • Erasektorile tagatakse ligipääs infosüsteemide semantilise kirjeldamise keskkonnale ning võimalus kirjeldada semantiliselt omi infosüsteeme sarnastel alustel mil avaliku sektori esindajad riigi infosüsteeme • Semantiline koosvõime toetab e-Äri lahenduste loomist, vajadusel ettevõtete infosüsteemide liidestamist riigi infosüsteemidega ning riigi poolt kodanikele pakutavate teenuste personaliseerimist • Riik soosib eraettevõtete ja nende ühenduste kaasatust semantiliste varade loomisel, publitseerimisel ja rakendamisel

  15. Haldamise põhimõtted (1) • Varade lisamine • veendutakse, et see ei dubleeri olemasolevaid • Vara ümbernimetamine • suunatakse vastavale varale osutavad viited ümbernimetatud varale • Varade mestimine • suunatakse esialgsetele varadele osutavad viited üldisemale varale

  16. Haldamise põhimõtted (2) • Varade poolitamine • säilitatakse viide kas üldisemale varale või luuakse uus semantikavara, mis ei välista viidet ühelegi konkretiseerimise tulemusena tekkinud varale • Varade kustutamine • lahendatakse sõltuvused • Semantikavaradesse tehtud muudatused kajastuvad vastavus- ja teisendustabelites, mis talletavad semantikavarade haldamisel tehtud operatsioone ning lisaks kajastavad varade teisendusi ühest valdkonnast teise

  17. Semantikavarade loomine valdkonniti • Terminoloogiate loomine • Tesauruste loomine • Ontoloogiate loomine • Andmekoosseisude- ja teenuste semantiline kirjeldamine

  18. Semantikavarade haldamine valdkonniti • Semantiliste varade haldamisel valdkonniti eemaldatakse liiasus erinevate varade lõikes • Tagatakse kõikide semantiliste varade maksimaalne korduvkasutus • Korduvkasutus tähendab vastavate valdkondade piires erinevat liiki semantiliste varade seostamist omavahel

  19. Semantikavarade valdkonnaülene mestimine • Valdkonnaülest semantiliste varade mestimist võiks vaadelda kahe protsessina: • vastavustabelite loomine • valdkonnaüleste semantiliste varade loomine ja haldamine

  20. Teavitamine • Organisatsiooni sees • Organisatsioonide vahel • Millal? • Semantiliste varade importimine • Terminite terminoloogiast kustutamine • Terminitevaheliste seoste kustutamine • Mõistete ontoloogiast kustutamine • Mõistetevaheliste seoste kustutamine • Mõistete mestimine • Andmeteenuste andmetüüpidelt ja nende väljadelt mõistelise vastavuse kustutamine • Semantikavarade sisu muutmisel

  21. Haldaja vahetamine • Seoste nimekirja baasil analüüsitakse erinevate omanike semantikavarasid puudutavate seoste arvu • Kontakteerutakse enim seoseid omavate omanikega ning alustatakse läbirääkimisi • Tuvastatakse uus omanik ning tingimused semantikavarade omaniku vahetamiseks • Viiakse semantikavarad vastavusse uue omaniku nõuetega • Antakse semantikavarad üle

  22. Semantikavara käibelt eemaldamine • Luuakse sõltuvuste nimekiri • Tuvastatakse teised semantikavarad ning rakendused, mis sõltuvad eemaldatavatest • Eemaldatakse sõltuvused seotud kehtivatest semantikavaradest • Eemaldatakse sõltuvused rakendustest • Arhiveeritakse eemaldatavad semantikavarad • Eemaldatakse semantikavarad käibelt

  23. Näidisprotsesside ja organisatsiooni tutvustamine Organisatioon

  24. Semantikavarade elutsükkel

  25. Organisatioon • Organisatsioon on vajalik projektide jätkusuutlikkuse tagamisel • Vajadus semantilise kirjeldamise protseduuriliste ja sisuliste eeskirjade järele, mida kõik osalised jälgiksid • Järgnevad rollid peavad olema esindatud: • Integraator (tarkvara arendaja) • Teadmusinsener • Valdkonnaekspert

  26. Vajalik kompetents

  27. Valdkonna ontoloogiate loomine

  28. Semantiline kirjeldamine

  29. Andmekoosseisude loomine

  30. Semantikavarade haldamine

  31. Utiliseerimine ja rakendamine

  32. Teadmiste haldamine

  33. Mõistete baasi ühtlustamine ja vigade eemaldamine Ontoloogiate haldamine

  34. Valdkonnasisene haldamine • Mõistete ja seoste ümbernimetamine • Mõistete ja seoste kirjelduste redigeerimine • Uute mõistete ja seoste lisamine • Mõistete ja seoste kustutamine • Mõistete ja seoste migreerimine teistesse ontoloogiatesse • Mõistete mestimine ja poolitamine • Reeglite lisamine, muutmine, kustutamine • Anomaaliate eemaldamine

  35. Valdkonnaülene haldamine • Sarnaste mõistete ja omaduste tuvastamine valdkonnaüleselt • Sama sisuga mõistete ja omaduste mestimine • Uute valdkonnaüleste ontoloogiate loomine koostöös teiste ontoloogiate haldajatega • Vastavustabelite loomine erinevate ontoloogiate mõistete ja omaduste vahel

  36. Dokumentatsiooni haldamine • Mõistete ja omaduste identifikaatorite ümbernimetamine • label, comment, version kasutamine • mõiste, omaduse, ontoloogia kirjelduses • Mitmekeelne dokumentatsioon • Keelemärgendite täiendamine • lang atribuut

  37. Ontoloogiate mestimine • Vali 2 ontoloogiat • Tuvasta sarnased mõisted • Analüüsi nende kattuvust • Tuvasta sarnased seosed • Analüüsi nende kattuvust • Mesti kattuvad mõisted ja seosed ning loo vajadusel uued mõisted ja seosed

  38. Mõistete migreerimine • Valitakse migreeritav mõiste või omadus • Valitakse sihtontoloogia • Tuvastatakse rekursiivselt millised mõisted või omadused tuleb koos valitud mõistega migreerida • Valitud mõisted ja omadused lisatakse sihtontoloogiasse • Kaasajastatakse viited migreeritavatele mõistetele • Mõistega seotud teiste semantiliste varade omanikke teavitatakse migreerimisest ning palutakse neil seotud viited kaasajastada

  39. Mõistete mestimine • Valitakse sarnase sisuga mõisted • Analüüsitakse nende kasutamist (viited nendele) • Tuvastatakse mõistete sisu samasus • Kokkuleppel sama sisuga mõistete haldajatega luuakse uus või muudetakse kõige paremini sobiva mõiste inimkeelset dokumentatsiooni • Liidetakse kokku erinevate sama sisuga mõistete omadused

  40. Mõistete poolitamine • Tuvastatakse, et sama mõistet kasutatakse erinevates interpretatsioonides • Luuakse iga interpretatsiooni jaoks uus detailsem mõiste kirjeldus • Lisatakse uued mõisted vana mõiste alammõisteteks • Vajadusel lisatakse uued omadused

  41. Anomaaliate eemaldamine

  42. Anomaaliad (1) • Taksonoomilised vead • Inconsistency • Circularity • Partition errors • Semantic errors • Incompleteness • Concept classification • Exhaustiveness • Redundancy • Grammatical • Identity

  43. Anomaaliad (2) • Disaini anomaaliad • Lazy concepts • Chains of inheritance • Lonely disjoints • Property clumps

  44. Anomaaliate tuvastamise tööriistad • Loomise käigus • Vastuolude tuvastamine • Tuletusmootorid ja teoreemitõestajad: Jena (Racer(Pro), FaCT, Pellet), JESS • SEHKE • Peale publitseerimist • Hindamine • Peer review, eksperthinnangud jms • SEHKE

  45. Andmeobjektide kirjelduste üldistusaste • Sisemisi indekseid, mis välja eipaista, pole vaja kirjeldada • Aluseks IS integratsiooni vajadused • Piisav detailsus andmete üheseks mõistmiseks • Nt “Kood” vs “Isikukood” vs “Õppuri isikukood” • Sobituvus teistesse lahendustesse

  46. Andmeteenuste ja -koosseisude semantiliste kirjelduste kaasajastamine Semantiliste kirjelduste haldamine

  47. Semantilise kirjeldamise kulu • Andmestruktuuride ja nende elementide arv XSD ja XMI dokumentides • XML elementide dokumentatsiooni kättesaadavus projekti kontekstis • Valdkonna ontoloogia suurus • Andmeteenuste WSDL kirjelduste detailsus • Andmekoosseisude XMI kirjelduste kvaliteet • Spetsiaaltööriistade olemasolu

  48. Dokumenteerimine (WSDL/XSD) • SA-WSDL modelReference jt atribuudid • X-tee märgendid: • notes, technotes, title • WSDL/XSD märgendid • xsd:annotation/xsd:documentation, wsdl:documentation • mitmekeelsus – lang atribuut • WSDL nimeruumis pole elemendil documentation keelemärgend võimalik

  49. Dokumenteerimine (XMI)

More Related