1 / 26

TEI Header

TEI Header. Mats Dahlström Digitalisering av kulturarvet Januari 2008. Metadata. Data om data // information om dokumentet  bibliografiska data Metadata för samlingar av dokument ett dokument ett dokumentsegment. Metadata / typ. Beskrivande metadata Strukturella metadata

alva
Download Presentation

TEI Header

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. TEI Header Mats Dahlström Digitalisering av kulturarvet Januari 2008

  2. Metadata • Data om data // information om dokumentet  bibliografiska data • Metadata för • samlingar av dokument • ett dokument • ett dokumentsegment

  3. Metadata / typ • Beskrivande metadata • Strukturella metadata • Administrativa metadata • Rättshanteringsmetadata • Arkivaliska metadata

  4. Metadata / funktion • Dokumentation • Bibliografisk kontroll: • Identifiering och (fr.a. maskinell) återvinning av resurser • Organisering av resurser • Interoperabilitet mellan system • Rättigheter • Bruksinformation • Information till sökmaskiner • Stöd för arkivering och bevarande Läs ”Minerva” om metadata!

  5. Metadata / digitala objekt • Synliga / dolda metadata • Inbäddade / externa • “Tryckta” standarder: behov av metadaformat anpassade till digitala objekt • Flera försök att göra beskrivningen standardiserad, enhetlig, maskinläsbar (Dublin Core, PICS, TEI Header, RDF) • Dåligt stöd för metadata i SGML och HTML

  6. <teiHeader> • Syftar till att ge en beskrivning av framför allt den elektroniska resursen men också av dess källor • Kraftfull och detaljrik, genom en stor uppsättning av både element och attribut • Obligatoriska respektive valfria element • Kap. 5 i Guidelines – kap. 20 i TEI Lite • Kap 6 i övn.mtrl, inklusive figur 6.1 + bilaga D

  7. … men <front> då, med dess<docTitle> <docAuthor> etc?

  8. 4 sektioner i TEI Header <teiHeader> <fileDesc> ... </fileDesc> <encodingDesc>...</encodingDesc> <profileDesc> ...</profileDesc> <revisionDesc> ... </revisionDesc> </teiHeader>

  9. 4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description

  10. <fileDesc> • Obligatoriskt • Full bibliografisk information om den elektroniska filen och dess källa/or • Obligatoriska barnelement: • <titleStmt> • <publicationStmt> • <sourceDesc> • Valfria barnelement

  11. <fileDesc>/<titleStmt> • Obligatoriskt • Identifierar den elektroniska filen, inte dess källa/or • Obligatoriskt barnelement: • <title> • Valfria barnelement, t.ex.: • <author> [dvs till verket, av vilket den elektroniska filen är en version] • <editionStmt> [dvs om den elektroniska utgåvan] • <respStmt> [dvs för den elektroniska utgåvan]

  12. <titleStmt> <title>Author To Her Book: An Electronic Edition</title> <author> <name reg="Bradstreet, Anne">Anne Bradstreet</name> <date>1612-1672</date> </author> <respStmt> <resp>Header creation by <name>Ralph Bauer</name></resp> <resp>Encoded by <name>Ann Hanlon</name></resp> </respStmt> </titleStmt>

  13. <fileDesc>/<publicationStmt> • Obligatoriskt element • Obligatoriskt innehåll: antingen en beskrivning av resursen eller minst ngt av barnelementen: • <publisher> [förlag, organisation] • <distributor> [individ(er), sällskap etc] • <authority> • Annat: • <availability> • <address>

  14. <fileDesc>/<sourceDesc> • Obligatoriskt • Identifierar källan/orna till den elektroniska filen • Innehåller antingen beskrivning i text (<p>) eller ett el flera av barnelementen: • <bibl> [dvs till verket, av vilket den elektroniska filen är en version] • <biblFull> • <listBibl> • Ingen ”källa”?

  15. <sourceDesc> <p>No source: created in machine-readable form.</p> </sourceDesc>

  16. <sourceDesc> <bibl>The Works of Anne Bradstreet in Prose and Verse. Edited by John Harvard Ellis. (Charlestown: A. E. Cutter, 1867)</bibl> </sourceDesc>

  17. <fileDesc>/ <sourceDesc> / <biblFull> • Innehåller en egen lite full genomgång av TEI:s file description, men alltså denna gång för källresursen

  18. 4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description

  19. <encodingDesc> • Dokumenterar (val i) arbetet med den elektroniska texten och dess kod, t.ex. • <editorialDecl> (t.ex. normalisering av stavning, typ av rättelser införda) • <tagsDecl> (t.ex. märkfrekvenser) • <refsDecl> (t.ex. den princip som valts för kapitelnumrering etc) • <classDecl> (t.ex. ett klassif.schema)

  20. 4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description

  21. <profileDesc> • 3 valbara barnelement: • <creation>(högst en) • <langUsage> • <textClass>(enligt <classDecl>) med barnelement, t.ex.: • <keywords> • <classCode scheme”…”>

  22. 4 sektioner i TEI Header • File description • Encoding description • Profile description • Revision description

  23. <revisionDesc> • En ”logg” för uppdateringar, revisioner och andra ändringar som har gjorts med den elektroniska resursen. • Innehåller ett eller flera <change>. Varje <change> har: • <date> • <respStmt> (ett eller flera) • <item> (textbeskrivning av vad som gjorts)

  24. <revisionDesc> <change> <date>1996-11-19</date> <respStmt><resp>xxx</resp> <name>ASM</name></respStmt> <item>Header Edited</item> </change> <change> <date>unknown</date> <respSstmt><resp>xxx</resp> <name>JPW</name></respStmt> <item>Basic Tei Lite tagging</item> </change> </revisionDesc>

  25. TEI Headers kan … • Utgöra egna XML-dokument • Vara kraftfulla metadataresurser • Översättas (t.ex. via XSLT) till andra metadatascheman, t.ex. Dublin Core eller MARC 21 • Cf ”arkiv” – ”leverans”

More Related