180 likes | 313 Views
Open source vs. Komerční řešení pro digitální repozitáře. Andrea Fojtu Univerzita Karlova v Praze, Národní knihovna ČR. O čem bude řeč…. Dlouhodobá ochrana DD (DODD). Dlouhodobá ochrana:
E N D
Open source vs. Komerčnířešení pro digitálnírepozitáře Andrea Fojtu Univerzita Karlova v Praze, Národní knihovna ČR
Dlouhodobá ochrana DD (DODD) Dlouhodobáochrana: • anglo-americké prameny: digital preservation, (long-term) preservation of digital objects nebo také digital curation • důležitost digitální ochrany asi nejlépe vystihuje výrok Rothenberga: “digitální informace přetrvá věčnost nebo pět let, podle toho, co přijde dříve
OAIS referenční model koncept., terminolog. rámec: Open Archival Information System Reference Model ISO 14721:2003 model –> je možné přizpůsobit konkrétním požadavkům a nárokům dlouhodobé ochrany předpoklad důvěryhodného úložiště moduly: producent – individuální vs. organizace SIP (submission information package) – vstupní informační balíček příjem– vkládání = import(individuální vs. hromadný) správa dat archivace administrace přístup plánování ochrany
OAIS referenční model HUTAŘ, Jan; MELICHAR, Marek ; STOKLASOVÁ , Bohdana. Národní digitální knihovna. Knihovna [online]. 2009, roč. 20, č. 1, s. 6-21 [cit. 2009-10-05]. Dostupný z WWW: <http://knihovna.nkp.cz/knihovna91/humesto.htm>. ISSN 1802-8772.
Výchozí bod JISC srovnávací studie: • březen 2009 • SW: CONTENTdm, Digital Commons , DigiTool, DSpace, Eprints, EQUELLA, Fedora, intraLibrary, Open Repository, VITAL, Zentity • studie: funkčnost současně dostupných open –source a komerčních systémů je velmi vyrovnaná • co v případě DODD? Kritéria: • podporované formáty • náhledy obrázků • funkce v uživatelském rozhraní • pokročilé vyhledávání • prohledávání • klasifikace/předmětové třídění • autentikace uživatelů • statistiky • SW platformy, OS, skriptovací jazyky • metadatové formáty • interoperabilita
Repository SW Survey, 2009 Repository Software Survey [online]. JISC RepositoryNet, March 2009 [cit. 2009-04-05]. Dostupný na WWW: <http://www.rsp.ac.uk/software/surveyresults>.
Porovnání & výsledky Kritéria: implementace OAIS modelu široký výběr podporovaných formátů otevřená architektura (z angl. open architecture) pro jiné aplikace a pluginy interní nástroje pro změnu formátů (např. emulace, migrace) (ne)závislost SW a/nebo HW platformy administrátorské funkce služby • Repozitáře: • open-source SW: • DSpace, Fedora, EPrints and Research-Output Repository Platform • komerční SW: • CONTENTdm, Digital Commons, Digitool, Equella, intraLibrary, Open Repository, Vital • tři relativně “nové” systémy: • Dias, SDB, Rosetta
Porovnání & výsledky #2 implementace OAIS modelu široký výběr podporovaných formátů otevřená architektura (z angl. open architecture) pro jiné aplikace a pluginy interní nástroje pro změnu formátů (např. emulace, migrace) (ne)závislost SW a/nebo HW platformy administrátorské funkce služby • Repozitáře: • open-source SW: • Fedora • implementace OAIS modelu, podpora METS, nikoliv PREMIS, open standard, nezávislost na OS, HW; závislost PC – Midrange server, SIP jako “compound digital object”, neexistence migračních a emulačních nástrojů, indexace pro plnotextové vyhledávání • neznámé: omezený počet dokumentů, limity pro hromadné importy, časování ingestů, verzování digitálních dokumentů, statistiky, podpora v ČR
Porovnání & výsledky #3 implementace OAIS modelu široký výběr podporovaných formátů otevřená architektura (z angl. open architecture) pro jiné aplikace a pluginy interní nástroje pro změnu formátů (např. emulace, migrace) (ne)závislost SW a/nebo HW platformy administrátorské funkce služby • Repozitáře: • komerční SW: • IBM DIAS • systém je různě přejmenovávan (implementován dle požadavků institucí), málo zveřejněných informací, chybí METS, PREMIS, není open standardem, závislost na OS, SW platformě; SIP jako streamový balíček (ne více jak 5 tisíc objektů), chybí verzování objektů, chybějící časování importů, webarchivace, podpora v ČR • neznámé: OAIS, HW závislost je otázná, limity pro hromadné importy, časování ingestů, statistiky
Porovnání & výsledky #4 implementace OAIS modelu široký výběr podporovaných formátů otevřená architektura (z angl. open architecture) pro jiné aplikace a pluginy interní nástroje pro změnu formátů (např. emulace, migrace) (ne)závislost SW a/nebo HW platformy administrátorské funkce služby • Repozitáře: • komerční SW: • Tessella SDB • podpora OAIS, METS (lze exportovat), PREMIS, open standard, nezávislost na OS, SW, HW platformě; SIP jako logická entita), verzování objektů, časování importů, webarchivace, statistiky, indexace pro plnotextové vyhledávání, podpora v ČR, není limit pro hromadný import
Porovnání & výsledky #5 implementace OAIS modelu široký výběr podporovaných formátů otevřená architektura (z angl. open architecture) pro jiné aplikace a pluginy interní nástroje pro změnu formátů (např. emulace, migrace) (ne)závislost SW a/nebo HW platformy administrátorské funkce služby • Repozitáře: • komerční SW: • Ex Libris Rosetta • podpora OAIS, METS (lzeexportovat), PREMIS, open standard, nezávislost na OS, SW, HW platformě; SIP jako logická entita), verzování objektů, časování importů, webarchivace, statistiky, indexace pro plnotextové vyhledávání, podpora v ČR, není limit pro hromadný import
Závěry Skutečnost: teoretické hodnocení (založené na vyhledávání v prezentacích, příspěvcích a dokumentacích na internetu) je velmi komplikované a částěčně zkreslující bude alepoň jedno SW řešení, které bude vyhovující pro dlouhodobou ochranu • open-source i komerční • ANO i NE žádný repozitář nesplní obecná kritéria hodnocení • ANO open source řešení budou vykazovat lepší výsledky díky jejich rozsáhlejší vývojářské a uživatelské komunitě • NE • Postuláty: • bude alepoň jedno SW řešení, které bude vyhovující pro dlouhodobou ochranu • open-source i komerční • žádný repozitář nesplní obecná kritéria hodnocení • open source řešení budou vykazovat lepší výsledky díky jejich rozsáhlejší vývojářské a uživatelské komunitě Důvody: problematika DODD je v “plenkách”, SW není jedinou spásou!