490 likes | 565 Views
Organização e Representação da Informação (Digitalizada). Arquivos, Bibliotecas e Museus. nuno oliveira Universidade do Minho. A Internet e a Web. Um pouco de história. 1974. 1974. Internet. IP. TCP. 1990. Web. Vinton Cerf. Robert Kahn. Timothy Berners-Lee. Um pouco de história….
E N D
I Encontro de Arquivos Contemporâneos Organização e Representação da Informação (Digitalizada) Arquivos, Bibliotecas e Museus nuno oliveira Universidade do Minho
I Encontro de Arquivos Contemporâneos A Internet e a Web
I Encontro de Arquivos Contemporâneos Um pouco de história... 1974 1974 Internet IP TCP 1990 Web VintonCerf Robert Kahn Timothy Berners-Lee
I Encontro de Arquivos Contemporâneos Um pouco de história… 1º Website Info.cern.chfoi criado em hypertexto (a primeira forma básica do HTML) HTML (HyperTextMarkupLanguage) conjunto de marcas para descrever a estrutura de um documento na web. HTML foi baseado no SGML (Standard GeneralizedMarkupLanguage), usada para descrever dialetos de anotação
I Encontro de Arquivos Contemporâneos Um pouco de história… 1994 - Criado o W3C (WorldWide Web Consortium) Inicia projeto: criar uma linguageminterpretávelpor software, e integrávelcom outras linguagens de onde nasce XML (eXtensibleMarkupLanguage) a metalinguagem para a criação de linguagens de anotação
I Encontro de Arquivos Contemporâneos Um pouco de história… Redesenhodo acesso à informação! 1998 SergeyBrin LarryPage A importância de uma página web: - não depende do número de acessos com que conta... - depende do número de páginas que lhe apontam (e sua importância) PageRank
I Encontro de Arquivos Contemporâneos Um pouco de história… Redesenhodo uso da web 2001 2004 2003 2006 2005 Jimmy Wales Wikipedia RamuYalamanchi Hi5 Steven Chen Youtube (com ChadHurley) Even Williams Twiter Blogger (1999) Mark Zuckerberg Facebook WEB 2.0 Informação é criada pelos utilizadores! Cooperação!
I Encontro de Arquivos Contemporâneos Um pouco de história... Redesenho da Web Interoperabilidade e Cooperação WEB 3.0 ou WEB Semântica Projeto iniciado em 2001 Inteligência Artificial Dados na web interpretáveis por computadores Ontologias Anotação e Metadados Atribuição de significado aos conteúdos na web Relacionamento semântico entre dados
I Encontro de Arquivos Contemporâneos Os Arquivos e a Informação
I Encontro de Arquivos Contemporâneos No início era o documento! • O Documento era o centro do arquivo • O interesse no arquivo era por parte da história • O arquivo era visto como auxílio a historiadores
I Encontro de Arquivos Contemporâneos Mas o documentofoicustodiado… • Nacionalização de bens • Custódia de bens nacionalizados • Arquivos centralizados em edifícios pertencentes ao estado • Arquivos públicos e privados são destruídos • Perde-se a identidade do documento como um elemento no seu contexto original • Mudança no paradigma arquivístico • Mas investigação histórica continua a ser o mote para o arquivo
I Encontro de Arquivos Contemporâneos E depois foi bifurcado... • Evolução da sociedade • Evolução das organizações, administrações e instituições • Produção de informação não histórica • Separação dos arquivos em Históricos e Administrativos • Arquivos administrativos • Novo paradigma arquivístico • Pragmatismo • Novas técnicas para organização e tratamento de informação • Facilitação no acesso à informação
I Encontro de Arquivos Contemporâneos No final era a Informação! • O documento deixa de ser o foco do arquivo • A informação passa a ser o objeto de trabalho dos arquivistas • Tratamento de informação passa a ser visto como ciência • Não só no contexto de arquivos mas (e até primeiro) em museus e bibliotecas • Informática e Ciências da Informação e da Documentação caminham de mãos dadas • Técnicas de Preservação, Anotação, Digitalização e Pesquisa • Uniformização da Informação para interoperabilidade • Etc.
I Encontro de Arquivos Contemporâneos A disponibilização da informação • Evolução da Web • Maior disponibilidade de informação • Acesso facilitado à informação • Aparecimento de standards para representação de informação • Facilitação da Interoperabilidade entre sistemas de informação • Evolução da mentalidade arquivista • Necessidade de aceder pragmaticamente à Informação • Aparecimento de novos tipos de “documentos” • Necessidade de rever métodos de gestão de informação • Desejo de troca de informação entre sistemas de informação arquivada
I Encontro de Arquivos Contemporâneos Em busca da Interoperabilidade
I Encontro de Arquivos Contemporâneos Uniformização de Arquivos Modelo OAIS (Open Archival Information System) Arquitetura standard para a construção de repositórios e arquivos digitais Modelo para acesso aberto a informação a ser preservada a longo-termo
I Encontro de Arquivos Contemporâneos Comunicação entre Arquivos Arquivos não necessitam mais de estar de costas voltadas arquivo Troca de Informação arquivo Implementação de Protocolos de Comunicação OAI – PMH (Open Archive Initiative – Protocol for Metadata Harvesting) SWORD (Simple Web-service Offering Repository Deposit) Arquivos importam e exportam informação nestes standards Providers e Harvesters Auxiliam a comunicação e integração de software com agregadores de informação
I Encontro de Arquivos Contemporâneos Pesquisa Federada arquivo arquivo arquivo arquivo arquivo Ponto de Acesso - Um ponto de acesso - Uma query - Resultados de procura provenientes de várias portais agregadores de informação SRU/CQL (Search Retrieval via URL / Context Query Language) Protocolo para queriesde procura sobre a internet CQL define a sintaxe para a escrita de queries
I Encontro de Arquivos Contemporâneos Dados, Informação e Conhecimento
I Encontro de Arquivos Contemporâneos Dados, Informação e Conhecimento Dados Entidades sintáticas (valores, quantidades, etc.) passíveis de serem “medidas” e processados Relacionamento semântico entre os dados atribuindo-lhes um significado Informação Aprendizagem Conhecimento Estruturação e organização da informação adquirida como resultado de um processo cognitivo
I Encontro de Arquivos Contemporâneos Informação, o segredo! Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo. notícia retirada do JN a 2012-10-22
I Encontro de Arquivos Contemporâneos Informação, o segredo! Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo. notícia retirada do JN a 2012-10-22
I Encontro de Arquivos Contemporâneos Informação, o segredo! Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo. <localidade> <corporação> <evento> <idade> <data> <motivo> <autoestrada> <localidade> notícia retirada do JN a 2012-10-22
I Encontro de Arquivos Contemporâneos Informação, o segredo! Anotação (interna) de documentos Inscrição de notas, comentários ou marcas num documento que ajudam a clarificar/normalizar o seu conteúdo. Marcas dão significado aos dados
I Encontro de Arquivos Contemporâneos Informação, o segredo (2)! Um bombeiro dos Voluntários da Aguda (Gaia), de 49 anos, morreu, esta segunda-feira de manhã, na sequência de um acidente com uma ambulância da corporação, na A29, em Arcozelo. Título = “Bombeiro morre em acidente na A29” Criador = “Jornal de Notícias” Tema = “Acidente Mortal” Descrição = “Notícia sobre morte de bombeiro na sequência de um acidente em autoestrada.” Editor = “Jornal de Notícias” Data = “2012-10-22” Tipo = “Texto” Formato = “text/plain” Identificador = “http://goo.gl/e84GL” Linguagem = “PT”
I Encontro de Arquivos Contemporâneos Informação, o segredo (2)! Enriquecimento da informação com Anotação (externa) de documentos usando Metadados Dados sobre os dados Definem a semântica dos dados externos ao documento ... que não são expressos no conteúdo do documento ...
I Encontro de Arquivos Contemporâneos Metadados e os Documentos
I Encontro de Arquivos Contemporâneos Documentos O que é considerado um documento? Os tipos de documento são variados! Fotografia Certificado Filme Livro Relatório Fatura Página Web Artigo Científico Biografia Gravação Áudio Passaporte Cada tipo pode ser descrito de várias formas... ... depende, claramente, do contexto e da sua utilização
I Encontro de Arquivos Contemporâneos Metadados do Documento Trêsgrandes tipos de metadados... Descritivos Descrevem os dados essenciais do recurso. E.g., título, autor, etc. Administrativos Descrevem dados administrativos que ajudam na manutenção do documento. E.g., a data de criação, como foi a criação, etc. Estruturais Descrevem como o recurso é composto. E.g., ordenação de páginas, organização em sistema de ficheiros
I Encontro de Arquivos Contemporâneos Esquemas de Metadados Conjunto de metadados desenhado em específico para um dado propósito ex. descrever um determinado relatório... Tem, geralmente, um contexto de utilização associado! Definem a semântica (e sintaxe) dos metadados e seus conteúdos Podem completar-se, descrevendo um documento para vários propósitos
I Encontro de Arquivos Contemporâneos Esquemas de Metadados - Dublin Core – para simples descrição de um documento - TEI (Text Encoding Initiative) – para anotação de textos eletrónicos (e.g., romances) - METS (Metadata Encoding and Transmission Standard) – para expressar estrutura de um objeto digital assim como para o descrever e localizar os ficheiros que o compõem - EAD (Encoded Archival Description) – para anotar dados em inventários ou índices em linha - ISAD(g) (General International Standard Archival Description ) – guias para descrever arquivos - LOM (Learning Object Metadata) – para fomentar o uso de recursos didáticos suportados por tecnologia - CDWA (Categories for Description of Works of Art) – para descrever objetos visuais como pinturas ou esculturas
I Encontro de Arquivos Contemporâneos Uma questão de Semântica
I Encontro de Arquivos Contemporâneos Nem só de pão vive o homem... A anotação de documentos ajuda o humano a perceber com maior exatidão o conteúdo e o próprio documento Nesta perspetiva As marcas de anotação por si só fornecem o significado ao valor marcado E as relações semânticas que entre elas existem... Porque (melhor ou pior) o humano conhece o domínio MAS As máquinas NÃO!!! É necessário “ensinar-lhes” o domínio!
I Encontro de Arquivos Contemporâneos Organização semântica da Informação Ontologias “Uma ontologia é um artefacto que define um conjunto de conceitos, relações e axiomas para um domínio de saber específico, representando e organizando o conhecimento implícito (de forma a que um conjunto de sistemas cooperativos concordem e o partilhem).” Retirado, traduzido e adaptado de “OntologicalAdaptiveIntegrationOfReverse EngineeringTools”
I Encontro de Arquivos Contemporâneos Organização semântica da Informação Ontologias O = (C, R, A) • - C – Entidades da Ontologia • - CC – Conceitos (Ex: Mãe) • - CI – Instâncias dos conceitos (Ex: Teresa) • - R – Relações entre entidades da Ontologia • - RH – Relações taxonómicas/hierárquicas entre conceitos (Ex: Mãe ‘é_uma’ Pessoa) • - RI – Relações entre conceitos e Instâncias (Ex: Teresa ‘é_uma’ Mãe) • - RS – Relações não taxonómicas entre conceitos (Ex: Mãe ‘tem_filho’ Filho) • - RP – Propriedades dos conceitos (Ex: Pessoa ‘data_de_nascimento’ 1986-02-26) • - A – Axiomas. Dão consistência à ontologia e são usados para inferir novo conhecimento (Ex: “Se duas Filhas têm a mesma mãe então são Irmãs”)
I Encontro de Arquivos Contemporâneos Ontologias…Metadados… Cooperação? Cooperação Só haverá cooperação entre sistemas (de arquivos) se todos falarem a mesma língua! XML é a língua franca para a interoperabilidade (de informação)! Mas o conteúdo em XML pode ser interpretado de várias maneiras! Metadados Mas os metadadostêm um significado bem definido! No entanto o significado depende do domínio específico... Ontologias As ontologias descrevem um domínio! Os metadados (conceitos nas ontologias) podem ser relacionados de forma unívoca numa tal estrutura... Uma vez aceites as relações inter-metadados , os sistemas podem cooperar porque se percebem mutuamente!
I Encontro de Arquivos Contemporâneos Os nossos Projetos
I Encontro de Arquivos Contemporâneos Metadados na Pesquisa Semântica De documentos Jurídicos! • Criação de Ontologia para uma área jurídica • Levantamento de metadados associados a documentos dessa área • Relacionamento entre metadados e conceitos ontológicos • Implementação da pesquisa de documentos baseada na ontologia • Benefícios da pesquisa ontológica na obtenção de informação jurídica
I Encontro de Arquivos Contemporâneos Povoamento Automático de Ontologias A partir da anotação de documentos Jurídicos! • Área jurídica do direito de família • Criação de Ontologia para representar conhecimento sobre a área • Utilização de processamento de linguagem natural para reconhecer padrões e anotar textos jurídicos • Informação anotada usada para povoar ontologias • Diminuição dos custos e esforços na construção de bases de conhecimento
I Encontro de Arquivos Contemporâneos Geração Automática de Museus Virtuais A partir da anotação de espólio de arquivos e museus • Base de dados de espólio (de museus e arquivos) anotado • Ontologia geral para descrever o conhecimento anotado • Construção de salas de exposição virtuais para aprendizagem a partir de especificações sobre a vistas da ontologia e os documentos anotados • Navegação dirigida pela semântica • Uso de browsers semânticos • Projeto CoNVEM / Geny
I Encontro de Arquivos Contemporâneos Geração Automática de Museus Virtuais
I Encontro de Arquivos Contemporâneos Geração Automática de Museus Virtuais • Projeto siME, Projeto de Mestrado, Genio • Museu da Emigração e das Comunidades (Fafe)
I Encontro de Arquivos Contemporâneos Geração Automática de Museus Virtuais
I Encontro de Arquivos Contemporâneos Outros Projetos
I Encontro de Arquivos Contemporâneos Google Art Project
I Encontro de Arquivos Contemporâneos Sumário Tim Berners-Lee adaptou-se à (na altura) nova tendência da comunicação entre computadores e revolucionou-a! Tal revolução levou à criação de espaços partilhados de informação, acessíveis por todo o mundo! A Web continuou a evoluir ao ponto de se estar agora a preparar para a sua terceira fase, onde as máquinas irão compreenderão o conteúdo dos recursos documentais... Os arquivos e os seus profissionais também evoluíram com o tempo, adaptando-se às demandas da sociedade e à própria evolução tecnológica! A noção de anotações e metadados como o segredo para a obtenção de informação, e o seu relacionamento semântico com base em ontologias, parece estar em consonância com a noção semântica que a web quer para si. A uniformização de arquivos como repositórios de Informação, aumentam a possibilidade de cooperarem, promovendo a troca de informação (em tempos custodiada)
I Encontro de Arquivos Contemporâneos Organização e Representação da Informação Arquivos, Bibliotecas e Museus nuno oliveira Universidade do Minho