1 / 20

Konvertering og bruk av 1910 folketellingen

Konvertering og bruk av 1910 folketellingen. Fagdag Kulturrådet , 18.06.2014. Agenda. Konvertering av 1910 folketellingen til RDF Demonstrasjon av enkel prototype. Building. Modell for FT1910. Address, Building type, Number of floors, Municipality, Geo Lat/Lng …. Apartment.

Download Presentation

Konvertering og bruk av 1910 folketellingen

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Konverteringogbrukav 1910 folketellingen FagdagKulturrådet, 18.06.2014

  2. Agenda • Konvertering av 1910 folketellingen til RDF • Demonstrasjon av enkel prototype

  3. Building Modell for FT1910 Address, Building type, Number of floors, Municipality, Geo Lat/Lng … Apartment Floor, Number of rooms, Number of kitchen, Rent … Person Name, Gender, Birth date, Birth place, Marital status, Occupation …

  4. Dataomfang – 3 fylker Folketelling 1910

  5. Bruk av Eksisterende vokabularer • FOAF: http://xmlns.com/foaf/0.1/ • BIO: http://purl.org/vocab/bio/0.1/ • ResumeRDF: http://rdfs.org/resume-rdf/cv.rdfs# • Building and Room: http://vocab.deri.ie/rooms# • GEO: http://www.w3.org/2003/01/geo/wgs84_pos# • SKOS: http://www.w3.org/2004/02/skos/core# Nye somburdebrukes (fremfornyontologi): • Europeana / Norvegiana • Dublin Core

  6. Få verdier forekommer hyppig

  7. URI generation

  8. Kobling til andre datasett * White bubbles indicate "offline" datasets, not available in the LOD-cloud.

  9. Lessonslearned • Scarce data to link to • Concept drift • Simple normalization methods suffice • Additional datasets can increase data quality • Existing vocabularies not sufficient • Conversion to LOD can increase data quality • Case-specific conversion scripts is time consuming, generic tools needed • Techniques needed to propose and validate links

  10. FT 1910: Kjente navn å koble til

  11. Men hva med Ola Normann? • Vanskelig å finne eksterne kilder • Men, noen aktuelle kilder: • Panteregister • Pantebok • Kirkebok • Matrikkel

  12. Enkel prototype

  13. Kilder brukt • Folketellinger: • Folketelling 1801 • Folketelling 1865 • Folketelling 1900 • Folketelling 1910 • Tinglysningsdokumenter: • Pantebøker • Panteregister • Matrikkel 1886 • Kirkebok (dåp, konfirmasjon, vielse) • Digitalt Museum / Kulturminnesøk (JSON) • GeoNames (JSON)

  14. Videre arbeid • Konvertere hele FT1910 til RDF • Utvikle ontologier for vanlige attributter: familiestilling, religion, yrke (HISCO/NAPP), bygningstype etc • Utvikle ny modell som kan brukes til å koble ulike (historiske) datasett sammen (hvem, hva, hvor, når)? • Crowdsourcingverktøy for å opprette koblinger mellom autoriteter?

  15. Takk for oppmerksomheten! Håvard Lundberg havard.lundberg@gmail.com twitter.com/havard

More Related