1 / 28

Tiedonetsinnän perusteet

Tiedonetsinnän perusteet. Juha Heinänen Kankaanpään kaupunginkirjasto. Sisällysluettelo . Tiedonhaku prosessina Erilaisia tietolähteitä Tiedonhaku Hakutulosten arviointi. Tiedonhaku prosessina. Tiedontarve Tietolähteen valinta Hakustrategia Tulosten arviointi Mahdolliset lisähaut.

jayden
Download Presentation

Tiedonetsinnän perusteet

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Tiedonetsinnän perusteet Juha Heinänen Kankaanpään kaupunginkirjasto

  2. Sisällysluettelo • Tiedonhaku prosessina • Erilaisia tietolähteitä • Tiedonhaku • Hakutulosten arviointi

  3. Tiedonhaku prosessina • Tiedontarve • Tietolähteen valinta • Hakustrategia • Tulosten arviointi • Mahdolliset lisähaut

  4. Tiedon tarve • Mitä tietoa tarvitaan? • Mihin tarkoitukseen? • Miten kattavasti? • Miten nopeasti? • Vuorovaikutuksessa seuraavan kohdan kanssa

  5. Tietolähteen valinta • Tiedon tarve vaikuttaa siihen mistä lähteestä sitä kannattaa etsiä • Laadukkaasta tieteellisestä tiedosta suuri osa edelleen paperilla • Tieteenalasta riippuu julkaistaanko se artikkeleina vai laajempina kirjoina eli monografioina • Sähköinen julkaisu on tulossa

  6. Tietolähteitä • Kirjat • Lehdet, aikakausjulkaisut • Sähköiset aineistot – tietokannat, cd-romit • Kirjastojen aineistoluettelot • www- sivustot

  7. Kirjat • Luettavuudeltaan vielä ylivoimainen tietolähde • Vanhoja perustapoja löytää kirjoja • Kirjaston kokoelman selailu • Hakuteokset • Bibliografiat • Kirjojen lähdeluettelot

  8. Kirjastojen aineistoluettelot • Kirjastojen kokoelmatietokannat ovat nykyään yleisesti selattavissa verkon kautta • Kankaanpään kaupunginkirjasto: http://www.kankaanpaa.fi/sivistyskeskus//html/fi/kirjasto.html • Suomen yleiset ja oppilaitoskirjastot: http://www.kirjastot.fi/

  9. Kirjastojen aineistoluettelot • Hakutietokantoja, jotka vaihtelevat käytetyn ohjelman mukaan, mutta yhteisiä piirteitä • hakumahdollisuuksia: tekijän nimen, teoksen nimen, asiasanojen tai muiden tekijöiden mukaan • Tukevat sanojen katkaisua ja boolen logiikkaa – mahdollistavat hyvinkin tarkat haut

  10. Sanan katkaisu • Tietokoneet vertailevat merkkijonoja, joten aina kun mahdollista kannattaa käyttää katkaisua • Saadaan haku kattamaan eri sijamuotoja: talo* kattaa talojen, talot ja talo • Mahdollisuus tehdä virheitä pienenee: Polit* kattaa Politovskajan ja Politkovskajan • yleisesti merkitään asteriskilla *, muita mahdollisuuksia ?, joskus - joskus ei mitään, kuten Kankaanpään kirjaston verkkohaussa

  11. Boolen logiikka • Operaattori JA tai AND hakutuloksen pitää täyttää molemmat ehdot - supistaa haun tulosten määrää • Operaattori TAI tai OR hakutuloksen pitää täyttää joko toinen tai molemmat hakuehdoista – laajentaa hakutulosta • Operaattori EI tai NOT hakutuloksessa ei saa olla ilmoitettua sanaa

  12. Lehdet • Paperilehtien sisällöstä osa verkossa • Pelkästään verkossa ilmestyviä lehtiä • Verkossa lehtien sisältöä tietokannoissa –suomalaisia Arto (kotimaisten aikakauslehtien artikkeliviitetietokanta) ja Aleksi – joita pääsee käyttämään Nelli-tiedonhakuportaalin kautta www.nelliportaali.fi

  13. Internet • Kanava, jonka kautta päästään kaikkien edellä lueteltujen tietolähteiden äärelle • Alku 1960-luvun lopulla perustetussa Arpanet –verkossa ja sen TCP/IP tiedonsiirtoprotokollassa • 1983 sotilas- ja siviiliverkot erilleen • Räjähdysmäinen kasvu 90-luvun alussa • 1990 www, 1993 Mosaic-selain, joka mahdollisti www:n käytön tavalliselle käyttäjälle

  14. Internet II • Yhteen liitettyjen koneiden hajautettu, linkkien yhdistämä verkko, jota ei ole alun perin suunniteltu tiedonhakuun • Ei kattavaa hakemistoa • Mikään hakuohjelma ei läpikäy koko verkon julkista sisältöä • Vapaa ja rajoittamaton sisällöntuotanto – informaation laatu vaihtelee jyrkästi

  15. Aihehakemistot • Perusajatukseltaan linkkilistoja • Hyvät puolet: sisältö hakemistoissa jollain tavoin valikoitua – pyrkimys laatuun • Huonot puolet: sisältö valikoitua ja sitä myöten suppeampaa kuin hakukonehaussa • Soveltuu aihealueisiin joita on hankala määritellä hakusanoilla • Soveltuu selailuun, kun halutaan yleiskuva laajemmasta aiheesta

  16. Aihehakemistoja • Pioneerina yahoo! (http://dir.yahoo.com/) • Suomessa Hämeenlinnan kaupunginkirjaston makupalat (http://www.makupalat.fi ) • Suppeampaan suuntaan mennessä virtuaalikirjastot, joiden sisältö on valikoitua ja kirjastomaisesti järjesteltyä: http://www.kirjastot.fi/linkkikirjasto

  17. Hakukoneet • Hakukoneiden haku kohdistuu hakurobottien tekemään tietokantaan • Hyvät puolet: haun kohteena kokotekstiä miljoonien dokumenttien verran – yleensä aina haku tuottaa jonkinlaisia tuloksia • Huonot puolet: haku tuottaa usein liikaa tuloksia, joissa parhaat eivät erotu kovinkaan hyvin

  18. Hakukoneet 2 • Google – tunnetuin, muttei ainoa www.google.com tai www.google.fi • Muita: • AllTheWeb www.alltheweb.com • Altavista www.altavista.com • Ulkoisesti melko samantapaisia • Mekaaninen sanahaku, jonka tulokset järjestyvät relevanssin mukaan

  19. Käytännön hakuvinkkejä • Useimmissa mahdollisuutena tarkennettu haku • Sanankatkaisu ei yleensä toimi – voi olla tarpeen vaihdella hakusanoja • Boolen logiikka toimii – oletuksena yleensä AND/JA operaattori • Käytä fraasihakuja missä mahdollista: ero merkittävä esimerkiksi erisnimiä hakiessa • Laajoissa hauissa merkitse muistiin miten olet hakenut

  20. Tiedonhaun portit • Portaalit yhdistelevät hakukoneen ja aihehakemistojen ominaisuuksia • Mahdollistaa räätälöidyn haun, joka yhdistelee molempia tapoja • Vaikeampia käyttää kuin pikahakukoneet, mutta tieto jäsennellympää • http://tiedonhaunportti.kirjastot.fi/ • Nelli-portaali http://www.nelliportaali.fi

  21. Julkishallinnon tietoja • http://www.suomi.fi - valtionhallinnon tietoja kootusti • Kunnalliset sivustot. Mallia www.kankaanpaa.fi

  22. Hakutuloksen arviointi • Vastaako hakutulos alussa esitettyyn kysymykseen? • Jos ei, miten hakua on muokattava – onko muutettava hakutekijöitä tai tekniikoita vai kenties tietolähdettä? • Vastaako hakutulos tiedontarpeeseen – vai pitääkö hakukysymystä muokata ja jatkaa etsimistä?

  23. Lähdekritiikki • Vanhat lähdekritiikin periaatteet pätevät edelleen: Kuka kirjoittaa, miksi, milloin, miten kontrolloituna? • Korostuvat verkossa, koska kuka tahansa voi kirjoittaa siellä mitä tahansa ja näyttää ulkoisesti melko uskottavalta

  24. Auktoriteetti • Auktoriteetti: kuka on tekstin takana? • Voiko www-sivun osoitteesta nähdä kuka on tiedon takana • Onko yhteystietoja, onko tiedon tuottaja asiantuntija tai viranomainen?

  25. Sisältö • Tekstin luonne: faktaa, mielipiteitä, propagandaa? • Rajoitukset: Näkökulma, kattavuus, yksityiskohtaisuus? • Luotettavuus: mihin teksti perustuu, miten se dokumentoidaan. Onko nootteja tai lähdeluettelo? Voidaanko tekstin tiedot varmentaa muista lähteistä?

  26. Alkuperäisyys • Mitä lähempänä tiedon alkulähdettä sen parempi – yleensä • Mieluummin tilastotiedot tilastokeskuksesta kuin lehtijuttu niistä • Mieluummin tieteellinen tutkimus kuin lehtijuttu tutkimuksesta

  27. Tuoreus • Milloin teksti on kirjoitettu ja julkaistu? • Ovatko tiedot ajan tasalla? • Kaikki tieto ei vanhene yhtä nopeasti

  28. Sähköiseen aineistoon viittaaminen • Jos tieto on asiallista ja laadukasta siihen voi hyvin viitata tutkielmissa • Missä muodossa se tehdään vaihtelee eri aloilla • Lisäongelmia: tiedon tuottajaa joskus hankala selvittää, nettitiedon pysyvyys on heikko, nettitiedon laatu vaihtelee rajusti

More Related