860 likes | 1k Views
De Googl i f i c a t i e van ons leven zoeken doen we allemaal, maar hoe kun je het beter vinden?. Eric Sieverts Media, Informatie & Communicatie (Hogeschool van Amsterdam) ZA07-2. februari 2011. zoeken = google ?. zoeken is een “commodity” geworden
E N D
De Googl ificatievan ons levenzoekendoen we allemaal,maar hoe kun je het beter vinden? Eric Sieverts Media, Informatie & Communicatie (Hogeschool van Amsterdam) ZA07-2 februari 2011
zoeken = google ? • zoeken is een “commodity” geworden • iedereen gebruikt voor alles altijd, overal zoekmachines • in december 2010: 3 miljoen zoekacties per minuut • iedereen verwacht altijd overal te kunnen zoeken • “the ubiquitous search box” • iedereen verwacht dat je er altijd alles mee kunt vinden • “ambient findability” • Google is daarbij de “maat der dingen” geworden • de usability benchmark? • de “Google experience” • kortom: Google is synoniem met zoeken Eric Sieverts | ZA07-2 | februari 2011
the google experience iedereen denkt dat Google wat zoeken betreft "de maat der dingen" is maar let op: de Google paradox • met Google "kun je alles vinden" Eric Sieverts | ZA07-2 | februari 2011
the google experience iedereen denkt dat Google wat zoeken betreft "de maat der dingen" is maar let op: de Google paradox • met Google "kun je alles vinden" maar • als echt "alles" in Google (of Yahoo! of Bing) zit (> 500.000.000.000 items) is “het” eigenlijk niet goed meer te vinden Eric Sieverts | ZA07-2 | februari 2011
programma • bronnen voor informatie • zoeksystemen • alleen google of ook andere? • hoe zoek je • algemeen • met Google , Bing , Yahoo! / ranking • wat is er speciaal aan andere systemen? • betrouwbaarheid / selectiviteit • toegankelijkheid Eric Sieverts | ZA07-2 | februari 2011
wat is een bron ? • is Google een bron? • is internet een bron? • NEE Google is een zoeksysteem dat heel veel (soorten) bronnen doorzoekt • internet is een medium waarop heel veel soorten bronnen beschikbaar zijn Eric Sieverts | ZA07-2 | februari 2011
soorten informatiebronnen • naar aard van de informatie • wetenschappelijke informatie • naslagwerken • nieuwsberichten • krantenartikelen • (digitale) boeken • ... • naar “medium” • webpagina’s • pdf’s • images • videos • weblogs • tweets • rss-feeds • ... • onderscheid tussen deze invalshoeken • is niet altijd heel scherp te trekken • ook onderscheid: web diepe web Eric Sieverts | ZA07-2 | februari 2011
soorten informatiebronnen Eric Sieverts | ZA07-2 | februari 2011
soorten informatievragen • feitelijk gegeven • informatie "over iets" • kies bij elk de juiste soort bron • kies daarbij het juiste zoektool feit: 1: naslag - bijv. wikipedia 2: zoekmachine (event. gespecialiseerde> ) "over": zoekmachine (liefst gespecialiseerde> ) • kies bij elk de juiste manier van zoeken (>) Eric Sieverts | ZA07-2 | februari 2011
gespecialiseerde zoeksystemen waarom gespecialiseerd zoeksysteem gebruiken, als het waarschijnlijk (?) toch (ook) al in Google zit (of in Yahoo! of Bing) ? • resultaten verdrinken niet in die 500.000.000.000 andere documenten van algemene zoekmachine Eric Sieverts | ZA07-2 | februari 2011
gespecialiseerde zoeksystemen waarom gespecialiseerd zoeksysteem gebruiken, als het waarschijnlijk (?) toch (ook) al in Google zit (of in Yahoo! of Bing) ? • resultaten verdrinken niet in die 500.000.000.000 andere documenten van algemene zoekmachine • minder last van ruis uit "content farms" • niet alles zit in Google (enz.)>> het "diepe" web • Google (enz.) minder up-to-date dan gespecialiseerd systeem • vaak: specifieke zoekfunctionaliteit voor dat type informatie daarom stopt Google tussen gewone resultaten vaak ook iets uit zijn andere systemen Eric Sieverts | ZA07-2 | februari 2011
uit Google-News uit real-time web (twitter e.d.) een paar "gewone" resultaten uit Google-Video
zoeken (algemeen) • zoekmachines begrijpen niet wat we bedoelen, maar geven wat we vragen • als jij "effecten van de financiële crisis in Europa" vraagt, zal hij niet naar "... in Spanje" gaan zoeken • vraag dus wat je verwacht dat antwoord zal zijn! • omdat die zoekwoorden voorkomen • omdat pagina met zoekwoorden in zelfde volgorde als in zoekvraag hoger scoort bij ranking • doe dit zeker bij zoeken naar feitelijke gegevens Eric Sieverts | ZA07-2 | februari 2011
http://www.thumbshots.com/Products/ThumbshotsImages/Ranking.aspxhttp://www.thumbshots.com/Products/ThumbshotsImages/Ranking.aspx
zoeken (algemeen) • vraag wat je verwacht dat antwoord zal zijn! • vraag bijvoorbeeld met "precieze zin" optie: "water kookt bij * graden" met * (wildcard) voor ontbrekend / onbekend woord of getal • ook als je een vaste uitdrukking niet meer weet "het * * met het badwater weggooien" • met Google alle getallen binnen gegeven range zoeken "een huur van 300..500 euro" Eric Sieverts | ZA07-2 | februari 2011
zoeken (algemeen) • vraag wat je verwacht dat antwoord zal zijn! • vraag niet "wie waren de presidenten van de VS?" maar vraag "presidenten van de VS waren" of vraag misschien nog liever: obama, bush, clinton, nixon, kennedy, lincoln want op pagina waar deze 6 namen voorkomen, worden vast ook die andere 35 namen genoemd • pas woordgebruik aan gewenste (culturele) context aan wetenschappelijk / populair / jargon / jongeren mexicaanse griep h1n1 virus influenza A Eric Sieverts | ZA07-2 | februari 2011
zoeken (algemeen) • soms proberen sommige zoekmachines wel slimme dingen te doen • google zoekt automatisch op enkel- en meervoud en nog wat morfologische woordvarianten maar: is soms afhankelijk van taal- en landenversie, dus niet altijd voorspelbaar wat en wanneer maar: je wilt dat niet altijd new news philips philip • op google.nl krijgen resultaten van .nl sites voorrang • bing probeert resultaat aan je locatie aan te passen maar: effect vaak onbegrijpelijk Eric Sieverts | ZA07-2 | februari 2011
voor alleen exacte naam dus: +piet +janssen
systematische zoekvraag in databases werden zoekvragen van oudsher systematisch opgebouwd met zoekmachines kan dat voor inhoudelijke vragen ook heel goed • welke aspecten / facetten / invalshoeken moeten in de te vinden informatie samen aanwezig zijn? bijv.: bijwerking + inenting + varkensgriep • welke zoekwoorden kan ik bedenken voor elk daarvan? bijv.: 1: bijwerking, bijwerkingen, nadeel, bezwaar 2: inenting, vaccinatie, vaccin 3: varkensgriep, H1N1, influenza a, mexicaanse griep Eric Sieverts | ZA07-2 | februari 2011
systematische zoekvraag systematisch opbouwen van inhoudelijke zoekvraag (ik zoek informatie "over") • neem die woorden per facet samen met OR bijwerking OR nadeel OR bezwaar inenting OR vaccinatie OR vaccin varkensgriep OR H1N1 • combineer de resulterende "bouwstenen" met AND maar hoe doe je dat precies? Eric Sieverts | ZA07-2 | februari 2011
combineren bij Google en Yahoo! • gebruik hoofdletters voor operator(en) • je mag de AND's weglaten • hier gaat -als enige systemen- OR voor AND • je hoeft dus geen haakjes te gebruiken • als je woorden wilt uitsluiten, dan moet je i.p.v. "NOT" per losse term - (min)teken gebruiken voorbeeld: bijwerking OR nadeel inenting OR vaccinatie varkensgriep OR H1N1 -qkoortsi.p.v. (bijwerking OR nadeel) AND (inenting OR vaccinatie) AND (varkensgriep OR H1N1) NOT qkoorts Eric Sieverts | ZA07-2 | februari 2011
combineren bij Bing • gebruik hoofdletters voor operator(en) • je mag de AND's weglaten • je moet WEL haakjes gebruiken bij OR • je mag ook NOT gebruiken dus wel: (bijwerking OR nadeel) AND (inenting OR vaccinatie) AND (varkensgriep OR H1N1) NOT qkoorts of (bijwerking OR nadeel) (inenting OR vaccinatie) (varkensgriep OR H1N1) NOT qkoorts Eric Sieverts | ZA07-2 | februari 2011
relevance ranking: meer dan pagerank pagerank alleen van belang als zoekwoorden weinig bepalend die woorden maken: • pagina relevanter als zoekwoord in titel • pagina relevanter als zoekwoord in URL of in koppen <H1> <H2> • pagina relevanter als zoekwoord meer in begin van tekst • pagina relevanter als zoekwoord vaker voorkomt • pagina relevanter als zoekwoorden dicht bij elkaar • pagina relevanter als zoekwoorden in zelfde volgorde als vraag (!) • zeldzaam zoekwoord telt hierbij zwaarder dan heel algemeen (voor jou belangrijk woord in zoekvraag 3x intikken - bij Google) • pagina relevanter als zoekwoord ook vaak voorkomt in tekst van hyperlink die ernaar verwijst (de "googlebom") zie bijv.: http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm Eric Sieverts | ZA07-2 | februari 2011
relevance ranking • elke zoekmachine heeft eigen "geheime" factoren en eigen afweging hoe sterk elke factor meetelt • elke zoekmachine sorteert dus anders • dus weinig overlap tussen zoekmachines bij eerste 10 Eric Sieverts | ZA07-2 | februari 2011
relevance ranking • elke zoekmachine heeft eigen "geheime" factoren en eigen afweging hoe sterk elke factor meetelt • elke zoekmachine sorteert dus anders • dus weinig overlap tussen zoekmachines bij eerste 10 • wie doet het het best? probeer eens een "blinde" vergelijking site: blindsearch Eric Sieverts | ZA07-2 | februari 2011
relevance ranking • elke zoekmachine heeft eigen "geheime" factoren en eigen afweging hoe sterk elke factor meetelt • elke zoekmachine sorteert dus anders • dus weinig overlap tussen zoekmachines bij eerste 10 • wie doet het het best? soms de een, soms de ander ! • het heeft dus zin meer zoekmachines • bijv.: via browsys-finder of metasearch te gebruiken • bijv.: ixquick, dogpile, yippy Eric Sieverts | ZA07-2 | februari 2011
hulp bij verfijnen zoekresultaat zoekresultaten vaak te ruim en nog niet in goede context door onvoldoende gespecificeerde zoekvragen • sommige systemen geven suggesties op basis van eerder door anderen gestelde uitgebreider zoekvragen terwijl jij je vraag aan het intikken bent ; Google-Instant voorspelt zelfs al wat je gaat vragen • sommige systemen geven suggesties voor inperking op basis van statistische analyse van woorden in al gevonden resultaten, bijv. Quintura (gebruikt Yahoo!) Eric Sieverts | ZA07-2 | februari 2011
hulp bij verfijnen zoekresultaat zoekresultaten vaak te ruim en nog niet in goede context door onvoldoende gespecificeerde zoekvragen • sommige systemen geven suggesties op basis van eerder door anderen gestelde uitgebreider zoekvragen terwijl jij je vraag aan het intikken bent ; Google-Instant voorspelt zelfs al wat je gaat vragen • sommige systemen geven suggesties voor inperking op basis van statistische analyse van woorden in al gevonden resultaten, bijv. Quintura (gebruikt Yahoo!) Eric Sieverts | ZA07-2 | februari 2011