620 likes | 1.03k Views
Le cycle de vie de l'information, identification du besoin, collecte et validation Gabriel Gallezot Université de Nice Sophia Antipolis URFIST. Imaginez la situation suivante :.
E N D
Le cycle de vie de l'information, identification du besoin, collecte et validationGabriel GallezotUniversité de Nice Sophia AntipolisURFIST Gallezot
Imaginez la situation suivante : Vous êtes actuellement stagiaire dans un organisme. En vue de la réalisation d'un prochain stage (ex : projet évènementiel sur le développement durable) votre responsable vous demande : - de lui trouver une dizaine de documents sur l'anthropocène afin de mieux cerner ce thème. • de surveiller un certain nombre de sites sur ce même thème. • de lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres stagiaires qui travaillent sur d'autres thèmes. Consignes : 1) Donnez les références des documents trouvés, en expliquant votre méthodologie de recherche (comment avez vous fait pour trouver et sélectionner ces textes ?) et précisez les modalitès d'accès. 2) Expliquez dans un « mémo » à votre responsable ce que vous comptez faire pour répondre à sa demande de veille et de partage d'information nota bene : votre responsable connaît, comme vous, très bien google, il a déjà fait des recherches préalables avec cet outil. Il peut lire les textes en anglais. Gallezot
Vos projets ( ???????? ) > FAIRE connaître l’Intelligence économique ou votre diplôme en utilisant des moyens de communication interne ou externe • Journal - valoriser votre diplome et informer sur l'IE (année 2008- 2009 ?) • Dossier-Mailing - Attirer l'attention des entreprises sur l'IE (année 2008- 2009 ?) • Un club ? (année 2008- 2009 ?) • Séminaire - recrutement MIET (année 2008- 2009 ?) • … Gallezot
Plan • Introduction générale à la recherche d’information • Essai de typologie de l'information et des ressources • Réflexion sur la notion de validité de l'information • Les outils de recherche du web, (méthodologie, fonctionnalités + Le web 2.0 • Mon environnement de travail • Veille, alerte, mashup & cartographie Gallezot
1Introduction générale à la recherche d’information Gallezot
Base Bibliographiques Banques de données Revues, ouvrages Colloques Archives Ouvertes Editeurs, agrégateurs Site web, page perso, blog Liste de discussion Bibliothèques Vue usagers de l’info … Resssources Accès aux documents Typologie de l’info Usage de l’information Gallezot
Curation_Lifecycle_Model DCC : Digital Curation Center_ http://www.dcc.ac.uk/ Vue producteurs de l’info Gallezot
Appréhension de l’info La RI en contexte - différentes sources - différents outils - différents contextes Gallezot Source : Info@vis
Appropriation des outils Introducing the book The Machine is Us/ing Us Gallezot
La Recherche d’Information • Bien appréhender votre question (mind mapping) • - Bien appréhender ce que vous cherchez et où vous le cherchez (connaître les types de doc, d’info et les ressources) • - Comprendre l’envers du “décor” (indexation, aspects commerciaux, stratégie des différents outils, …) • Bien gérer ses requêtes (fonctionnalités des outils et méthodes) • - S’interroger sur la validiter de l’info (paratexte, contenu, …) Gallezot
Nommer les différents types de ressources En BU Les catalogues Les bases de données Les périodiques Les encyclopédies et dictionnaires Les livres électroniques Les cédéroms ------------------------- Sur le web les sites web, les blogs, les wiki (autres CMS) les portails les archives ouvertes et les revues en ligne (Open Access) les sites de « partage » : web 2.0 les répertoires de liens Gallezot
Types de documents • Articles scientifiques • Brevets • Documents numérisés • Thèses et HDR • Rapports et études • Cours • Données primaires et adjuvants à la recherche • Ouvrages • Notices bibliographiques • Documents multimédias(audio, vidéo, ..) • … > Def du document ? > Notion d’unité documentaire ? Gallezot
Quelques questions • Quels documents sont d'intérêt pour moi (ma question) ? • Est-ce que d'autres documents assez proches de mon intérêt peuvent être également considérés ? • Les titres d'autres documents pourraient-ils déclencher des idées valables pour ma recherche d'information ? • Comment mes mots-clés sont-ils réellement distribués dans un des document ? • .... Trois notions à considérer : • Relevance (correspondance a ma question) • Pertinence (ce qui m'intéresse vraiment !) • Serendipity (quelle chose que je ne recherchais pas mais qui pourrait également m'intéresser) Gallezot
Aiguille(s) et botte(s) de foin • Chercher une aiguille dans une botte de foin c’est : • trouver une aiguille connue dans une botte de foin connue • trouver une aiguille connue dans une botte de foin inconnue • trouver une aiguille inconnue dans une botte de foin inconnue • trouver n'importe quelle aiguille dans une botte de foin • trouver […] [Koll, 00] => 3 façons de recherche l’information • « chercher de l'information sur un objet bien défini ; • chercher de l'information sur un objet incomplètement décrit mais qui sera reconnaissable dès qu'un le rencontrera ; • trouver de l'information de manière fortuite. » (Toms) Gallezot
Où chercher ? • Information contenue sur les ordinateurs individuels • plusieurs millions d’ordinateurs inter-connectés P2P • bases de données spécialisées • Contenu dynamique • Index partiel des sites • Interdiction d’indexation Web invisible • 10 Milliards de Pages web • Forum de discussion Web visible et Web 2.0 • Contenu indexable, • contenu taggé Gallezot À partir de source : Eric Boutin
La notion d’indexation(une notion transversale et centrale) • Indexer/classer pour retrouver (mots clés/répertoire, …) • Les métadonnées (entête) • La structuration du document (corps) • Classification : • Index • Thésaurus • Taxonomie • Facette • Ontologie Gallezot
Gestion du bruit et du silence Documents relevants Documents non relevants Corpus Bien gérer VOS REQUETES ! Gallezot
Documents non retrouvés Documents retrouvés Bien gérer VOS REQUETES ! non relevants (bruit) relevants Relevants (silence) non relevants Documents retrouvés Document non retrouvés Optimiser sa recherche d'information Gallezot
Les opérateurs booléens • Exemple • Ensemble A • cours • tutorial • Ensemble B • tutorial • gratuit • Ensemble C • Payant cours ou tutorial Cours OR Tutorial tutorial et gratuit tutorial AND gratuit Protection cours AND NOT cours sauf payant payant Les booléens sur GIRI : http://www.bibl.ulaval.ca/vitrine/giri/mod3/booleen.htm Gallezot
Opérateurs (ex. google) • L'opérateur « link:site.com » (sans les guillemets) permet d'afficher les pages extérieures qui pointent sur l'URL spécifiée • l'opérateur « site: » (sans les guillemets). Pour limiter la recherche à un site ou à un domaine spécifique, utilisez la syntaxe « site:site_ou_domaine.com » dans le champ de recherche de Google. OU encore recenser TOUTES les pages d'un site • Sélectionner toutes les pages contenant le mot dans l'URL et n'importe où dans la page : inurl:motrecherché • Sélectionner toutes les pages contenant le mot dans l'URL seulement : allinurl:mot recherché • Sélectionner toutes les pages contenant le mot dans le titre et n'importe où dans la page : intitle:mot recherché • Sélectionner toutes les pages contenant le mot dans le titre seulement : allintitle:motrecherché • Rechercher un mot contenu dans un format de document en particulier : filetype:pdf mot recherché • Contrôler l'orthographe d'un mot ou d'une requête : spell:mot ou requête • Pour obtenir la définition d'un mot ou d'une expression, il vous suffit d'entrer define: suivi d'un espace et des mots concernés • Voir aussi : http://wiki-urfist.unice.fr/wiki_urfist/index.php/Recherche_d%27information_sur_web#Questions.2FR.C3.A9ponses Gallezot
Stratégie de requête (exemple) Google Inurl:durand intitle « durand pierre » Site: durand inurl:durand intitle: « durand pierre » « durand pierre » Durand pierre bruit silence Gallezot Source : Eric boutin
Les types de recherche • La recherche lexicale (+morphologique) : la recherche d'un mot ou d'un groupe de mots, notamment par le biais de requêtes booléennes (et, ou, etc.). Une fonction à laquelle s'ajoutent des opérateurs d'adjacence et de proximité. Tous des moteurs proposent en général ce type de possibilités. • La recherche syntaxique : elle permet de retrouver un terme quelle que soit sa déclinaison (plurielle, conjuguée, etc.), et d'étendre la recherche aux mots synonymes ou de même racine étymologique. Cette recherche offre également des modules de recherche floue ou de phonétisation. • La recherche statistique : lorsque la recherche s'effectue sur les mots, une analyse statistique permet de calculer la pertinence de ces mots par rapport au référentiel documentaire. • La recherche sémantique : l'opération s'effectue à partir d'une analyse du sens de la requête, c'est-à-dire en recherchant les mots sémantiquement proches de ceux qu'elle utilise. La recherche s'appuie alors sur un dictionnaire sémantique qui, à chaque mot de la langue, associe leurs différents sens. La combinaison des recherches sémantique, syntaxique, lexicale et statistique permet aux éditeurs de proposer des fonctions avancées : résumé de documents, classement et sélection optimisés des réponses, jusqu'aux assistants de requêtes (conçus pour permettre à l'utilisateur d'affiner sa demande en lui proposant des requêtes connexes ou enrichies) Gallezot
2Typologie de l’information et des ressources d’information Gallezot
Quelques critères • Disponibilité (distinction entre l’information ouverte et fermée), • Formalisation (distinction entre information formelle et informelle), • Nature (distinction entre information scientifique, technique, économique, juridique), • Support (distinction entre base de données bibliographique, information web, information issue d’enquêtes), • Acquisition : lecture, entretiens, réseaux, questionnaire… Gallezot
3Réflexion sur la notion de validité de l’information Gallezot
Info-pollutionselon Eric Sutter dans : Serres A. , Urfisthttp://www.uhb.fr/urfist/print/book/export/html/69 • Surabondance de l’info => désorientation, aveuglement, découragement • désinformation, la médiocrité de l'information => méfiance, rumeur, confusion • contamination de l’information => prolifération d’informations indésirables • abus et effets pervers de la publicité… => spamming • …et aussi la tyrannie du temps réel Gallezot
Critères, démarche et méthodologie de l'évaluation de l'information (cf. http://www.sites.univ-rennes2.fr/urfist/print/book/export/html/69 ) • distinguer les étapes de l’identification et de l’évaluation • distinguer les trois composants, les trois " couches " de tout document : • le document lui-même : type, genre, responsabilité, notoriété, etc • la mise en forme (au sens large) du document : organisation de l’information, structuration du site, graphisme, accessibilité… Des distinctions secondaires seront nécessaires. • l’information elle-même : cad le contenu informationnel • distinguer les critères communs à tout type de ressources des critères propres à chaque type de document Gallezot
Identifier • Evaluer • Grilles (exos) Gallezot
4Les outils de recherche Gallezot
Exemples d’outils(panorama) • En Bibliothèque (présentation de la situation française, ex de l’UNS) • Sur le Web • travail à rendre sur les ressources vietnamiennes Gallezot
Ressources en BU Gallezot
Les sources « BU » • Bases de données factuelles (résultats expérimentaux, ...) • Bases bibliographiques : (références art. ou ouvrages) • Catalogues (Bu, national, ...) • Répertoire (listes constituées, ...) • Bases « hybrides » = factuelles + bibliographiques, Biblio + full text, rep + bib, ... => Cf. notion de portail (accès multi sources, multi doc) Gallezot
Les catalogues(chercher des références) • à la BU http://134.59.6.53/clientbookline/home.asp • Le Sudoc, une fédération de catalogues nationaux : http://www.sudoc.abes.fr et le portail : http://www.portail-sudoc.abes.fr/ • Worldcat, une fédération de catalogues internationaux : http://www.worldcat.org/ Gallezot
Les bases de données • A L’université (BIPe – base d’interrogation des périodiques et abonnements electro + papier http://bibliotheque.unice.fr/jahia/Jahia/pid/4532) • Pour un éditeurs : ScienceDirect, Wiley-InterScience (rubrique « périodique electro ») voir aussi la notion de portail selon fonctionnalité. • Réaliser par des organismes spécialisés : l’INIST (francis, ArticleInist ) http://services.inist.fr/public/fre/conslt.htm • Spécialisée : ex : Factiva Gallezot
Dico and Co • Encyclopédie : http://www.universalis-edu.com/ (sur univ) Gallezot
Les répertoires • Les signets de la BNF http://signets.bnf.fr/html/categories/c_011presse.html Les livres electroniques • Numilog (Numilog est une bibliothèque numérique permettant "d'emprunter" (télécharger pour une durée de temps limité) des ouvrages numériques en format PDF. Numilog contient près de 500 titres en Sciences économiques, humaines et sociales, et peut être consulté depuis tous les postes de l'université mais aussi depuis l'extérieur avec vos identifiants de messagerie. Gallezot
Portails • Les portails d’éditeurs : ex: http://www.nature.com (sur univ.) • Portail « périodiques » Elsevier (sur univ.) : http://www.sciencedirect.com/ Gallezot
EXOS Avec les outils de la bibliothèque(démo) • je cherche si l'ouvrage : La cité aromatique : pour le travail des matières odorantes à Grasse - Rasse, Paul - Serre, 1987 …. Est-il disponible dans une BU de l'univ de Nice...comment faire ? • Dans quelle(s) autre(s) BU en France l'ouvrage est-il disponible ? ... comment faire ? • je souhaite lire l'ouvrage « Changer de société. Refaire de la sociologie, de Bruno Latour ? » comment faire ? Conseillez-moi. Gallezot
je cherche à savoir ce qu'est le "Dreaming" pour les Aborigènes d’Australie ... comment faire ? • je cherche un article du Courrier International intitulé : Le livre à l'ère du numérique; Attention, le livre électronique décolle !... comment faire ? • je cherche une photo du Dalai Lama ... comment faire ? • savez-vous si je peux consulter les articles (full-text) des revues "Journal of the American Society for Information Science and Technology" ? et "Journal of Documentation » Gallezot
Exo • Ressources en ligne de votre blibliothèques concernant vos thématiques (IE) ? Gallezot
Ressources sur le web Gallezot
Les bases de données • Worldcat : (catalogues http://worldcat.org/ • Article Inist : (catalogues :http://services.inist.fr/public/fre/conslt.htm • Europeana : (bibnum : http://www.europeana.eu/portal/) • Gallica : (bibnum : http://gallica.bnf.fr/ ) • Google book : http://books.google.com/ • Images : (base d’images spécifique :http://cartelfr.louvre.fr ) • Sons : L’encyclopedie Sonore,http://e-sonore.u-paris10.fr/e-sonore/main.php?daj=search_small&sid=&ref=CAE92LEG08 • Librairies en ligne (Amazon, chapitre.com, …) Gallezot
Dico and Co • Wikipedia : http://fr.wikipedia.org/wiki/Accueil • Les dictionnaires : http://www.dictionnaire-mediadico.com/http://www.les-dictionnaires.com/ • TermScience (lexiques, dictionnaires, thesaurus) : http://www.termsciences.fr • CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance)http://www.cnrtl.fr/lexicographie/ Gallezot
AO & Co • HAL : http://hal.archives-ouvertes.fr/ • Revues.org : http://www.revues.org/ • Persee : http://www.persee.fr/web/guest/home/ • OAIster : http://www.oaister.org/ • OpenDOAR :http://www.opendoar.org/ • Scientific commons http://www.scientificcommons.org/ Gallezot
Les outils de recherche du web(quelques exemples) Moteurs « academics » • Google scholar : http://scholar.google.com • Scirus : http://www.scirus.com • Scientificcommons : http://www.scientificcommons.org/ • Esp@cenet : http://www.espacenet.com • Google patent : http://www.google.com/patents • In extenso : http://www.in-extenso.org/ • Scitopia : http://www.scitopia.org/scitopia/ Moteurs de médias • Vidéos : http://www.blinkx.com/ • Images : http://www.picsearch.com/ • Sons : http://www.seeqpod.com • Music : http://songza.com/ Gallezot
Les outils de recherche du web(quelques exemples - suite) Clustering • Exalead http://www.exalead.fr • Kooltorch : http://www.kooltorch.com • Quintura : http://quintura.com/ • Grokker: http://www.grokker.com/ Curseurs Clush : http://www.clush.com/ Oamos : http://www.oamos.com/ MétaMoteurs • Ixquick http://www.eu.ixquick.com/fra/ • Clusty : http://clusty.com/ • Kartoo • ALL+ : http://www.allplus.com Gallezot
« Verticale » selon plateforme • Blogs : http://www.technorati.com/ • Wikio (blogs) : http://www.wikio.fr/blogs • Qwika : http://www.qwika.com/ Divers • Wayback machine http://www.archive.org/ • Cuil : http://www.cuil.com/ • Hakia : http://www.hakia.com/ • Searchme :http://www.searchme.com • Open directory project http://www.dmoz.org/ • Intute : http://www.intute.ac.uk/about.html • Lecdi : http://www.lecdi.net/ >> comparer les résultats de différents outils avec la même requête • http://en.wikipedia.org/wiki/List_of_search_engines • http://www.altsearchengines.com/ Gallezot
Exos • Reprendre les questions des diapos « sur la R en bibliothèque » avec les outils du web Gallezot
Moteurs (remarques) • Interfaçage : http://www.touchgraph.com/TGGoogleBrowser.html • Comprendre la relation entre les moteurs : http://www.search-this.com/search-engine-decoder/ Gallezot
Outils du web2.0(fonction recherche uniquementcf. dia outils de veille) • Signets : Del.ici.ous (http://delicious.com ), digg (http://www.digg.com/ ), … : • Ref biblio : CiteUlike (http://www.citeulike.org/ ), Bibsonomy (http://www.bibsonomy.org/ ), … • illustrations : Flickr (http://www.flickr.com/ ), youtube (http://www.youtube.com/ ), … : • Présentations (PPT : http://www.slideshare.net ) Gallezot