Skip to content

Accueil > Contenus pédagogiques > Comprendre le moteur de recherche avec une simulation

Comprendre le moteur de recherche avec une simulation

Version 1.6. (19/02/2017)

lundi 15 février 2016, par Florian Reynaud

Au-delà de manipulations de moteurs de recherche comme Google, Yahoo, Bing, Qwant ou Duckduckgo, il est difficile d’aborder le lien entre utilisation d’un moteur de recherche et sa base de données. La conception d’une simulation est une tentative pour apporter cette connaissance aux élèves, dès la Cinquième.

L’utilisation pédagogique de l’outil présenté dans cet article est intégrée dans une séquence de niveau Cinquième, intitulée Du document au média. Dans cette séquence, les élèves sont amenés à découvrir la chaîne éditoriale du livre, les étapes de conception d’une page web, puis le fonctionnement d’un moteur de recherche pour trouver les pages web.

La simulation se présente sous la forme d’un site web, Webfinder, accessible sur : http://iddocs.fr/webfinder/ Ce site web est disponible ci-dessous en téléchargement, afin de l’améliorer et de l’héberger ailleurs.

Utilisation pédagogique

La simulation Webfinder, pour favoriser la compréhension du fonctionnement du moteur de recherche, part du principe qu’on ne compte que dix pages web sur Internet.

Le moteur de recherche est créé pour permettre la recherche parmi l’ensemble de ces pages, en estimant qu’il y en aura davantage ensuite (plus de mille milliards aujourd’hui).

Le travail passe d’abord par la consultation de la base de données, avec un tableau de dix lignes (dix pages web) et de cinq colonnes (les élèves ayant déjà été initié au langage HTML, observent et expliquent). Précisons que le nombre donné de visites n’est pas réel.

Passant sur la page suivante, les élèves sont amenés à faire une recherche autour de la digestion (les pages traitent toutes de la digestion), et à repérer le critère qui explique le classement des dix pages dans cet ordre précis. Il est possible de trier le tableau à partir d’une colonne en cliquant sur l’en-tête de la colonne choisie.

Cette étape est la plus longue, peut demander 20 à 25 minutes de réflexion afin que les élèves s’approprient l’outil, l’effort de comparaison entre résultats et tableau de la base de données, puis fasse le lien entre la logique du nombre de mots clés et la dernière colonne du tableau.

L’étape suivante consiste à ajouter un critère et à intégrer le principe, ici artificiel, du calcul d’un Page Rank. On ajoutera encore un critère pour terminer l’exercice. Il est possible de trier le tableau à partir de plusieurs colonnes en cliquant sur l’en-tête de la première colonne, puis sur l’en-tête de la deuxième colonne en maintenant la touche [Schift], etc.

On termine cette découverte de l’algorithme du moteur et de la base de données par l’intégration d’un lien publicitaire (qu’on laisse les élèves repérer) et par la présentation d’autres critères (ainsi la connaissance par certains moteurs de recherche de la navigation web et des recherches antérieures de l’internaute).

Ces éléments sont évidemment complexes pour des élèves de Cinquième, et supposent une reprise et un approfondissement dans la suite de l’année et en Quatrième puis Troisième, à travers la comparaison de moteurs de recherche et à travers la découverte d’autres bases de données (celles de médias sociaux en ligne par exemple).

Aspects techniques

Le site Webfinder est développé avec l’arborescence suivante :

  • [css] (contient la feuille de style)
    • wfstyle.css
  • [db] (contient l’installation de la table)
    • change_connect.php
    • finder_sites.sql
    • install_tables.php
    • wf_connect.php
    • _wf_connect_data.php (le 1er underscore disparaît après installation)
  • [img] (contient toutes les images)
    • asc.gif (trois icônes de tri du tableau)
    • bg.gif
    • desc.gif
    • fin.png (icône de fin)
    • nav_continuer.png (nav* concerne la navigation)
    • nav_loupe.png
    • nav_revenir.png
    • page01_vidal.png (page* concerne les vignettes des dix pages)
    • page02_wikid.png
    • page03_ikonet.png
    • page04_recre.png
    • page05_perso.png
    • page06_petitquo.png
    • page07_larousse.png
    • page08_futura.png
    • page09_vikid.png
    • page10_vikit.png
    • shift.png (icône de la touche shift, pour aide)
    • wf_header.png (deux icônes pour identifier webfinder)
    • wf_logo.png
  • [include]
    • bdd0.php (bdd* concerne le tableau de la base de données)
    • bdd1.php
    • bdd2.php
    • bdd3.php
    • form_off.php (form* concerne la barre de recherche, activée ou désactivée)
    • form_on.php
    • row1.php (row* concerne la colonne de résultats)
    • row2.php
    • row3.php
    • section_centre.php
    • tablesorter.php (pour le tri des colonnes de la base de données)
  • [js] (contient les scripts de triage de colonnes d’un tableau)
    • jquery.tablesorter.js
    • jquery-latest.js
  • erreur.php (si la recherche ne correspond pas à "dig")
  • fin.php (page de fin avec les trois recherches)
  • index.php
  • install.php
  • intro.php
  • moteur0.php
  • moteur1.php
  • moteur2.php
  • moteur3.php
  • recap.php
  • resultats.php
  • results.php

Il suffit de copier l’ensemble des fichiers dans un dossier spécifique sur un hébergement et d’avoir les éléments nécessaires à une installation dans une base de données (serveur, utilisateur, mot de passe et nom de la base), afin de procéder à l’installation.

Téléchargement de Webfinder 1.6

Les dix pages web sont stockées dans une table (finder_sites) de base de données, avec la structure suivante :

  • id
  • titre
  • url
  • texte
  • nb_liens
  • nb_visites
  • nb_dig
  • score_mot
  • page_rank1 (calcul préétabli pour la 1re recherche)
  • score_visites
  • page_rank2 (calcul préétabli pour la 2e recherche)
  • score_liens
  • page_rank3 (calcul préétabli pour la 3e recherche)

Une simulation est forcément limitée. Ici, quand on demande aux élèves de faire une recherche autour de la digestion, ceux-ci sont amenés à taper une requête commençant par "dig", qui correspond pour nos pages aux mots du lemme "digestion".

Toute amélioration est la bienvenue, autant au niveau technique qu’au niveau théorique.

Mises à jour :

  • Version 1.1. le 18/02/2016. Intégration de la notion de "lemme" dans l’affichage de la base de données (lemme "digestion" regroupant tous les dérivés du terme). Fichiers concernés par la mise à jour : include/bdd*.php et include/section_centre.php
  • Version 1.2. le 20/02/2016. Correction du "Nb de liens externes" par le "Nombre de liens, sur le web, vers cette page". Correction de "Nb" par "Nombre". Reprise de la page récapitulative. Fichiers concernés par la mise à jour : index.php, include/bdd*.php, recap.php
  • Version 1.3. le 29/02/2016. Module d’installation de la table dans la base de données. Fichiers concernés par la mise à jour : index.php, install.php, wf_connec*.php, db/*
  • Version 1.4. le 27/03/2016. Correction pour l’installation. Fichier concerné par la mise à jour : index.php
  • Version 1.5. le 22/04/2016. Correction pour l’installation. Fichier concerné par la mise à jour : index.php
  • Version 1.6. le 19/02/2017. Changement de licence (AGPL). Résolution d’un bug d’accès sans installation. Gestion de mises à jour. Amélioration de l’affichage. Amélioration des interactions (en cas d’erreur de recherche, sur certains aspects au regard des observations en séance). Intégration des réponses dans l’interface. Intégration de nouvelles notions dans les textes explicatifs (pertinence, popularité, notoriété).

Propositions en attente :

  • Développer trois versions de la simulation : niveaux débutant, intermédiaire et avancé.
  • Présenter une ou plusieurs pages non indexées dans les niveaux intermédiaire et avancé.

Répondre à cet article