Création d’un moteur de recherche du développement personnel

By | 30 juillet 2008

recherche-personnalisee-ceclair.jpg

Savez-vous ce qu’est un moteur de recherche personnalisé google? C’est un moteur de recherche qui permet de rechercher dans une sélection de sites choisis à l’avance et qu’on peut inclure via un formulaire sur son propre site web.

Ceci est particulièrement intéressant quand on connaît déjà un ensemble de sites spécialisés autour d’un thème précis. C’est grâce au blog Impro Vidéo que j’ai pu découvrir ce concept, car l’auteur y a placé un moteur de recherche qui recoupe les 100 principaux sites sur l’improvisation théâtrale.

De là, j’ai tout de suite pensé à la liste des blogs francophones sur le développement personnel que je maintiens sur developpementpersonnel.org. Pourquoi ne pas me servir de cette liste pour créer un moteur personnalisé du développement personnel que j’incluerais sur C’éclair!?

C’est maintenant chose faite depuis vendredi dernier et vous pouvez désormais utiliser le formulaire correspondant dans le panneau latéral.

Le meilleur, c’est que grâce aux outils google, la liste des sites de ce moteur de recherche se met à jour régulièrement et automatiquement à partir de la page de l’annuaire. Donc quand je rajoute un blog dans l’annuaire, le moteur de recherche rajoute tout seul ce blog dans la liste de recherche. Sympatique non?

Pour ceux qui voudraient savoir comment créer un tel moteur, j’ai préparé un tutoriel pour vous expliquer la manipulation…

Tout d’abord il faut savoir qu’il y a plusieurs façons de procéder. Mon approche personnelle a été de créer un moteur de recherche sur mon compte adsense puis de le modifier dans Google – Recherche Personnalisée. Mais on peut aussi directement créer son moteur de recherche en partant de Google – Recherche Personnalisée.

Donc si vous partez de Google Adsense, vous devrez d’abord naviguer dans votre compte jusqu’à la page ci-dessous puis cliquer sur “Adsense pour les recherches” :

adsense pour les recherches.jpg

Ce qui vous permettra de créer un moteur de recherche basique.

Ensuite, une fois ce moteur créé, rendez-vous dans “Gérer les annonces”, et cliquez sur le lien “modifier les paramètres” de votre moteur de recherche :

modifier-les-parametres.jpg

Vous attérrirez ainsi sur la page suivante, où il faudra cliquer sur le lien “Découvrez encore plus de fonctionnalités de recherche avancée” :

compte-custom-search-engine.jpg

Et hop, comme par magie, cela vous amènera jusqu’à votre compte Google – Recherche personnalisée :

recherche-personnalisee.jpg

Maintenant, si vous voulez récupérer la liste des adresses des sites à inclure dans le moteur à partir d’une page web donnée, il faudra aller dans “Options avancées” :

flux-d-annotations.jpg

La zone qui nous intéresse s’appelle “flux d’annotations” (en rouge).

C’est là que vous indiquerez le lien vers la page web qui contient les adresses des sites à rechercher. Mais afin que google puisse la comprendre, ce lien devra faire appel à l’outil makeannotations. C’est à dire qu’il aura la forme suivante :

www.google.com/cse/tools/makeannotations
>?url=developpementpersonnel.org%2Fannuaire2Findex.php
>&label=cse_go40khq05fc
>&pattern=path
>&startbyte=2300

(ici, les caractères supérieur (“>”) veulent dire que la ligne précédente continue)

Voici une description des diverses parties du lien :

  • Le paramètre en rose représente l’adresse de la page où on va extraire les sites à rechercher avec le moteur de recherche.

    Comme on est dans un lien, il faudra faire attention à traduire les caractères spéciaux à l’aide du tableau suivant :

    caractère original caractère correspondant pour le lien
    / %2F
    ? %3F
    = %3D
    & %26

    Donc developpementpersonnel.org/annuaire donnera : developpementpersonnel.org%2Fannuaire

  • La partie en vert est un code qui indique que les sites extraits à partir de la page web spécifiée dans le paramètre url sont à inclure dans le moteur de recherche. Vous pourrez trouver ce code sur la capture d’écran précédente (en vert).

  • La partie en orange indique comment sont extraits les adresses des sites de la page web spécifiée dans le paramètre url. Elle peut avoir 3 valeurs :

    exact : l’adresse entière est utilisée pour créer un modèle de lien exact :
    exemple : “www.ex.com/some/path/file.html”

    path : la portion du lien avant le dernier slash (“/”) est extraite. Puis, une étoile est ajoutée, pour créer un modèle de lien de type préfixe :
    exemple : “www.ex.com/some/path/*”

    host : la portion du lien avant le premier slash (“/”) est extraite et une étoile (“*”) est ajoutée pour créer un modèle de lien de type préfixe. Le nom de domaine est aussi tronqué au niveau “organisation” et une étoile est insérée, créant donc aussi un modèle de lien de type domaine :
    exemple : “*.ex.com/*”

  • La partie en bleu est optionnelle. Lorsqu’on extrait les liens de la page web spécifiée dans le paramètre url, l’outil makeannotations scanne normalement la page entière. Mais si un paramètre startbyte est spécifié et que c’est un entier positif, alors le scan commencera ce nombre de caractères après le début de la page. Si un paramètre stopbyte est spécifié, le scan s’arrêtera à cette position.

Voilà tout, il vous suffit ensuite de récupérer le code du moteur, et de l’insérer sur votre site.

Si vous créez un tel moteur sur votre site, faites-nous en part dans les commentaires…

13 thoughts on “Création d’un moteur de recherche du développement personnel

  1. Pingback: Création d'un moteur de recherche du développement personnel

  2. Pingback: buzztoujours.com

  3. SBN

    Un peu trop compliqué/technique comme explication pour moi 🙂 mais j’approuve l’idée. Je m’inscris dans ton google group rapidement.

    Sébastien

  4. Laurent Brixius

    @Alexandre,

    N’ayant pas de compte AdSense (et n’en souhaitant pas), je suis passé directement par Google – Recherche personnalisée. Je n’y vois pas de bouton pour afficher les “Options avancées”.

    De plus, l’édition standard impose l’affichage d’annonces dans la page de résultat, chose à laquelle je suis opposé pour l’ensemble de mes sites web car il n’est pas possible de contrôler les annonces susceptibles d’être affichées. Et l’édition Premium est “à partir de 100$ par an”…

    Je crois que je vais faire l’impasse sur le moteur de recherche personnalisé… Dommage!

  5. Alexandre Post author

    @Laurent : ça y est, j’ai pu créer un moteur sans annonces adsense. Il suffisait de cocher l’option “association à but non lucratif”.
    Cette option permet en plus d’avoir les options avancées qui permettent la synchronisation avec la page de l’annuaire.

    Voici le code à ajouter :

    <form action="http://www.google.com/cse"
    id="cse-search-box">

    <div>

    <input type="hidden" name="cx" value="006729500579499965825:n4uq3jobjda" />

    <input type="hidden" name="ie" value="UTF-8" />

    <input type="text" name="q" size="31" />

    <input type="submit" name="sa" value="Rechercher" />

    </div>

    </form>

    <script type="text/javascript" src="http://www.google.com/coop/cse/brand?form=cse-search-box&lang=fr"></script>

    Et voici ce que ça donne:

  6. Laurent Brixius

    Merci beaucoup Alexandre,

    J’hésitais à indiquer mon blog comme étant une association à but non lucratif. Je pense en effet, à terme, proposer des services par l’intermédiaire d’ARCHImarketing. Mais ce n’est pas encore le cas alors… le formulaire de recherche est en ligne sur le blog Architecte & Marketing!

  7. Alexandre Post author

    Oui bon on va pas chipoter, qui ne prends pas de risque n’obtient pas de grand bénéfice n’est-ce pas?

    Bonne chance pour ton dernier scoop. Je t’ai donné un petit clic.

  8. Laurent Brixius

    Tu as raison. Merci pour le clic 🙂

    As-tu un moyen d’évaluer le nombre de visites qui proviendront du moteur de recherche? Jusqu’à présent, j’ai remarqué que mes visiteurs utilisent assez peu les formulaires de recherche.

  9. Alexandre Post author

    Je pense que ça doit être possible avec Google Analytics, mais après comment on fait, je ne sais pas.

    Perso je n’ai pas beaucoup de requêtes en ce moment. Il doit y en avoir 3 pour mille peut-être. C’est un peu décevant mais il faut dire que C’éclair! a souvent un contenu plutôt technique, alors ces visiteurs ne sont pas forcément intéressés par le développement personnel.

  10. Laurent DUREAU

    Bonjour Alexandre,

    Je viens de recevoir ton email m’invitant à installer ce type personnalisé de recherche. L’idée me semble intéressante et je veux bien essayé même si je me fais passer pur une assoc.

    Par contre pourrai-tu faire un petit fichier style notepad avec toutes les url des sites de développement personnel que tu as listé dans ton annuaire.

    C’est vrai que tout se retaper à la main c’est un peu long. Cela encouragera peut être les autres à en faire de même.

    Merci pour ton aide et ta proposition,

    Laurent

  11. google tunisia

    un moteur de recharche dans le terre

  12. Pingback: Il y a un an sur C’éclair! - juillet 2008

  13. gg

    http://www.google.com/coop/cse/brand?form=cse-search-box&lang=fr“></script>

Comments are closed.