Christophe Le Bot

  • Navigation rapide
Pratique de la conception numérique

Derniers commentaires

  • Une excellente thèse sur Simile Exhibit
    • Olivier Rossel | Bonjour. Malgre les annees, avez vous toujours en memoire vos usages d’Exhibit? Je serais ravi d’en discuter avec vous. Cordialement, Olivier Rossel.
  • Utiliser le planificateur de tâches OVH (crontab) avec PHP
    • Max | Bonjour, comme faire pour appeler une version de PHP qui n’est plus proposée par défaut dans le manager ? J’essaie de lancer un cron avec php 5.3 mais le log affiche No such file...
    • Christophe | @absolument Merci pour ces précisions. Je n’ai pas mis en place de tâches cron récemment, mais j’ai reçu quelques notifications étranges d’OVH il y a quelques...
  • Récupérer le dernier auto-incrément MySQL avec PHP
    • Thy | Sujet toujours *très* utile en 2015 ! Je réponds à Serge tsimba qui récupère un « Resource id ». (Et à tous ceux qui ont le même souci mais qui ne le disent pas) :)...
  • Régler l’heure de serveurs virtuels sous Debian
    • Ares_XL | Il semble que sur Débian la commande « tzconfig &ra quo; soit dépréciée et remplacée par : « dpkg-reconfigure tzdata » elle donne accès à une...
 

Archéoblogologie – Episode 4 : le trésor

La suite d’Archéoblogologie…
Épisodes précédents : 1. Le décor2. Le best-of3. La source

La crème de la crème

En cette période festive (je parle des deux semaines de fin d’année qui viennent de passer, pas du reste un peu morose…), je vous propose un menu gourmand, mais pas indigeste. Certes, il y a de vieux plats faits avec de vieilles recettes, mais vous devriez y trouver du contenu à votre goût. Bref, au-delà du quantitatif, voici les articles de mon blog qui attirent encore mon attention aujourd’hui, avec le recul de celui qui en a oublié l’existence !

  • La toute première page du web
    Tout ceux qui passent plus de deux minutes par jour sur le web devraient connaître son contenu par cœur et remercier son auteur chaque matin. La révolution numérique que nous vivons est partie de cette page… Tout un symbole.
  • L’internet rapide et permanent
    Expliquer des concepts informatiques avec des mots simples et des schémas clairs, un exercice délicat, mais remporté haut la main par ce site toujours aussi utile. Attention ! Il a changé d’adresse : http://irp.nain-t.net/
  • CRUD, ACID, UDOD, CRAP
    J’ai eu ma période des acronymes à quatre lettres. C’est bizarre, le cerveau, des fois… Mais relire les quatre articles en même temps mérite le détour : un peu d’architecture, un peu d’exploitation, un peu d’analyse des besoins, un peu d’ergonomie. C’est ce que je fais tous les jours aujourd’hui !
  • Le Web 2.0 atteint ses limites
    Je n’ai jamais vraiment accroché avec le Web 2.0. Cet article le montre bien ! Mais, il s’est passé une chose fondamentale à ce moment-là : le producteur d’information n’était plus nécessairement l’expert, celui qui sait, mais l’observateur, celui qui surveille et diffuse les événements qu’il vit. Beaucoup de questions dans cet article, quand on partait tous vers l’inconnu. Aujourd’hui, nous avons beaucoup de réponses, mais la question des droits d’auteur est loin d’être réglée…
  • “Web 2.0″, Ajax, interfaces riches et prospective
    Encore une salve anti-web 2.0 ! Mais l’article se concentre sur la révolution Ajax… qui s’est largement confirmée depuis ! JavaScript est partout, la mise à jour de contenu à la volée concerne pratiquement tous les sites web, les mobiles et tablettes l’exploitent à fond. Bref, Ajax est incontournable. La question sur le futur des interfaces reste entière : on prend le chemin que j’avais décrit à l’époque.
  • Y a-t-il des spécialistes d’Exhibit dans la salle ?
    J’avais promis de parler des projets Simile. Voici le premier article sur le sujet, à un moment où je découvrais le web sémantique. Le travail réalisé par le MIT sur le sujet est passionnant et j’utilise toujours les Simile Widgets aujourd’hui. Merci à Gautier Poupeau et Christian Fauré pour avoir partagé leurs connaissances éclairées !
  • Simile Exhibit 2.0 officiellement en français
    J’ai tellement aimé les Simile Widgets que je les ai rendus disponibles en français ! Il va falloir que je m’occupe de la version 3…
  • Une excellente thèse sur Simile Exhibit
    Allez, encore un article là-dessus et j’arrête de vous bassiner ! Mais celui-ci vaut vraiment le détour. Bien plus que les miens !
  • Magento dévoile son business model
    Voilà LE sujet qui m’occupe depuis fin 2007. C’est une période très lointaine, dans le référentiel hyper-actif du web ! Mais il faut bien reconnaître que cette solution e-commerce en avait dans le ventre et ce n’est pas un hasard si elle est la plus utilisée dans le monde aujourd’hui. Vous avez été très, très nombreux à lire ce premier article de fond, les commentaires passionnés en témoignent.
  • World of Goo : le design numérique par excellence
    Je ne parle pas souvent de jeux vidéo. C’est un tort ! Cette activité numérique est extrêmement créative et innove en permanence. Pour preuve, ce jeu génial, sorti initialement pour PC en 2008 et qui fait, quatre ans plus tard, un tabac sur mobiles et tablettes. Une note de 4,8 sur Google Play, c’est plus que bien !
  • Livre Magento : ça, c’est fait !
    Du papier, oui, ça existe encore ! Et c’est bien pratique pour apprendre de nouvelles connaissances et structurer sa mémoire. Cela fait plus d’un an et demi que mon livre sur Magento est sorti. Il a un peu vieilli, mais il se vend encore. Je n’ai jamais donné de chiffre (je ne sais pas si je peux le faire, d’ailleurs…), mais il s’est bien vendu ! Une nouvelle édition avec plein d’astuces techniques et la version 2 de Magento ? Ce serait bien, mais quel boulot de dingue d’écrire un livre ! Je suis content de l’avoir fait, mais ça laisse des traces. Pas très chaud pour remettre ça… Mais j’aime les challenges 😉

C’est sur cette exhumation que prend fin la série Archéoblogologie. Mais avant de conclure, j’ai promis de vous parler des brouillons, ce mal pandémique des blogueurs… A ce jour, 30% des articles de mon blog sont encore des brouillons, des contenus que je suis le seul à connaître, autant de trésors potentiels… ou vieux scoops sans aucun intérêt.

Yes ! Il y a quelques perles dans ces brouillons. Je pense que je vais calmement les relire et les publier.

Comme celui sur la capitalisation d’Apple qui au mois d’août 2012 atteignait l’équivalent du quart du PIB de la France ! Depuis, le soufflet est retombé.

Ou celui-ci qui montre une page de résultat de Google étonnante dans laquelle Google n’apparaît pas sur les mots-clés « moteur de recherche », mais fait la part belle à ses concurrents ! C’est logique, on est déjà chez Google, mais ça fait bizarre, non ?

Moteur de recherche dans Google Résultat de la recherche des mots « moteur de recherche » dans Google

Bref, tout ça pour dire que ce ne sont pas les sujets passionnants qui manquent. Juste un temps énorme pour les analyser, les synthétiser et les publier.

Pourtant, si je reprends les rênes de ce blog, c’est pour une seule raison : après avoir bricolé avec 10000 outils, des tablettes, smartphones, réseaux sociaux et services en cloud, je me rends compte que j’ai des dizaines de milliers d’informations collectées et stockées sur des dizaines de terminaux et de serveurs et que je suis incapable de les exploiter au quotidien. Après réflexion, je me suis rendu compte que mon blog était le meilleur endroit pour stocker sur le long terme des informations qui me sont importantes. J’ai fait un grand ménage un peu partout et la synthèse se retrouve ici, au fur et à mesure. Dans un premier temps, sous forme de brouillons, bien sûr !

Vous aussi, tentez l’aventure de l’archéoblogologie ! Déterrez le nectar de vos vieux blogs ! Reprenez la main sur vos contenus éparpillés ! Utilisez votre esprit de synthèse ! Diffusez VOTRE savoir !

Archéoblogologie – Episode 3 : la source

La suite d’Archéoblogologie…
Épisodes précédents : 1. Le décor2. Le best-of

Mais qu’est-ce que vous me voulez ?

Voyons maintenant par quels mots-clés les visiteurs arrivent sur mon blog. Les cinq premiers sont :

  • xdebug eclipse
    Normal. L’article correspondant est très consulté. C’est rassurant de voir des développeurs s’intéresser aux outils de debugging !
  • magento
    Ah tiens ? C’est vrai. Il fut une époque lointaine où je parlais de Magento sur ce blog, avant de transférer le sujet sur mon autre blog Magentips. Encore un bon cas d’étude archéoblogologue…
  • drupal ovh
    Logique. Un contenu toujours recherché… tant que PHP6 n’est pas chez OVH. Hum… Désolé pour la mauvaise blague, mais elle était facile. On en reparle dans, disons, six ans ?
  • christophe le bot
    C’est moi ! Mais c’est aussi plein d’autres. Grâce au web, j’ai déjà identifié 12 homonymes. Eh bê, il faut même se battre pour le référencement de son propre nom… La vie numérique est cruelle. Dans la vraie vie, on ne rencontre pas autant de monde !
  • favicon generator
    Étonnant que je sois une source d’information aussi consultée sur le sujet. J’ai juste fait quatre lignes sur un service proposé par un autre site. Pourquoi passer par chez moi ? Ah mais oui, sur internet, le chemin le plus long est souvent le plus court. Et puis d’abord, c’est Google qui décide !

Si je les compare aux mots-clés saisis dans le champ de recherche du blog, le résultat est assez différent :

  • graphe
    J’aime beaucoup ce sujet, même si je n’ai pas trop écrit dessus. J’avais surtout un lien vers un très bon site qui n’existe plus aujourd’hui. Il expliquait clairement la théorie des graphes. Il faut croire que quelques visiteurs le cherchent encore… Vous savez quoi ? J’en ai fait une copie au format PDF que j’ai ajoutée en fin de page ! Mais chut, ça reste entre nous 😉
  • magento
    Le revoilà, celui-là. Dans le genre « Succès du web », Magento a une sacrée bonne place ! Il doit se retrouver dans le top 10 des mots recherchés sur plusieurs milliers de blogs !
  • selenium
    Quasiment rien sur mon blog sur le sujet… Des visiteurs perdus ? J’ai eu la flemme de regarder pourquoi. Le quantitatif m’ennuie assez vite, en fait.
  • timeline
    La fameuse période Simile ! Mais je ne dirai rien : j’en parle plus loin.
  • amende
    Ben ouais, quand il reste la journée pour payer son amende avant majoration, le champ de recherche est un outil efficace. Surtout quand mon article vous évite d’y passer plus de la journée !

Bientôt, la suite d’Archéoblogologie – Episode 4 : le trésor…

Archéoblogologie – Episode 2 : le best-of

La suite d’Archéoblogologie…
Épisode précédent : 1. Le décor

Qu’est-ce que je vous sers ?

Passons à une analyse plus quantitative. C’est bien, le quantitatif, ça rassure. On semble maîtriser le mouvement, on mesure, on calcule, on surveille. Qui a la plus longue ? La plus longue durée moyenne de visite, la plus longue traîne sur certains mots-clés, la plus longue période sur la première page de résultats de Google, la plus longue liste de followers, likers et autres gogolers

En attendant, d’autres avancent, innovent, bousculent, prennent le risque de rompre le savant équilibre pour sombrer dans l’oubli ou encaisser le choc d’un énorme succès.

Tant pis pour cette fois, je me retiens, c’est tellement facile le quantitatif. Alors moi aussi je vous offre mon best-of. Mais attention, un best-of 2006-2012 ! Les pages les plus vues de mon blog depuis l’origine sont, dans l’ordre :

  • Régler l’heure de serveurs virtuels sous Debian
    Des milliers d’administrateurs-système ont mis à l’heure des dizaines de milliers de serveurs, grâce à cette page ! Enfin… J’aime bien pensé que c’est possible. En tout cas, sans rien faire, des dizaines de visiteurs la lisent tous les jours. Quelques sites référents dans le monde Linux font un bon boulot de sourcing !
  • Configurer Xdebug pour Eclipse PDT en utilisant un serveur de test distant
    Là encore, beaucoup de trafic, même si je trouve l’article léger et incomplet. J’avais promis une suite, mais elle n’est même pas dans les brouillons. Les brouillons ! Il faut que je vous en parle ! Euh, après, après…
  • Récupérer le dernier auto-incrément MySQL avec PHP
    Celui-ci est intéressant, d’abord parce qu’il aide beaucoup de développeurs, mais aussi parce que les commentaires sont un cas d’école : intéressants, enrichissants et sympathiques. Tout ce que j’apprécie dans les échanges !
  • Test d’interface : paiement d’amendes en ligne
    L’OVNI du blog… Un truc de dingue… Je teste l’interface du site de paiement des amendes et je récupère tout ceux qui n’arrivent pas à l’utiliser. Si j’avais pris un pourcentage, je serai millionnaire !
  • Installer Drupal 6 sur un serveur mutualisé OVH
    Un article court, mais important pour ceux qui veulent faire tourner du PHP5 chez OVH. Forcément, les astuces qui fonctionnent attirent du monde.

Bientôt, la suite d’Archéoblogologie – Episode 3 : la source…

Archéoblogologie – Episode 1 : le décor

Il est toujours passionnant de déterrer les vieux outils numériques. On constate alors le décalage technique, social et fonctionnel qui existe avec ceux d’aujourd’hui. Quoique… On retrouve aussi de bonnes idées, posées il y a longtemps et « reliftées » pour les réexploiter de façon très lucrative. Pas grave, tout va trop vite, alors on oublie. Donc on nous le ressert… mais différemment !

Archéo quoi ?

Où voulais-je en venir, déjà ? Ah oui, l’archéoblogologie, ou la découverte de vieux blogs quasi-éteints, enterrés sous la toile du web. Et je n’ai pas de meilleurs cas que celui de… ce blog ! En effet, en sept ans, il a connu plusieurs phases : celle d’une activité débordante à celle de l’abandon complet, en passant par des simili-transformations et changements de cap pas trop bien assumés…

Cette plongée dans un micro-rouage de l’histoire du web me pousse à partager avec vous quelques constats et réflexions.

Le contexte

Ouvert en mars 2006, en pleine hégémonie du Web 2.0, mon blog a rencontré un certain succès et un public fidèle (merci !). Certains pics à plusieurs centaines de visiteurs par jour m’avaient longtemps étonné à l’époque, surtout quand je les comparais aux statistiques des sites de certains de mes clients… Un contenu de qualité (c’est vous qui l’avez dit !), quelques relais bien choisis (la magie des réseaux) et hop !

Petit à petit, je suis passé à d’autre activités chronophages, le contenu s’est fait plus rare et les visiteurs aussi. Rien que sur les 24 derniers mois, le trafic a baissé de 60% ! Pas de quartier… Et pas de miracle : il faut bosser !

Tout change ? Là, non…

Premier constat, et pas des moindres : dans ce monde numérique où tout est obsolète en 6 mois, ce blog utilise la même solution technique depuis sept ans. Bon, bien sûr, entre le WordPress de 2006 et celui de maintenant, c’est un peu comme passer d’une R16 à une Megane IV, mais on reste dans la même philosophie. Et surtout, le contenu a suivi pendant tout ce temps ! Pas de migration délicate ou lourde, c’est toujours simple (à condition de prendre les précautions de base). Côté serveur, là aussi, les technologies sont les mêmes. J’aime bien ce confort inhabituel 😉

Bien sûr, il manque quelques petites choses : un thème HTML5 + CCS3, une version mobile, des pages responsive. Et pas de bouton Like, G+ et autres verrues ! Oh, c’est carrément old school, là.

Ah si, ça change un peu…

Au final, un blog se gère très bien dans la durée, les détails arrivent toujours à suivre. Mais une question me tracasse : à quoi ça sert, un blog, en 2013 ? C’est le concept du blog qui prend un coup de vieux, face aux plates-formes sociales, aux applications mobiles, aux appareils ubiquitaires et aux nouveaux modèles économiques dans lesquels s’enferment les utilisateurs.

Pourtant, j’ai l’impression que les blogs représentent maintenant le socle stable du contenu du web, celui autour duquel des milliards de données sont échangées : « j’aime », « j’aime pas », « t’as vu ? », « tu connais ? », « trop cool », « c’est fun », « lol », etc. Bref, là encore la loi de Pareto est respectée : seulement 20% des contenus font 80% du savoir, il reste à dénicher les 20% restants dans 80% des échanges de données.

Demain, la suite d’Archéoblogologie – Episode 2 : le best-of…

La barre des 4000 spams a été franchie !

4002. C’est, à cet instant, le nombre de spams que l’extension Askimet a éliminé de mon blog depuis que je l’ai installée (6 mois environ). Je trouve déjà le chiffre très élevé par rapport au trafic visiteurs (3000 visiteurs / mois). Ce qui m’étonne, c’est le taux de croissance de ce fléau, pire que celui mesuré globalement par Askimet, pourtant alarmant. J’ai atteint les 2000 en août et les 3000 il y a 2 semaines. A ce rythme, j’en serai à 10000 avant Noël !

Pas très réjouissant comme cadeau de fin d’année… L’essentiel est qu’Askimet ne croûle pas sous la charge ! Mais, connaissant les critiques récurrentes sur la vulnérabilité de WordPress face aux spams, sauvé comme par miracle par l’extension Askimet… du même éditeur, c’est peut-être là qu’est le défi que souhaite relever quelques spammers.

Qu’ils aillent jouer ailleurs !

Comparatif de 4 CMS PHP sur 190 critères

Stéphane Bordage nous propose une analyse complète de 4 solutions de gestion de contenu open source fonctionnant avec PHP :

A chacun de faire sa synthèse en fonction de ses besoins. Un très bon support de décision qui me fait découvrir encore une fois les vertus d’un Drupal que je sous-estimais.

Mise à jour : le dossier complet est disponible dans le numéro 720 du magazine Décision Informatique, paru le 21 mai 2007.

Mise à jour : suite aux réactions (étonnamment violentes) de la communauté Spip à propos des résultats, Stéphane Bordage a pris la sage décision de supprimer Spip de ce comparatif.

Utiliser les catégories pour gérer les tags sous WordPress

Logo WordPress

Incroyable mais vrai : WordPress ne gère pas les tags ! Ces petites étiquettes qui donnent du sens au contenu généré par les utilisateurs, sont dans tous les services estampillés « Web 2.0″… sauf dans WordPress. Les utilisateurs râlent depuis longtemps : c’est qu’ils les demandent, ces tags ! Et avec insistance ! Ils devaient être intégrés dans la prochaine version (la v.2.2 à paraître ces jours-ci) et ne le seront que dans la version 2.3. Les plus impatients ont déjà migré sur d’autres plates-formes…

Mais au fait, a-t-on vraiment besoin des tags dans WordPress ?

Non, car ce moteur de blog propose les catégories pour les gérer. Certains vont tout de suite me dire qu’il y a une grosse différence entre les deux et qu’il faut donc les deux. C’est vrai, il y a une telle différence que j’utilise les deux dans ce blog… en m’appuyant seulement sur les catégories.

Gérer les catégories comme un arbre sémantique

L’astuce consiste à utiliser la hiérarchie des catégories comme un arbre sémantique. Ensuite, il suffit de placer certains de ses noeuds dans l’interface. Pour illustrer le principe, je vais prendre l’exemple de ce blog qui utilise à la fois des thèmes et des tags.

Etape 1 : créer les racines

Pour commencer, je crée les catégories qui me serviront de racines :

  • Thèmes
    Pour gérer une classification hiérarchique.
  • Mots-clés
    Pour gérer les tags.

WordPress m’indique les identifiants des deux racines : 3 pour Thèmes et 4 pour Mot-clés. Ces identifiants sont importants pour placer les racines dans l’interface. Leur valeur dépend bien sûr de votre propre installation de WordPress. Mais n’allons pas trop vite…

Etape 2 : créer les thèmes

Mes thèmes sont hiérarchiques. Je crée donc les thèmes principaux (Concevoir, Développer, Exploiter, Imaginer, Savoir) en les plaçant sous la catégorie Thèmes. Puis, viennent les thèmes secondaires placés chacun sous un thème principal. Rien de très compliqué, c’est du WordPress basique !

Thèmes sous WordPress
La liste de mes thèmes dans l’interface de WordPress.

Etape 3 : afficher les thèmes

Maintenant, il faut mettre les mains dans le cambouis. Je vais modifier le thème WordPress de mon blog pour afficher mes thèmes dans la partie latérale de mon blog. Par défaut, WordPress gère la navigation par catégories dans un fichier nommé sidebar.php. J’y ajoute le code suivant :

<ul>
<?php
wp_list_categories('title_li=&orderby=name&show_count=0&use_desc_for_title=1&child_of=3');
?>
</ul>

wp_list_categories est une fonction standard de WordPress pour afficher la liste des catégories. Grâce à ses options, je vais pouvoir placer la racine de mon arbre sémantique :

  • title_li=
    Indique que je ne souhaite pas afficher de titre avant la liste.
  • orderby=name
    Ordonne les catégories par nom.
  • use_desc_for_title=1
    Affiche les catégories sous leur catégorie mère.
  • child_of=3
    Limite la liste aux catégories appartenant à la catégorie 3 (donc Thèmes).

Etape 4 : créer les mots-clés

Les mots-clés sont créés sur le même principe. Je les saisie donc dans le gestionnaire de catégories de WordPress, sous la catégorie Mots-clés.

Mots-clés sous WordPress
La liste de mes mots-clés dans l’interface de WordPress.

Etape 5 : afficher les mots-clés… dans un joli tag cloud

Pour afficher les mots-clés, j’aurais pu me simplifier la vie en reprenant le même principe que pour les thèmes. Dans ce cas, le code suivant suffit :

<ul>
<?php
wp_list_categories('title_li=&orderby=name&show_count=0&hierarchical=0&child_of=4');
?>
</ul>

Mais présenter les mots-clés sous forme d’un tag cloud est quand-même plus « tendance ». Un tag cloud met en valeur les mots-clés (tags) les plus utilisés. Pour cela, inutile de réinventer la roue, j’utilise une extension WordPress très simple et efficace : Category Tagging.

Une fois installée et activée, je n’ai plus qu’à générer le tag cloud dans l’interface :

<ul>
<?php
// Affichage du tag cloud (via plugin Category Tagging)
if (function_exists ('cattag_tagcloud') ) {
echo cattag_tagcloud(1,5,1,'NAME_ASC','1,2,3,4,5,6,7,8,9','','<li><a rel="tag" href="%link%" title="%description%" class="tag-cloud-%size%">%title%</a></li>','Aucun mot-clé trouvé');
}
// Affichage simple
else {
wp_list_categories('title_li=&orderby=name&show_count=0&hierarchical=0&child_of=4');
} ?>
</ul>

A chacun de spécifier ses paramètres (voir le détail sur le site de Category Tagging). Le plus important est sans doute le 5e paramètre qui exclut des catégories. Je l’utilise ici pour ne pas afficher les catégories racines (Thèmes et Mots-clés), ainsi que les thèmes de premier niveau qui sont déjà dans l’interface.

Reste à définir les styles CSS pour afficher les mots-clés en fonction de leur utilisation. Pour moi, c’est le code suivant :

a.tag-cloud-1 {
	font-size:1em;
	color:#9B907F;
}
a.tag-cloud-2 {
	font-size:1.2em;
	color:#7C6E59;
}
a.tag-cloud-3 {
	font-size:1.4em;
	color:#7C6E59;
}
a.tag-cloud-4 {
	font-size:1.6em;
	color:#666;
}
a.tag-cloud-5 {
	font-size:1.8em;
	color:#444;
}

Inconvénients

Comme toute astuce, la solution n’est pas idéale. Il y a aussi des inconvénients :

  • L’ajout d’un tag n’est pas possible pendant la saisie d’un article. En effet, WordPress propose l’ajout de catégorie pendant la rédaction, mais il semble impossible d’ajouter une sous-catégorie. Si quelqu’un connait le truc, je suis preneur !
  • Il faut modifier le code du thème WordPress pour gérer la liste des catégories à ne pas afficher dans le tag cloud. C’est le cas quand j’ajoute ou supprime un thème principal… ce qui est très rare.

Avantages

La solution n’est peut-être pas idéale, mais c’est un bon compromis :

  • On se passe d’un gestionnaire de tags. WordPress s’en trouve plus léger et plus stable.
  • Au niveau des articles, je peux afficher les thèmes et les mots-clés dans la même liste pour proposer un choix plus large aux lecteurs.
  • Si un mot-clé prend de l’importance, je peux le placer dans les thèmes sans toucher aux articles, ni aux outils de navigation. Pour faire la même chose avec un système de tags indépendant, il faut modifier chaque article…

Mise à jour. Thomas VdB voit deux autres avantages essentiels à utiliser les catégories comme arbre sémantique :

  • Les doublons disparaissent (comme Sémantique, sémantique et semantique qui sont habituellement considérés comme trois tags différents).
  • Le référencement est optimisé car l’adresse d’une page d’un tag décrit son contenu et facilite son indexation (par exemple, /category/mots-cles/web-semantique/).

Google is watching your server

Dans son blog Actulligence, Frédéric Martinet nous donne un excellent exemple de la puissance de Google. Son article Trouver des fichiers multimédias avec Google contient une requête permettant de trouver tous les fichiers sonores (MP3 et WMA) contenant le terme nirvana. Résultat fort démonstratif qui peut être appliqué dans un contexte de veille active (par exemple, recherche de documents sensibles ou de copies illicites).

J’aime bien cet exemple parce qu’il exploite un défaut de configuration des serveurs web. En effet, si on effectue une requête sur un dossier qui ne contient pas de page index, le serveur web va (trop souvent) nous en montrer le contenu. C’est le cas pour toutes les pages trouvées par la requête de Frédéric Martinet. « Et alors, quel est le problème ? C’est un site web public ! » Oui, sauf que je connais beaucoup de gens pressés qui placent des contenus privés dans des dossiers publics en se disant : « qui va deviner que je place ce fichier à cet endroit ? »

Google le saura.

Vous me prenez pour un parano, hein ? Alors voici un exemple. WordPress, le moteur de blog que j’utilise, place tous les fichiers que je lui envoie, dans le dossier wp-content/uploads/. Celui-ci n’étant pas interdit d’accès (configuration par défaut de la majorité des serveurs mutualisés), on peut obtenir la liste de tous les médias de mon blog. A priori, ce sont les médias qui illustrent mes articles, donc pas de soucis. Et pourtant, il y en a un énorme : les fichiers des articles privés ou en cours de rédaction sont visibles par n’importe qui ! Si vous placez des rapports, documents, images et autres fichiers rien que pour vous ou vos proches, tout le monde en profitera, sachez-le !

On peut appeler ça une faille de sécurité, non ? Et comme je suis très joueur, un fichier appartenant à un article privé est placé dans mes médias. Je donne 72h à Google pour le trouver. Vous pouvez essayer aussi.

Mise à jour : Je suis parano ! Google n’a pas trouvé mon fichier. Son robot d’indexation est pourtant passé à plusieurs reprises, sans prendre en compte le dossier wp-content/uploads/. Vu le nombre de blogs tournant sous WordPress, Google a peut-être pris l’initiative de ne jamais indexer ce dossier-là. Par contre, d’autres « visiteurs » moins sympathiques m’obligent à protéger mon dossier wp-content/ : visiblement la liste de extensions installées (wp-content/plugins/) semblaient beaucoup leur plaire… La récréation est finie !

Et vous ? Avez-vous constaté des comportements étranges ou des attaques directes sur votre blog ? Comment le protégez-vous ?

Un pirate prend la main sur la dernière version de WordPress

Rares sont les applications exemptes de failles de sécurité. On s’habitue aux bulletins de sécurité qui nous invitent à les mettre à jour dans les meilleurs délais, ce que nous ne faisons pas forcément toute affaire cessante…

Sauf que là, l’affaire est grave. Un pirate a réussi à pénétrer un des serveurs de WordPress pour modifier le pack d’installation de sa dernière version (v. 2.1.1). Tous les blogs qui utilisent cette version sont donc menacés.

La mise à jour vers la version 2.1.2 est donc à faire au plus vite !