“L’audience relative” des blogs et des médias en ligne : une expérience statistique

17 mai 2008

Une réflexion sur les notions d’audience et d’influence, totalement expérimentale, que je vous livre.

La notion d’audience dans la presse écrite est relative : quand on dit que le journal Le Monde, par exemple, a une diffusion de 360 000 exemplaires, ou une audience de 2 millions, cela ne signifie pas que 360 000 personnes, ou 2 millions, lisent tous les articles tous les jours.

Les lecteurs font leur shopping, et le principe est que plus il y a de choses à lire, plus il y a de chances pour que la quantité d’information que l’on consomme par rapport à la quantité d’information proposée soit faible.

On peut donc imaginer un indice “d’audience relative” : un indicateur d’audience (diffusion, audience) ramené à la quantité éditoriale produite. Si le Monde produit 100 articles par édition, on a une audience de 2 millions pour 100 articles, soit un indice d’audience relative de de 20 000.

En soi, cela ne veut évidemment pas dire que chaque article du Monde est lu 20 000 fois, mais cela peut permettre d’effectuer des comparaisons entre des médias qui produisent beaucoup et des médias qui produisent peu.

Et ne serait-ce pas un indice, finalement, d’influence ? Ou un indice “d’écoute” ou “d’attention” du lectorat ? (car l’influence, c’est aussi se faire écouter…)

L’influence n’est pas l’audience, mais l’audience est un élément d’influence. On peut écrire peu, mais avoir un public relativement nombreux, fidèle, intéressé, à l’écoute : on sera plutôt influent. On peut écrire de façon stakhanoviste et générer une audience globale importante, mais chaque article sera lu peu de fois, et on sera plutôt pas très influent…

(NDR : ceux qui me connaissent savent à quel point je suis méfiant avec la notion d’influence. Voir ici par exemple. Je privilégie l’analyse qualitative de l’influence, mais sa quantification m’intéresse.)

Si on applique ce raisonnement au web, on peut effectuer des comparaisons entre blogs et sites médias en ligne. Les blogs n’ont en général pas des audiences comparables à celles des sites médias, mais ils écrivent beaucoup moins. Il serait donc très intéressant de pouvoir comparer l’audience relative des blogs et l’audience relative des médias en ligne…

Comment faire ? A partir de là, il faut faire des hypothèses et des choix :

- il faut d’abord récupérer des données d’audience pour les sites et les blogs. On sait que ça n’existe pas. Mais nous faut-il des données d’audience complètes ? Non car après tout, les données d’audience vont être ramenées par rapport à une quantité de production éditoriale et donc ne voudront rien dire en valeur absolue. Le tout est de pouvoir comparer des données, même partielles, pour tous les sites et blogs étudiés.

- C’est exactement ce que Google Reader fournit. En utilisant la fonction “ajouter un abonnement” dans Google Reader, apparaît le nombre d’abonnés au flux RSS en question. Il ne s’agit que des abonnés aux flux via Google Reader, cela ne donne donc qu’une idée très partielle de l’audience d’un site : il manque les abonnés Netvibes ou Bloglines, le trafic direct, le trafic via les moteurs de recherche, le trafic entrant via des clics sur des liens naturels ou publicitaires, etc. Mais encore une fois, on s’en fiche, puisqu’il s’agit juste de comparer des sites entre eux.

- Il manque alors un moyen d’estimer la quantité éditoriale produite par un site. Et là, magie de Google Reader, la même recherche sur “ajouter un abonnement” fait également apparaître le nombre de “publications par semaine”. Sur quelle durée ? Mystère, mais au moins dispose-t-on d’un chiffre.

Ainsi, Internet et Opinion (par exemple), a 36 abonnés Google Reader et publierait en moyenne 4.2 fois par semaine.

A partir de là, on peut s’amuser : comparer le nombre d’abonnés Google Reader entre blogs, entre médias, entre médias et blogs, voir quels médias et quels blogs postent le plus et le moins, etc.

Par exemple, quand on regarde les chiffres à partir des blogs du top 100 du classement Wikio, on voit que le n°16, Biologeek, n’a que 36 abonnés Google Reader. Juste au-dessus, le n°15, Standblog, en a… 2777. Par contre, le même Biologeek n’écrit que 1,6 fois par semaine, ce qui relativise son faible nombre d’abonnés. Le blog de Jean-Marc Morandini compte 841 abonnés… mais publie 183,4 fois par semaine, ce qui relativise son audience. Fred Cavazza, lui, publie 7.5 fois par semaine. Le Monde.fr compte plus de 500 000 abonnés RSS mais publie… 700 fois par semaine. Le blog qui a le plus grand nombre d’abonnés est TechCrunch (21 000), ce qui est autant que Rue89 ; etc.

Pour info, top 10 des blogs par nombre d’abonnés :

1 Techcrunch 21 430
2 KozToujours 18 040
3 Diner’s room 17 844
4 Presse Citron 3 629
5 Journal du geek 2 932
6 Standblog 2 777
7 Zorgloob 2 290
8 Fubiz 2 251
9 Fred Cavazza 1 659
10 Accessoweb2.0 1 489

Top 10 des médias en ligne (étudiés) par nombre d’abonnés au fil de une (seulement le fil de une, sinon je n’ai jamais le temps de faire cet article ;-) ) :

1 L’Equipe 733 194
2 Le Monde 536 681
3 Nouvelobs 141 689
4 Libération 128 491
5 01 Net 97 317
6 Les Inrocks 90 717
7 Clubic 88 070
8 Pcinpact 70 937
9 LCI 38 588
10 Rue89 21 136

Les 10 blogs (étudiés) qui publient le plus (billets par semaine) :

1 Gizmodo 209,1
2 Morandini 183,4
3 Beta politique 107,3
4 Chauffeur de buzz 84
5 TV News 82,4
6 Le blog auto 80,3
7 Journal du geek 74,4
8 The inquirer 58,6
9 Pingoo 55,3
10 GuiM 52,5

Les 10 médias (étudiés) qui publient le plus (par semaine) :

1 Le Figaro 861,2
2 Le Monde 716,6
3 L’Equipe 573,8
4 LCI 561,4
5 LePost 540,6
6 L’Express 513,1
7 Le Parisien 466,7
8 Métro 461,8
9 20 minutes 440,3
10 Nouvelobs 340,7

Bref, à partir de là je me suis amusé (tout à fait, cela m’amuse énormément) à relever le nombre d’abonnés et la fréquence de publication pour :

- les blogs du top 100 de Wikio

- une bonne trentaine de médias en ligne (les plus hauts dans les classements Nielsen et Médiamétrie ; les plus cités par la blogosphère ; les sites média de quelques “grands médias” traditionnels, des pure players emblématiques, etc.)

Un magnifique fichier excel, une formule de calcul, et hop, on a, pour environ 130 blogs et médias en ligne, un “indice d’audience relative”. Qui ne signifie rien en soi mais permet des comparaisons, donc de faire un classement.

Les médias en ligne dominent-ils les blogs ? Voilà ce que ça donne (désolé pour la mise en page, c’est un copié-collé du fichier excel), avec les médias professionnels en gras :

1 KozToujours 3537,3
2 Diner’s room 2317,4
3 01 Net 2306,1
4 Les Inrocks 1727,9
5 L’Equipe 1277,8
6 Le Monde 748,9
7 Clubic 727,3

8 Techcrunch 695,8
9 Pcinpact 562,1
10 Standblog 514,3
11 Nouvelobs 415,9
12 Rue89 408,0
13 Libération 403,7
14 Fubiz 331,0
15 Zorgloob 289,9
16 Doctissimo 283,5
17 Transnets 249,8
18 Révolution web 2.0 en live ! 236,9
19 Fred Cavazza 221,2
20 Technologies du langage 163,3
21 Netvibes.com blog 155,0
22 Agoravox 139,4
23 Presse Citron 122,6
24 Le blog d’abondance 105,5
25 L’internaute 93,5
26 Arrêt sur images 93,2

27 2803 by Henri Labarre 87,2
28 Journal d’un avocat 84,9
29 Emob 81,7
30 Fran6art 74,5
31 Jean-Michel Billaut 69,4
32 LCI 68,7
33 Blogeee.net 65,5
34 Bienbienbien 63,9
35 Intruders TV 63,1
36 Les Echos 58,5
37 Beau à la louche 55,4
38 La République des Livres 49,1
39 Accessoweb2.0 49,1
40 Le journal du net 44,9
41 Trends Now 43,4
42 Papygeek 42,9
43 Futura Sciences 39,5
44 Journal du geek 39,4
45 Jacques Froissant 38,2
46 Iphon 38,0
47 Mashable 37,6
48 WordPress Francophone 36,7
49 Bakchich 35,9
50 Génération NT 35,8
51 Kelblog 34,6
52 Jarodxxx 33,3
53 Mais pourquoi est-ce que je vous raconte ça 33,0
54 Coulisses de Bruxelles 32,2
55 Bleebot blog 31,7
56 Versac 30,1
57 Vinvin entertainment 29,6
58 Le monde du blog 28,5
59 Gonzague Dambricourt 28,3
60 Kick and blog 26,9
61 Embruns 26,9
62 Tapahont 26,5
63 Neteco 25,9
64 Marianne2 25,5
65 3 couleurs 25,0
66 Affordance 23,2
67 Biologeek 22,5
68 Plume de presse 22,4
69 Le Figaro 22,2
70 L’Express 21,8
71 France Football 21,2
72 Contre Journal 20,7
73 Ecrans 20,0
74 L’observatoire des médias 18,6
75 MrBoo.fr 17,6
76 ZDNet 16,3
77 La vie des idées 16,0
78 Veille2com 15,6
79 Cuisine plurielle 15,4
80 Webilus 14,8
81 Actualités de la Recherche en Histoire Visuelle 14,7
82 Adscriptor 14,7
83 Et si c’était bon 14,7
84 Benoît Descary 12,8
85 La Tribune 12,3
86 De source sûre 11,5
87 Loïc Le Meur 11,2
88 Bagatelles 10,8
89 Wikio blog 10,4
90 Papilles et pupilles 10,1
91 Le tiers livre 10,1
92 Le blog auto 9,9
93 Chauffeur de buzz 9,8
94 NTIC 8,7
95 Nowhere else 2.0 8,6
96 Ma vie en Narcisse 8,4
97 Eryn et sa folle cuisine 8,1
98 Choses vues 7,9
99 Chez Clarabel 7,7
100 Crise dans les médias 7,7
101 Ligne et papilles 7,5
102 Contre info 7,4
103 GuiM 7,1
104 Korben 6,3
105 20 minutes 5,1
106 Morandini 4,6
107 Le Point 4,5
108 L’Expansion 4,3
109 Intox2007 4,2
110 Psychologies 4,2
111 Le Parisien 3,5
112 Bozarblog 3,3
113 Pingoo 3,1
114 France2 3,1
115 TV News 2,3
116 Gizmodo 2,0
117 The inquirer 1,9
118 Le vinZ de blog 1,8
119 Partageons mon avis 1,7
120 Beta politique 1,4
121 Marc Vasseur 1,4
122 Peuples.net 1,2
123 Bizet’s blog 1,1
124 Caledosphere 1,0
125 Sarkofrance 1,0
126 Homo Sapiens Internetus 0,7
127 iSubway 0,7
128 MesOpinions.com 0,6
129 LePost 0,6
130 Métro 0,4
131 Investir 0,1
132 Challenges 0,1

Des résultats très très étonnants à mon sens :

- dans le classement très mélangé entre blogs et médias en ligne. Beaucoup de médias en ligne sont assez haut dans le classement ce qui est finalement rassurant pour eux… mais beaucoup sont aussi très, très bas dans le classement…

- dans les chiffres qui montrent des disparités énormes. Pour prendre des concurrents directs, le Figaro a 22 quand le Monde a 748…

- Classement assez moyen de beaucoup de blogueurs “historiques”…

Que faut-il en penser ? Mon ami Koz, 88ème du classement Wikio, est-il en réalité le site le plus influent du web français ? Ne nous emballons pas, il y a de nombreux et sérieux problèmes :

- Fiabilité des données Google Reader ? Il y a forcément un problème, justement, avec Koz : Google Reader indique 18 000 abonnés. Pourquoi pas. mais le Feedburner de Koz mesure 18600 abonnés au total. Or il est rigoureusement impossible qu’il n’y ait pas au moins 3 abonnés Netvibes pour un abonné Google Reader, étant donné l’utilisation faite de ces deux services en France. Google Reader ne peut pas réaliser 97% des abonnements de Koz. Il peut y avoir le même problème pour le deuxième du classement, Diner’s Room.

- Le nombre d’abonnés est biaisé pour les sites proposés par défaut par Google Reader, comme, je crois… TechCrunch

- Quand il y a plusieurs flux pour un même site, faut-il additionner les abonnés à chaque flux, y compris quand le flux est un flux Feedburner ? C’est ce que j’ai fait pour les blogs. Pour les médias en ligne, je me suis arrêté au flux principal, celui des dernières infos, qui est en général le plus important.

- Sur-représentation des sites dans les thématiques High-tech et Internet, dont les lecteurs sont plus facilement utilisateurs de flux RSS

- Enfin un classement thématique serait plus juste : on mélange des torchons et des serviettes. Il faudrait faire le même exercice pour sites et blogs high-tech ; sites et blogs actu générale ; etc.

Quelle est votre analyse ? Voyez-vous des moyens d’améliorer cette méthodologie ?

De mon côté, je ne prends rien de tout ça au pied de la lettre, mais les résultats me semblent intéressants. Je ne sais pas si les explications méthodologiques sont très claires mais la pédagogie de l’évaluation et des chiffres est difficile. Il me semble que la signification d’un indicateur d’audience relative est à chercher du côté de l’influence. Même si l’influence, quand on veut la quantifier, est aussi une affaire :

- d’audience absolue (si, quand même)

- de reconnaissance (le lien entrant étant le signe de reconnaissance sur le web, d’où les méthodes basées sur cette notion : PageRank, Autorité, classement Wikio…)

Sans compter ce qu’on ne peut pas quantifier (l’influence dépend des circonstances, du hasard, des sujets abordés, etc.)

Là où je suis assez sûr de moi, c’est qu’il y a une piste à creuser dans l’analyse de l’audience relative pour mesurer les rapports de force entre médias et blogs.


Le classement Wikio : opaque mais pas mal

11 mars 2008

Pour faire suite au zapping d’Emmanuel hier, quelques commentaires autour du débat sur la pertinence des classements chez Embruns (non on n’est pas si flemmards que ça…).

Laurent Gloaguen constate une absence de corrélation entre le classement Wikio et l’autorité Technorati. Rappel de leurs méthodes respectives :

- l’autorité Technorati est le nombre de “référents”, c’est à dire le nombre de blogs différents ayant linké vers votre site / blog au cours des 6 derniers mois. (et pour être très précis, le nombre de référents identifiés par Technorati, qui est malheureusement loin de trouver tous les résultats)

- Wikio fournit un classement des blogs qui s’appuie non juste sur le nombre de liens mais sur la valeur des liens reçus au cours des 4 derniers mois (mieux un blog est classé, plus les liens externes qu’il propose comptent - contrairement à Technorati)

J’avoue nourrir des sentiments ambivalents vis-à-vis du classement Wikio. Le manque de transparence de ce classement est largement critiqué dans les commentaires : l’algorithme n’est pas connu, seul le résultat est publié. C’est un peu comme le guide Michelin : voilà la note, mais on ne vous dira pas comment on l’a calculée.

Il est d’ailleurs assez malvenu de la part de Pierre Chappaz de se moquer de Technorati dans les commentaires alors qu’il ne donne pas d’élément d’explication à une très grosse invraisemblance du classement (la présence du blog d’Olivier Duprez en 17ème position).

Néanmoins.

Sur la démarche, l’idée de pondérer les liens en accordant plus de poids à ceux qui proviennent des sites les plus reconnus est l’exemple à suivre. D’une certaine façon, heureusement que l’on ne constate pas de corrélation stricte entre Wikio et Technorati, cela peut signifier qu’il y a une véritable pertinence à mesurer la valeur des liens et non seulement leur nombre. C’est d’ailleurs l’idée centrale du PageRank de Google (pas plus transparent, du reste, que le classement Wikio).

Et comme le fait remarquer l’un des commentateurs d’Embruns, à propos de l’algorithme presque aussi mystérieux que la formule du Coca-Cola, LOmiG, “(si) ils l’affichent en toute transparence, ils sont sûrs que 2 semaines plus tard des petits malins auront trouvés un moyen de le contourner pour arriver en tête.” L’opacité se défend. D’autant plus que le résultat, le classement Wikio, me semble objectivement se défendre plutôt pas trop mal.

Aucun outil de mesure n’est parfait mais à mon sens le classement Wikio (au-delà de son côté machine à flatter les égos des blogueurs, c’est un côté horripilant mais après tout on fait ce qu’on veut de ce classement) est une bonne introduction à la blogosphère la plus “visible” (je ne dis pas influente). Une sorte d’annuaire hiérarchisé.

Il ne résout pas d’autres questions comme celle de la comparaison de l’influence entre médias online et blogs, mais me semble globalement pertinent pour la seule blogosphère.

Certes, la méthode de mesure par les liens a ses limites, comme le dit Grégory Pouy : “C’est un critère intéressant mais clairement pas suffisant car les dés sont pipés par le simple fait que les blogueurs “influents” se connaissent entre eux, qu’ils sont invités à des opérations par les agences, que cela renforce leurs liens et qu’ils se linkent d’autant plus”.

C’est juste et cela induit une sur-représentation des “buzzers” dans le classement Wikio, mais à choisir entre différentes méthodos d’évaluation (l’audience, sur laquelle je m’étais étendu ici, les liens, l’évaluation quali…), je choisis l’évaluation par les liens et plus précisément par la valeur des liens, comme pour Wikio. Car il ne faut pas perdre de vue l’idée centrale qui fonde cette méthodo : sur Internet, la reconnaissance, c’est le lien hypertexte. L’évaluation par les liens est donc l’évaluation de la reconnaissance.

Après, la méthodo parfaite n’existe pas, ou n’est pas gratuite ;-), et repose certainement sur le croisement de plusieurs indicateurs.

Le problème de Wikio, c’est à mon avis plutôt les catégories : si l’on prend le cas d’Internet et Opinion, nous sommes classés un mois sur deux dans “High-Tech”, un mois sur deux dans “Divers”. Il faut cesser de mettre tout ce qui parle d’Internet dans la catégorie “High-Tech”, cela n’a pas de sens de mélanger des blogs sur les gadgets ou l’informatique avec des blogs sur le web 2.0.

De plus, en ce qui nous concerne il serait bien plus pertinent de créer une grande catégorie “marketing et communication” qui inclurait les blogs actuellement classés dans marketing, les blogs de com comme nous ou PR2Peer, et les blogs de SEO comme celui de Sébastien Billard. La pub, les RP, le marketing en ligne, le référencement font tous partie d’une grande discipline marketing et com. De ce point de vue il faut à mon sens aller regarder du côté du classement Power 150 d’Avertising Age dont on a parlé plusieurs fois ici.


Internet : le 4ème média en France par la pub

13 février 2008

Edit 14/2: aemm, je lis ceci et je me dis qu’en fait on n’est pas près d’y voir clair.

Chiffres de la publicité en ligne, suite… et sans vouloir verser dans l’obsession après mes précédents billets (1 et 2) sur le sujet. On le sait maintenant très officiel depuis hier et grâce à l’étude annuelle de TNS Media Intelligence pour le Syndicat des Régies Internet et l’IAB : Internet est le quatrième média en France. Il vient donc de dépasser l’affichage et s’approche de la radio.

pub web

Chiffres-clé à retenir :

- le pub sur Internet représente 2.8 milliards d’euros d’investissement (reste à savoir dans quelle mesure l’adage “je fous en l’air la moitié de mon budget marketing, le seul problème est que je ne sais pas laquelle” est vrai sur le web :-)),

- réalise + 34,5% sur un an,

- et représente 12% du marché publicitaire (9.5% il y a un an)

PDF de la présentation de TNS Media Intelligence avec beaucoup d’infos sectorielles à télécharger en cliquant ici.

On voit donc à ce jour une progression assez linéaire, mais les prochains mois et années peuvent connaître d’importantes modifications :

- avec la manne attendue de la fin de la pub sur France Télévisions. Lire le Journal du Net à ce sujet : Internet et le “hors média” se partageraient entre 120 et 270 millions d’euros ; en faisant une hypothèse basse où Internet représente 50% de “Internet et le hors média”, on peut estimer que le web pourrait récupérer 60 à 150 millions d’euros. Cela pourrait représenter environ 5% de croissance additionnelle.

- avec le ralentissement voire la récession économique. Ici, les avis divergent comme le montre bien cet article de The Economist.

D’abord il faut se demander dans quelles proportions la pub en général serait touchée (les analyses du marché publicitaires 2008 vont de +5% à -5%…), ensuite savoir comment résisterait le média Internet.

Pour certains, Internet résistera mieux car il faut encore combler le fossé entre l’usage du web et la publicité sur le web (les gens y consacrent proportionnellement plus de temps que les annonceurs n’y consacrent de budgets). Et parce que le web apporte la transparence du retour sur investissement en rendant les choses beaucoup plus mesurables, donc justifiables pour celui qui investit. Enfin parce que la télé serait l’arme de l’image de marque à long terme et le web l’arme de vente à court terme.

A l’inverse, on peut estimer que si la démonstration de ROI n’est pas convaincante, les annonceurs peuvent se détourner du web pour se rassurer et jouer la grosse visibilité avec la TV. Et l’annonceur peut se souvenir que l’internaute fuit la pub, se déclare publiphobe et s’inquiète de l’utilisation de ses données personnelles… autant de facteurs qui peuvent le faire douter de ce ROI (lire à ce sujet la tribune d’Esther Dyson dans le WSJ). [Edit 14/2, mentionnons également la remise en cause de méthodes d'évaluation sur Internet, merci Samuel]

Pas simple tout ça. En tout cas 2008 semble être une année charnière pour la publicité en ligne. Sans oublier le meilleur moyen d’investir : les PR online :-)


Echange dix marketeurs “on-line” contre un Duncan Watts

4 février 2008

La puce m’est venue à l’oreille grâce à Fred Cavazza. L’article de Fast Company, “Is the Tipping Point Toast ?”, est une enquête autour des travaux de Duncan Watts - auteur de Six Degrees et sûrement un des meilleurs spécialistes des questions de réseaux et de la viralité sur la toile.

Outre une présentation et une discussion de ses travaux universitaires et de ses développements chez Yahoo!, Duncan Watts se lâche sur les marketers on line et ces évangélistes qui chantent les louanges des nouveaux prophètes, les e-influenceurs.

Investir dans la viralité, en faire un objectif premier de sa communication c’est se planter, martèle Watts tout au long de l’article. Et ceci, pour deux raisons principales :

  1. les e-influenceurs n’influencent pas toujours. Il existe des leaders d’opinion. Cela ne fait aucun doute. Affirmer le contraire est grossier et stupide. Mais croire qu’ils influencent urbi et orbi l’est encore plus. Le leadership d’opinion ne signifie pas l’influence. D’autre part, les solutions du type panel d’influenceurs sont contredites par les études de marketing depuis 50 ans (on est très rarement leader sur plus de 5 types de produits/secteurs d’activité). Dès lors, est-il raisonnable d’investir dans une campagne de viralité dont on ne contrôle pas grand chose ?
  2. le monde social est trop complexe. Duncan Watts qualifie d’anarchiques les réseaux sociaux. Impossible selon lui d’avoir un modèle de viralité et de dissémination de l’information. Dès lors, est-il raisonnable d’investir dans une campagne dont on est sûr de ne rien contrôler ?

Voilà pour le résumé maladroit de ses propos (bien plus riches dans l’article : je vous laisse découvrir le mix marketing proposé par Duncan Watts, somme toute très classique). Je me permets de rajouter quelques remarques en vrac :

  • même si on influence en ligne, on n’influence pas forcément off line. Cette articulation on/off line est un angle mort des recherches sur le sujet.
  • les marketeux français semblent avoir la tête tournée vers les US. Les exemples que j’entends ou lis sont des exemples outre-atlantique. Or, quand on connaît les différences culturelles sur ce genre de questions (cf. la sociabilité alimentaire par exemple), les résultats ou les transpositions de conclusions anglo-saxonnes sont à prendre avec beaucoup de pincettes. Les marketeurs et stratèges français sont assez myopes sur les propres caractéristiques de leur public, les Français.

Enfin, n’hésitez pas à lire les commentaires chez Cavazza qui sont aussi très instructifs. Certains y retrouveront une mélodie bien connue ici et fredonnée par notre ténor en titre, François Guillot.


Advertising Age change la méthodo du classement des blogs Power 150

8 janvier 2008

power 150

Dans la série “réflexions sur l’évaluation de l’influence en ligne” (ce que Joïakim appelle le Graal)…

… Nous avions parlé au mois d’août du classement Power 150 d’AdAge, un classement des blogs médias et marketing dont l’originalité était de croiser plusieurs critères :

- des critères de reconnaissance essentiellement basés sur les liens entrants (PageRank et Technorati)

- un critère d’audience (nombre d’abonnés Bloglines)

- et l’originalité de ce classement imaginé par Todd Andrlik : une note subjective de qualité du blog qui représentait 20% de la note totale

Le constat que nous faisions : la mixité des critères produisait un résultat intéressant ; le rôle du PageRank était extrêmement relatif ; l’utilisation d’un critère qualitatif était une bonne nouvelle.

Nous étions donc contents mais voilà-t-y-pas que nous sommes en 2008 et que Todd Andrlik et AdAge se sont entre-temps amusés à modifier la méthodo pour la complexifier. J’ai cherché des explications, mais celles que j’ai trouvée n’en sont pas vraiment (si ce n’est que Todd Andrlik utilise le feedback de ses lecteurs).

Quels changements constate-t-on?

- on est passé de 4 à 8 critères (et d’une note sur 75 à une note sur 150)

- le PageRank est utilisé de façon plus relative que jamais : il représente un total de 10 points sur 150 au lieu de 10 points sur 75. Donc presque rien. Voilà qui va dans le sens de ceux qui comme Olivier Andrieu disent que le PageRank “public” ne signifie plus grand-chose

- le quanti reprend le dessus sur le quali, et c’est dommage. Tous les critères qui ont été ajoutés sont quanti et la note “subjective” attribuée par Todd Andrlik ne représente que 15 points sur 150 au lieu de 15 sur 75.

- le vainqueur de cette opération est Technorati, dont 3 indicateurs sont utilisés et qui fournissent 70 points sur 150 : le “ranking” du blog étudié, son “autorité” (nombre de blogs différents ayant mis un lien vers le blog étudié) et les “InLinks”, c’est à dire le nombre de liens entrants. Si vous voulez y voir clair, on prend l’exemple du premier du classement Power 150, le blog de Seth Godin : à cet instant d’après Technorati son ranking est 15, son autorité est 9079, son nombre de liens est 39 484.

- la notion d’audience est désormais utilisée avec deux critères : le score Alexa (sur 15), qui vient d’être ajouté, et le nombre d’abonnés via Bloglines (sur 10).

- davantage de points pour les calculs basés sur les liens entrants : le classement ajoute désormais les liens Yahoo!, et donc les 3 critères issus de Technorati (ainsi que d’une certaine manière, le PageRank).

Résumons :

- la note quali passe de 20% à 10% de la note finale

- les indices d’audience passent de 27% à 17% de la note finale

- les indices basés sur les liens passent de 53% à 73% de la note finale.

Le classement, que l’on peut voir ici, me semble donc basé sur une méthodo moins équilibrée que l’ancienne. Cela n’empêche pas Seth Godin de rester en première place, mais je vois dans le haut du classement beaucoup de blogs sur le SEO (référencement), ce qui n’était pas le cas dans l’ancienne version. La mesure par les liens mérite-t-elle de produire les 3/4 de la “valeur” d’un blog ? Je m’interroge.

Quoiqu’il en soit, ce classement conserve sa valeur première : être un annuaire de sources sur les médias, le marketing et la communication en général.

Sur le même sujet : “Du rôle de la notion d’audience dans l’évaluation de “l’influence” sur le web


Du rôle de la notion d’audience dans l’évaluation de « l’influence » sur le web

22 octobre 2007

« Ce site / blog / média en ligne est-il influent ? ». C’est une des questions les plus courantes, j’allais dire tarte à la crème, dans les RP online. Que la couverture soit voulue ou subie, favorable ou défavorable, analytique ou irréfléchie, morale ou factuelle, étayée ou superflue, chaque fois qu’on parle de vous la question se pose et le rôle du conseil est de donner les clés de décryptage de « l’influence » ou de « l’importance » d’une couverture donnée sur un site donné.

Cette analyse d’influence repose à la fois sur la couverture elle-même (importance du sujet abordé aux yeux du client, nature et crédibilité des arguments, etc.) et sur le lieu où ce billet est déposé. D’où la question ci-dessus : « ce site est-il influent ou pas » ?

Sans vouloir entrer dans le détail de ce qu’on appelle l’influence sur le web (d’ailleurs personnellement je ne suis pas à l’aise avec l’usage permanent qui est fait de ce terme), on distingue trois niveaux d’analyse - complémentaires et imbriqués - pour apporter une réponse :

1. les indicateurs de reconnaissance dont le site / blog bénéficie (par exemple, la notion d’autorité basée sur les liens entrants Technorati, le PageRank Google, etc.)

2. les indicateurs de qualité du site (richesse / fréquence de la ligne éditoriale, commentaires, graphisme, etc.) qui sont analysés par l’oeil humain.

3. les indicateurs d’audience (c’est quand même bien de savoir combien de gens passent sur ces pages)

Toutes ces méthodes apportent quelque chose. Aucune de ces méthodes n’est satisfaisante. On en avait déjà parlé sur ces pages (d’ailleurs, ça me ferait plaisir si vous cliquiez ici pour aller relire notre papier d’analyse sur la méthodo du classement des blogs média et marketing d’Advertising Age).

Et on en a eu une nouvelle preuve récemment sur le troisième critère que je cite ici et qui est celui sur lequel nous allons nous attarder : l’audience.

Mais revenons un instant sur la notion d’audience en RP.

Si l’audience est le Graal en publicité, elle n’en est pas moins une notion majeure dans l’évaluation RP traditionnelle. Evaluation RP traditionnelle qui, si elle est compliquée et délicate, peut au moins s’appuyer sur des données de diffusion certifiées pour la majorité des titres de presse professionnelle : merci l’OJD.

Pas d’OJD de système de mesure généralisé de l’audience sur le web. Ou si peu. La notion d’audience des sites et des blogs en particulier est aussi mystérieuse que l’affaire des disparues de la gare de Perpignan (je regarde beaucoup Faites entrer l’accusé). Alors, des mesures d’audience, on en a : Médiamétrie, OJD Internet, Nielsen Netratings, Comscore… mais on parle de mesures – pas forcément publiques - qui concernent un nombre limité de sites à forte audience (il faut un minimum de 30 000 visiteurs uniques pour entrer dans Médiamétrie).

« Un nombre limité de références à forte popularité »… ça ne vous dit rien ? Bon sang mais c’est bien sûr : on est dans le haut de la longue traîne médiatique. La longue traîne médiatique, on en a déjà parlé sur ces pages : c’est l’idée, forcément schématique, qu’Internet, en facilitant la possibilité pour chacun de créer son propre média, donne (ou renforce, c’est selon) au paysage des médias une forme de longue traîne :

- des références en nombre limité qui ont de fortes audiences d’un côté (les médias « professionnels »)

- des références en très grand nombre avec des audiences de niche de l’autre, qui tendent vers zéro (les médias « personnels »).

(By the way rappelons que LiveJournal, un des services de blogs les plus populaires aux Etats-Unis, a indiqué que l’audience MOYENNE de ses 12.5 millions de blogs était de 7 lecteurs. Sept. Si c’est pas de la longue traîne, ça…)

longtail

Donc, puisque la question posée ici c’est : « et comment je fais pour savoir si ce site qui parle de moi est influent ? » et puisque là où je veux en venir, c’est la nécessaire prudence qu’il faut avoir avec la notion d’audience sur le web, on va dire que les méthodes « certifiées » de mesure d’audience, pour le conseil en RP, portent uniquement sur le haut de la longue traîne médiatique (en vert sur le graphe).

Et donc, comment je fais pour le bas de cette longue traîne (en jaune) ? Comment je fais quand, dans 97% des cas, je suis cité sur un blog dont l’audience n’est pas indiquée dans ces panels ?

Tentation : s’appuyer sur les « nombres d’abonnés au flux RSS » souvent (mais pas toujours, loin de là) affichés sur les blogs – vous savez, ces « XXXX readers » Feedburner qui nous disent que TechCrunch a “154 K lecteurs”, que Loïc Le Meur en a 25 279, que GuiM en a 1509 ou que Henri Labarre en a 7420 (on s’était même amusés il y a quelques semaines, sur i&o, à relever le nombre d’abonnés « déclarés » dans le top 50 de Wikio).

154Klecteurs

(TechChrunch compte les abonnés par 1000, comme i&o prochainement d’ailleurs)

Et bien non ou en tout cas : gaffe. La lisibilité des audiences du web « longue traîne » est encore moindre que ce qu’elle n’y paraît. C’est d’ailleurs l’objet de billets récents chez Emmanuel Parody et 2803 (à la suite d’un billet de Mashable U.S). Vous pensiez que le nombre d’abonnés indiqués par certains blogs allaient vous tirer de votre mauvais pas ? Que nenni. Tout porte à penser qu’il faut être extrêmement méfiants vis-à-vis de ces données.

Sans vouloir faire trop technique, on distingue plusieurs problèmes :

- les stats artificiellement gonflées par les moteurs de recherche qui indexent les flux (ça concerne tous les sites)

- les stats artificiellement gonflées par la présence du flux RSS dans un “package promotionnel” d’un service type Google Reader (ex : je m’abonne à Google Reader, on me met d’office un certain nombre de flux RSS en surveillance) : d’où des abonnés qui ne LISENT PAS les flux (ça concerne les gros sites)

- sans parler du décalage entre les stats d’abonnements au flux RSS et les stats “publiques” du site : si l’intégralité du contenu est dispo sur le flux RSS, je n’ai pas de raison de me rendre sur le site

- et (ça c’est moi qui le dis) le problème posé par la gratuité de l’abonnement : contrairement à la presse papier, on s’abonne mais on ne se désabonne jamais (ou si peu).

On peut observer ces décalages comme Henri Labarre l’a fait en jouant avec Google Reader : faire “add suscription” en entrant un bout d’url du blog recherché et voir le résultat (et après ça on préfère admirer son compteur WordPress). Pour ce qui le concerne, Feedburner indique environ deux fois plus de lecteurs via Google Reader… que Google Reader lui-même.

La compréhension de la notion d’audience, en tant que clé de lecture de l’influence, est donc encore plus complexe qu’il n’y paraît sur le web.

MAIS.

Mais est-ce que c’est grave ?

Pas pour les gens de publicité, mais pour les gens de RP, je veux dire.

Réfléchissons un instant : la notion d’audience a surtout du sens quand elle porte sur des sites dont les niveaux d’audience sont élevés (vous allez me dire, c’est quoi un niveau d’audience élevé et là je suis mal parce qu’effectivement je n’en sais rien. Mais vous allez voir où je veux en venir). Et quand les niveaux d’audience sont différenciés d’un média à l’autre.

Exemple : on réfléchissait récemment avec un client au choix d’un média papier à qui proposer une belle info. La réflexion a surtout été conduite autour de la cohérence rédactionnelle / profil du lecteur par rapport à l’info en question / image du support, mais aussi quand même un peu par rapport à l’audience du média. Et là, dans notre « short list », on avait des supports dont la diffusion variait de plus ou moins 100 000 exemplaires.

Les audiences des blogs, elles, ne varient pas de 100 000 lecteurs. C’est justement tout le principe de la longue traîne médiatique décrit plus haut : audiences de niche, peu différenciées.

Donc est-ce qu’on a besoin de connaître exactement ces audiences, puisque les blogs sont par définition et dans l’ensemble sur de “petites” audiences ? C’est ici qu’il nous faut rappeler que la réflexion « traditionnelle » de stratégie de communication fonctionne différemment sur le web. Elle obéit grosso modo à 3 finalités :

I. on est moins là pour faire de l’audience que pour parler à un public bien qualifié (ce qui est est complètement naturel dans les RP, au passage) – les fameuses « communautés » (qui ne sont d’ailleurs pas vraiment des communautés mais bon), ces relais d’opinion dont les niveaux d’expertise sont, on l’espère en tout cas, assez élevés sur leur sujet. On est dans une logique d’hyperqualification plus que d’audience.

II. on est aussi là pour « rendre un message disponible » : et oui, la navigation sur le web c’est beaucoup de search. L’idée des RP en ligne étant justement d’essaimer un message pour le rendre plus facilement accessible dans l’espace profondément décentralisé qu’est le web (notons à nouveau que cette idée « d’essaimer » est complètement naturelle dans les RP). C’est à dire faire en sorte que celui qui se renseigne puisse trouver son info : on agit alors moins sur de la puissance (audience) que sur de la crédibilité et de la conviction.

III. enfin on bénéficie du retour d’expérience du consommateur, dont les réactions ont souvent beaucoup de choses à apprendre à la marque. Soit une logique bottom-up.

Vous allez donc me dire : tout ce papier pour démolir la notion d’audience.

Mais nooooooooooooon.

On est bien contents, quand on a des audiences connues et fiables. Ca aide bien à la comprendre, cette mystérieuse « influence » sur le web.

Mais (et hop, résumé de l’article) : il y a deux points de relativisation de l’audience quand on fait des RP en ligne (au fait, “RP” c’est à dire : quand on apporte un message à un public).

1. la finalité de ces stratégies porte moins sur l’audience (la masse) que sur ce que je viens de lister en 3 points (vous remontez les yeux svp sur les I, II et III, je ne vais pas les recopier, je radote assez comme ça)

2. la compréhension de « l’influence » d’un site s’appuie sur la complémentarité de plusieurs critères (et là c’est au début de l’article que l’on remonte et ce sont les chiffres arabes, pas romains), l’audience n’étant que l’un d’eux. Et l’œil humain n’étant pas le moindre.


Rue89 a un PageRank de 3 : WTF ???

12 août 2007

Je viens de remarquer que le PageRank de rue89 est toujours à 3/10, ce qui le place bien heureusement pour lui au-dessus d’Internet et Opinion, mais surtout au niveau de millions de sites médiocres et à un niveau vraiment faible quand on voit la quantité de sites et de blogs de niveaux et d’audiences très variables qui se situent à 5/10.

Loin de moi de faire une fixation sur le PageRank après un billet très orienté sur les méthodes d’évaluation (et qui constatait que la méthodo d’AdAge l’utilisait de manière très relative), mais la lecture du PR au travers du cas rue89 est intéressante.

On dispose en effet d’un certain nombre d’éléments de mesure du succès de rue89 :

- une autorité Technorati qui grimpe vite (5088 liens en ce moment, quand même)

- une audience qui dépasse les espérances de ses fondateurs (379 000 visiteurs uniques en juin, quand même bis) avec un temps passé par utilisateur supérieur à tous ses concurrents (près de 29 mn, quand même ter). Ce qui confirme d’ailleurs des éléments que Pascal Riché avait partagés avec nous lors d’une sympathique visite à l’agence au mois de juin. La tendance est donc très favorable.

Ces données quanti viennent à la fois confirmer des intuitions que nous avons tous : un gros buzz de lancement (je ne pouvais plus faire une réunion sans qu’on me dise “tu connais rue 89 ?”), une notoriété décuplée par quelques scoops sur la censure médiatique (JDD / Cécilia notamment), et maintenant l’intérêt des investisseurs… Mais elles ne se traduisent donc pas dans le PageRank.

Je me souviens avoir regardé le PageRank de rue89 à fin juin : il était déjà à 3/10, et mon interprétation était alors “il va faire un bond à la prochaine Google Dance“. Or cela fait maintenant un mois et demi et il n’a pas bougé.

Je pense que Rue 89 n’a pas besoin de faire une fixation sur son Page Rank pour que tout se passe bien, mais je trouve donc surprenant que le PR ne traduise pas mieux le succès du site.

Il y a peut-être des explications mais je croyais savoir que le PageRank dépend essentiellement des liens entrants. Si à plus de 5000 liens entrants le PageRank ne suit pas, cela signifie au mieux que le PR n’est pas un outil réactif, au pire qu’il débloque.

Bien entendu, le PageRank ne fait pas tout le référencement : il est “croisé” avec la pertinence des mots-clé relatifs au contenu du site. Mais à “pertinence” égale, cela signifie en principe qu’une recherche Google placera d’autres sites mieux pagerankés avant de proposer des liens vers rue89. Par exemple, la recherche “affaire jdd cécilia” place rue89 en 5ème position, et je pense qu’on peut ajouter “seulement”.

Ce petit PageRank pénalise-t-il Rue89 ? Ce n’est pas à moi de le dire, mais je partage une certaine surprise.

Edit 18/8 : le PageRank affiché par Google n’est pas le PageRank utilisé par l’algorithme de Google… Remis à jour tous les 3 mois environ, il est donc loin d’être l’outil fiable que tout le web attend.


Le Figaro se souvient du spot Gerflor mais pas de son impact

10 août 2007

Dans sa série d’été “20 ans de spots télé”, Le Figaro revient ce matin (malheureusement pas en ligne) sur le cultissime spot Gerflor des années 80 (”et hop”) avec le futur Président du Groland Christophe Salengro (à revoir ici). Le papier revient sur le coup de génie de TBWA (“un tour de force du métier : une marque inconnue, un produit ringard, un budget ridicule”) et on a plaisir à revenir sur la genèse du film.

Mais ce qui me frappe sans m’étonner pour autant, c’est l’absence de retour en arrière sur l’impact véritable de cette campagne. Le Figaro indique bien les taux de mémorisation (44% contre 13% en moyenne en TV) et de satisfaction (77% contre 68% en moyenne)… mais on ne saura pas quel impact le spot a eu sur les ventes et la part de marché de Gerflor. Il a peut-être été démentiel, ou pas, mais ce n’est pas ce à quoi on s’attache.

C’est bien sûr dommage, mais n’est-ce pas révélateur d’un travers beaucoup plus général et encore vivant qui est celui de créer pour créer, de communiquer sans évaluer ? Comme dirait Sergio Zyman dans Les Derniers Jours de la Publicité, “L’objectif de la publicité est de vendre plus de choses, à plus de gens, plus souvent, et pour plus d’argent“.

PS : comment ça rien à voir Internet et l’opinion ? Une ligne rédactionnelle est faite pour être transgressée…


Advertising Age classe les blogs media et marketing et ça a l’air plutôt pas mal

7 août 2007

Vu chez Joïakim, le classement “Power 150” des blogs média et marketing (toutes disciplines confondues) en langue anglaise, réalisé par le magazine Advertising Age, qui a été actualisé vendredi dernier et consacre le gourou Seth Godin. (edit : Aziz en avait parlé en janvier, mais ça n’avait pas l’air d’être hébergé par AdAge).

Si on est bien sûr très déçus de ne voir figurer aucun blog en français, l’intérêt est double :

- comme tous les classements, ce travail a le mérite de constituer un bon annuaire de lectures sur les médias et le marketing (dixit Joïakim, un choix vaste, qui change un peu et permet de découvrir des pépites et rien à voir mais en parlant de pépites félicitons-nous de la fin de l’interruption)

- la méthodo qui mixe des critères quanti et quali et apporte du grain à moudre à la question bouillante de l’autorité / influence / importance / etc. sur Internet

Quelques mots sur cette méthodo. Le sacro-saint PageRank de Google (note de 0 à 10 mais qui concentre énormément de blogs autour de 4 et 5 et permet difficilement d’aller au-delà de 7) est bien évidemment utilisé, mais n’est finalement pas un critère très différenciant pour le classement.

D’abord parce sur un total de 75 points possibles, il n’en représente que 10 (le PageRank ne représente donc que 13% de la note potentielle). Ensuite parce que le PageRank (des explications ici) étant un outil assez grossier, il ne permet à un blog de faire la différence que de quelques points sur ses “concurrents”. Si j’ai un PageRank de 7, je ne marque que 3 points de plus qu’un blog qui a un PageRank de 4. 3 points sur les 75 possibles, alors que pour avoir un PageRank de 7, il faut y aller, tandis qu’un PageRank de 4 n’est pas difficile à obtenir.

Exemple : le n° 34, Search Engine Guide, a un page Rank de 7 et se situe 15 places DERRIERE Marketing Profs Daily Fix qui n’a pourtant qu’un PageRank de 4. MPDM fait la différence sur les autres critères.

Le PageRank est donc assez largement démystifié - même si on s’aperçoit, de façon tout de même assez logique, en regardant le haut du classement, que les “gros” sont des blogs à PageRank de 7 (sur les 6 blogs référencés ayant un PR de 7, 5 sont dans le top 10. Vous me suivez ?)

Donc, pour Adverstising Age, le PageRank ne paie pas. Pour s’en convaincre, il suffit de recalculer le classement en ôtant le PR des critères. En faisant rapidement l’exercice sur le top 10, on voit que le seul changement qui interviendrait si le PR n’était plus pris en compte serait l’inversion du n°8 et du n°9… Autrement dit, si le PageRank est là, il ne change pas grand-chose.

Les autres critères qui sont donc surpondérés par rapport au PageRank et davantage déterminants pour le classement sont :

- le nombre d’abonnés, ramené à une note sur 20. On en revient à un critère classique d’audience, pondéré à environ 25% de la note finale. Je me félicite que l’audience pure ne soit pas davantage pondérée : cela montre bien que la logique du classement n’est pas une logique quanti stricte.

- le nombre de liens entrants mesurés par Technorati et ramené à une note sur 30, soit 40% de la note finale. C’est le critère le plus important du classement, non seulement parce que c’est le plus pondéré, mais aussi parce que c’est celui où l’on constate les plus gros différentiels entre les blogs. Par exemple, le n°1, Seth’s blog, a le même nombre de points d’audience que le n°27 (donc une audience a priori similaire), Church of the Customer (j’adore le nom), mais lui met 11 points dans la vue grâce à son technorati (30 points contre 19). Technorati mesurant le liens entrants et les liens étant le signe de reconnaissance sur Internet, cela montre bien que Seth Godin est bien davantage considéré comme référent que Church of the Customer. Malgré les audiences similaires.

- la mesure quali du blog, subjective, effectuée par le cerveau du Power 150, Todd Andrlik et qui tient compte de la fréquence d’actualisation, de la pertinence, de la créativité et de la valeur ajoutée du contenu, ainsi que de l’utilisation de visuels, de vidéos et de son. Cette note sur 15 représente 20% de la note finale.

Bonne nouvelle à mon sens que l’utilisation d’un critère quali à la subjectivité assumée. On pourrait presque regretter qu’il ne représente que 20% de la note finale.

Tout ça pour dire quoi ? La mixité des critères est intéressante : du quali et du quanti, et dans le quanti, de l’audience (un peu) avec Bloglines, de la reconnaissance (beaucoup) avec Technorati et du référencement (pas beaucoup) avec le PageRank. On n’est pas dans du quanti pur et encore moins dans de l’audience pure : deux bonnes raisons de se réjouir.

Je ne suis pas spécialiste de ces blogs et donc infichu de dire si le résultat est parfaitement convaincant. Il ne l’est sûrement pas, on peut discuter sur de nombreux points, mais il permet à des blogs qui seraient exclus sur des critères “traditionnels” d’exister.

Au final, le Power 150 est sans doute une bonne piste pour l’évaluation de “l’influence” (même si je n’aime pas ce terme) dans les métiers de la communication online. A condition de ne pas le prendre non plus trop au pied de la lettre et d’y voir quand même d’abord et avant tout un bel annuaire de blogs.