“L’audience relative” des blogs et des médias en ligne : une expérience statistique
17 mai 2008Une réflexion sur les notions d’audience et d’influence, totalement expérimentale, que je vous livre.
La notion d’audience dans la presse écrite est relative : quand on dit que le journal Le Monde, par exemple, a une diffusion de 360 000 exemplaires, ou une audience de 2 millions, cela ne signifie pas que 360 000 personnes, ou 2 millions, lisent tous les articles tous les jours.
Les lecteurs font leur shopping, et le principe est que plus il y a de choses à lire, plus il y a de chances pour que la quantité d’information que l’on consomme par rapport à la quantité d’information proposée soit faible.
On peut donc imaginer un indice “d’audience relative” : un indicateur d’audience (diffusion, audience) ramené à la quantité éditoriale produite. Si le Monde produit 100 articles par édition, on a une audience de 2 millions pour 100 articles, soit un indice d’audience relative de de 20 000.
En soi, cela ne veut évidemment pas dire que chaque article du Monde est lu 20 000 fois, mais cela peut permettre d’effectuer des comparaisons entre des médias qui produisent beaucoup et des médias qui produisent peu.
Et ne serait-ce pas un indice, finalement, d’influence ? Ou un indice “d’écoute” ou “d’attention” du lectorat ? (car l’influence, c’est aussi se faire écouter…)
L’influence n’est pas l’audience, mais l’audience est un élément d’influence. On peut écrire peu, mais avoir un public relativement nombreux, fidèle, intéressé, à l’écoute : on sera plutôt influent. On peut écrire de façon stakhanoviste et générer une audience globale importante, mais chaque article sera lu peu de fois, et on sera plutôt pas très influent…
(NDR : ceux qui me connaissent savent à quel point je suis méfiant avec la notion d’influence. Voir ici par exemple. Je privilégie l’analyse qualitative de l’influence, mais sa quantification m’intéresse.)
Si on applique ce raisonnement au web, on peut effectuer des comparaisons entre blogs et sites médias en ligne. Les blogs n’ont en général pas des audiences comparables à celles des sites médias, mais ils écrivent beaucoup moins. Il serait donc très intéressant de pouvoir comparer l’audience relative des blogs et l’audience relative des médias en ligne…
Comment faire ? A partir de là, il faut faire des hypothèses et des choix :
- il faut d’abord récupérer des données d’audience pour les sites et les blogs. On sait que ça n’existe pas. Mais nous faut-il des données d’audience complètes ? Non car après tout, les données d’audience vont être ramenées par rapport à une quantité de production éditoriale et donc ne voudront rien dire en valeur absolue. Le tout est de pouvoir comparer des données, même partielles, pour tous les sites et blogs étudiés.
- C’est exactement ce que Google Reader fournit. En utilisant la fonction “ajouter un abonnement” dans Google Reader, apparaît le nombre d’abonnés au flux RSS en question. Il ne s’agit que des abonnés aux flux via Google Reader, cela ne donne donc qu’une idée très partielle de l’audience d’un site : il manque les abonnés Netvibes ou Bloglines, le trafic direct, le trafic via les moteurs de recherche, le trafic entrant via des clics sur des liens naturels ou publicitaires, etc. Mais encore une fois, on s’en fiche, puisqu’il s’agit juste de comparer des sites entre eux.
- Il manque alors un moyen d’estimer la quantité éditoriale produite par un site. Et là, magie de Google Reader, la même recherche sur “ajouter un abonnement” fait également apparaître le nombre de “publications par semaine”. Sur quelle durée ? Mystère, mais au moins dispose-t-on d’un chiffre.
Ainsi, Internet et Opinion (par exemple), a 36 abonnés Google Reader et publierait en moyenne 4.2 fois par semaine.
A partir de là, on peut s’amuser : comparer le nombre d’abonnés Google Reader entre blogs, entre médias, entre médias et blogs, voir quels médias et quels blogs postent le plus et le moins, etc.
Par exemple, quand on regarde les chiffres à partir des blogs du top 100 du classement Wikio, on voit que le n°16, Biologeek, n’a que 36 abonnés Google Reader. Juste au-dessus, le n°15, Standblog, en a… 2777. Par contre, le même Biologeek n’écrit que 1,6 fois par semaine, ce qui relativise son faible nombre d’abonnés. Le blog de Jean-Marc Morandini compte 841 abonnés… mais publie 183,4 fois par semaine, ce qui relativise son audience. Fred Cavazza, lui, publie 7.5 fois par semaine. Le Monde.fr compte plus de 500 000 abonnés RSS mais publie… 700 fois par semaine. Le blog qui a le plus grand nombre d’abonnés est TechCrunch (21 000), ce qui est autant que Rue89 ; etc.
Pour info, top 10 des blogs par nombre d’abonnés :
1 Techcrunch 21 430
2 KozToujours 18 040
3 Diner’s room 17 844
4 Presse Citron 3 629
5 Journal du geek 2 932
6 Standblog 2 777
7 Zorgloob 2 290
8 Fubiz 2 251
9 Fred Cavazza 1 659
10 Accessoweb2.0 1 489
Top 10 des médias en ligne (étudiés) par nombre d’abonnés au fil de une (seulement le fil de une, sinon je n’ai jamais le temps de faire cet article
) :
1 L’Equipe 733 194
2 Le Monde 536 681
3 Nouvelobs 141 689
4 Libération 128 491
5 01 Net 97 317
6 Les Inrocks 90 717
7 Clubic 88 070
8 Pcinpact 70 937
9 LCI 38 588
10 Rue89 21 136
Les 10 blogs (étudiés) qui publient le plus (billets par semaine) :
1 Gizmodo 209,1
2 Morandini 183,4
3 Beta politique 107,3
4 Chauffeur de buzz 84
5 TV News 82,4
6 Le blog auto 80,3
7 Journal du geek 74,4
8 The inquirer 58,6
9 Pingoo 55,3
10 GuiM 52,5
Les 10 médias (étudiés) qui publient le plus (par semaine) :
1 Le Figaro 861,2
2 Le Monde 716,6
3 L’Equipe 573,8
4 LCI 561,4
5 LePost 540,6
6 L’Express 513,1
7 Le Parisien 466,7
8 Métro 461,8
9 20 minutes 440,3
10 Nouvelobs 340,7
Bref, à partir de là je me suis amusé (tout à fait, cela m’amuse énormément) à relever le nombre d’abonnés et la fréquence de publication pour :
- les blogs du top 100 de Wikio
- une bonne trentaine de médias en ligne (les plus hauts dans les classements Nielsen et Médiamétrie ; les plus cités par la blogosphère ; les sites média de quelques “grands médias” traditionnels, des pure players emblématiques, etc.)
Un magnifique fichier excel, une formule de calcul, et hop, on a, pour environ 130 blogs et médias en ligne, un “indice d’audience relative”. Qui ne signifie rien en soi mais permet des comparaisons, donc de faire un classement.
Les médias en ligne dominent-ils les blogs ? Voilà ce que ça donne (désolé pour la mise en page, c’est un copié-collé du fichier excel), avec les médias professionnels en gras :
1 KozToujours 3537,3
2 Diner’s room 2317,4
3 01 Net 2306,1
4 Les Inrocks 1727,9
5 L’Equipe 1277,8
6 Le Monde 748,9
7 Clubic 727,3
8 Techcrunch 695,8
9 Pcinpact 562,1
10 Standblog 514,3
11 Nouvelobs 415,9
12 Rue89 408,0
13 Libération 403,7
14 Fubiz 331,0
15 Zorgloob 289,9
16 Doctissimo 283,5
17 Transnets 249,8
18 Révolution web 2.0 en live ! 236,9
19 Fred Cavazza 221,2
20 Technologies du langage 163,3
21 Netvibes.com blog 155,0
22 Agoravox 139,4
23 Presse Citron 122,6
24 Le blog d’abondance 105,5
25 L’internaute 93,5
26 Arrêt sur images 93,2
27 2803 by Henri Labarre 87,2
28 Journal d’un avocat 84,9
29 Emob 81,7
30 Fran6art 74,5
31 Jean-Michel Billaut 69,4
32 LCI 68,7
33 Blogeee.net 65,5
34 Bienbienbien 63,9
35 Intruders TV 63,1
36 Les Echos 58,5
37 Beau à la louche 55,4
38 La République des Livres 49,1
39 Accessoweb2.0 49,1
40 Le journal du net 44,9
41 Trends Now 43,4
42 Papygeek 42,9
43 Futura Sciences 39,5
44 Journal du geek 39,4
45 Jacques Froissant 38,2
46 Iphon 38,0
47 Mashable 37,6
48 WordPress Francophone 36,7
49 Bakchich 35,9
50 Génération NT 35,8
51 Kelblog 34,6
52 Jarodxxx 33,3
53 Mais pourquoi est-ce que je vous raconte ça 33,0
54 Coulisses de Bruxelles 32,2
55 Bleebot blog 31,7
56 Versac 30,1
57 Vinvin entertainment 29,6
58 Le monde du blog 28,5
59 Gonzague Dambricourt 28,3
60 Kick and blog 26,9
61 Embruns 26,9
62 Tapahont 26,5
63 Neteco 25,9
64 Marianne2 25,5
65 3 couleurs 25,0
66 Affordance 23,2
67 Biologeek 22,5
68 Plume de presse 22,4
69 Le Figaro 22,2
70 L’Express 21,8
71 France Football 21,2
72 Contre Journal 20,7
73 Ecrans 20,0
74 L’observatoire des médias 18,6
75 MrBoo.fr 17,6
76 ZDNet 16,3
77 La vie des idées 16,0
78 Veille2com 15,6
79 Cuisine plurielle 15,4
80 Webilus 14,8
81 Actualités de la Recherche en Histoire Visuelle 14,7
82 Adscriptor 14,7
83 Et si c’était bon 14,7
84 Benoît Descary 12,8
85 La Tribune 12,3
86 De source sûre 11,5
87 Loïc Le Meur 11,2
88 Bagatelles 10,8
89 Wikio blog 10,4
90 Papilles et pupilles 10,1
91 Le tiers livre 10,1
92 Le blog auto 9,9
93 Chauffeur de buzz 9,8
94 NTIC 8,7
95 Nowhere else 2.0 8,6
96 Ma vie en Narcisse 8,4
97 Eryn et sa folle cuisine 8,1
98 Choses vues 7,9
99 Chez Clarabel 7,7
100 Crise dans les médias 7,7
101 Ligne et papilles 7,5
102 Contre info 7,4
103 GuiM 7,1
104 Korben 6,3
105 20 minutes 5,1
106 Morandini 4,6
107 Le Point 4,5
108 L’Expansion 4,3
109 Intox2007 4,2
110 Psychologies 4,2
111 Le Parisien 3,5
112 Bozarblog 3,3
113 Pingoo 3,1
114 France2 3,1
115 TV News 2,3
116 Gizmodo 2,0
117 The inquirer 1,9
118 Le vinZ de blog 1,8
119 Partageons mon avis 1,7
120 Beta politique 1,4
121 Marc Vasseur 1,4
122 Peuples.net 1,2
123 Bizet’s blog 1,1
124 Caledosphere 1,0
125 Sarkofrance 1,0
126 Homo Sapiens Internetus 0,7
127 iSubway 0,7
128 MesOpinions.com 0,6
129 LePost 0,6
130 Métro 0,4
131 Investir 0,1
132 Challenges 0,1
Des résultats très très étonnants à mon sens :
- dans le classement très mélangé entre blogs et médias en ligne. Beaucoup de médias en ligne sont assez haut dans le classement ce qui est finalement rassurant pour eux… mais beaucoup sont aussi très, très bas dans le classement…
- dans les chiffres qui montrent des disparités énormes. Pour prendre des concurrents directs, le Figaro a 22 quand le Monde a 748…
- Classement assez moyen de beaucoup de blogueurs “historiques”…
Que faut-il en penser ? Mon ami Koz, 88ème du classement Wikio, est-il en réalité le site le plus influent du web français ? Ne nous emballons pas, il y a de nombreux et sérieux problèmes :
- Fiabilité des données Google Reader ? Il y a forcément un problème, justement, avec Koz : Google Reader indique 18 000 abonnés. Pourquoi pas. mais le Feedburner de Koz mesure 18600 abonnés au total. Or il est rigoureusement impossible qu’il n’y ait pas au moins 3 abonnés Netvibes pour un abonné Google Reader, étant donné l’utilisation faite de ces deux services en France. Google Reader ne peut pas réaliser 97% des abonnements de Koz. Il peut y avoir le même problème pour le deuxième du classement, Diner’s Room.
- Le nombre d’abonnés est biaisé pour les sites proposés par défaut par Google Reader, comme, je crois… TechCrunch
- Quand il y a plusieurs flux pour un même site, faut-il additionner les abonnés à chaque flux, y compris quand le flux est un flux Feedburner ? C’est ce que j’ai fait pour les blogs. Pour les médias en ligne, je me suis arrêté au flux principal, celui des dernières infos, qui est en général le plus important.
- Sur-représentation des sites dans les thématiques High-tech et Internet, dont les lecteurs sont plus facilement utilisateurs de flux RSS
- Enfin un classement thématique serait plus juste : on mélange des torchons et des serviettes. Il faudrait faire le même exercice pour sites et blogs high-tech ; sites et blogs actu générale ; etc.
Quelle est votre analyse ? Voyez-vous des moyens d’améliorer cette méthodologie ?
De mon côté, je ne prends rien de tout ça au pied de la lettre, mais les résultats me semblent intéressants. Je ne sais pas si les explications méthodologiques sont très claires mais la pédagogie de l’évaluation et des chiffres est difficile. Il me semble que la signification d’un indicateur d’audience relative est à chercher du côté de l’influence. Même si l’influence, quand on veut la quantifier, est aussi une affaire :
- d’audience absolue (si, quand même)
- de reconnaissance (le lien entrant étant le signe de reconnaissance sur le web, d’où les méthodes basées sur cette notion : PageRank, Autorité, classement Wikio…)
Sans compter ce qu’on ne peut pas quantifier (l’influence dépend des circonstances, du hasard, des sujets abordés, etc.)
Là où je suis assez sûr de moi, c’est qu’il y a une piste à creuser dans l’analyse de l’audience relative pour mesurer les rapports de force entre médias et blogs.

Publié par François Guillot


