Archives de Catégorie: Flux RSS

« L’audience relative » des blogs et des médias en ligne : une expérience statistique

Une réflexion sur les notions d’audience et d’influence, totalement expérimentale, que je vous livre.

La notion d’audience dans la presse écrite est relative : quand on dit que le journal Le Monde, par exemple, a une diffusion de 360 000 exemplaires, ou une audience de 2 millions, cela ne signifie pas que 360 000 personnes, ou 2 millions, lisent tous les articles tous les jours.

Les lecteurs font leur shopping, et le principe est que plus il y a de choses à lire, plus il y a de chances pour que la quantité d’information que l’on consomme par rapport à la quantité d’information proposée soit faible.

On peut donc imaginer un indice « d’audience relative » : un indicateur d’audience (diffusion, audience) ramené à la quantité éditoriale produite. Si le Monde produit 100 articles par édition, on a une audience de 2 millions pour 100 articles, soit un indice d’audience relative de de 20 000.

En soi, cela ne veut évidemment pas dire que chaque article du Monde est lu 20 000 fois, mais cela peut permettre d’effectuer des comparaisons entre des médias qui produisent beaucoup et des médias qui produisent peu.

Et ne serait-ce pas un indice, finalement, d’influence ? Ou un indice « d’écoute » ou « d’attention » du lectorat ? (car l’influence, c’est aussi se faire écouter…)

L’influence n’est pas l’audience, mais l’audience est un élément d’influence. On peut écrire peu, mais avoir un public relativement nombreux, fidèle, intéressé, à l’écoute : on sera plutôt influent. On peut écrire de façon stakhanoviste et générer une audience globale importante, mais chaque article sera lu peu de fois, et on sera plutôt pas très influent…

(NDR : ceux qui me connaissent savent à quel point je suis méfiant avec la notion d’influence. Voir ici par exemple. Je privilégie l’analyse qualitative de l’influence, mais sa quantification m’intéresse.)

Si on applique ce raisonnement au web, on peut effectuer des comparaisons entre blogs et sites médias en ligne. Les blogs n’ont en général pas des audiences comparables à celles des sites médias, mais ils écrivent beaucoup moins. Il serait donc très intéressant de pouvoir comparer l’audience relative des blogs et l’audience relative des médias en ligne…

Comment faire ? A partir de là, il faut faire des hypothèses et des choix :

- il faut d’abord récupérer des données d’audience pour les sites et les blogs. On sait que ça n’existe pas. Mais nous faut-il des données d’audience complètes ? Non car après tout, les données d’audience vont être ramenées par rapport à une quantité de production éditoriale et donc ne voudront rien dire en valeur absolue. Le tout est de pouvoir comparer des données, même partielles, pour tous les sites et blogs étudiés.

- C’est exactement ce que Google Reader fournit. En utilisant la fonction « ajouter un abonnement » dans Google Reader, apparaît le nombre d’abonnés au flux RSS en question. Il ne s’agit que des abonnés aux flux via Google Reader, cela ne donne donc qu’une idée très partielle de l’audience d’un site : il manque les abonnés Netvibes ou Bloglines, le trafic direct, le trafic via les moteurs de recherche, le trafic entrant via des clics sur des liens naturels ou publicitaires, etc. Mais encore une fois, on s’en fiche, puisqu’il s’agit juste de comparer des sites entre eux.

- Il manque alors un moyen d’estimer la quantité éditoriale produite par un site. Et là, magie de Google Reader, la même recherche sur « ajouter un abonnement » fait également apparaître le nombre de « publications par semaine ». Sur quelle durée ? Mystère, mais au moins dispose-t-on d’un chiffre.

Ainsi, Internet et Opinion (par exemple), a 36 abonnés Google Reader et publierait en moyenne 4.2 fois par semaine.

A partir de là, on peut s’amuser : comparer le nombre d’abonnés Google Reader entre blogs, entre médias, entre médias et blogs, voir quels médias et quels blogs postent le plus et le moins, etc.

Par exemple, quand on regarde les chiffres à partir des blogs du top 100 du classement Wikio, on voit que le n°16, Biologeek, n’a que 36 abonnés Google Reader. Juste au-dessus, le n°15, Standblog, en a… 2777. Par contre, le même Biologeek n’écrit que 1,6 fois par semaine, ce qui relativise son faible nombre d’abonnés. Le blog de Jean-Marc Morandini compte 841 abonnés… mais publie 183,4 fois par semaine, ce qui relativise son audience. Fred Cavazza, lui, publie 7.5 fois par semaine. Le Monde.fr compte plus de 500 000 abonnés RSS mais publie… 700 fois par semaine. Le blog qui a le plus grand nombre d’abonnés est TechCrunch (21 000), ce qui est autant que Rue89 ; etc.

Pour info, top 10 des blogs par nombre d’abonnés :

1 Techcrunch 21 430
2 KozToujours 18 040
3 Diner’s room 17 844
4 Presse Citron 3 629
5 Journal du geek 2 932
6 Standblog 2 777
7 Zorgloob 2 290
8 Fubiz 2 251
9 Fred Cavazza 1 659
10 Accessoweb2.0 1 489

Top 10 des médias en ligne (étudiés) par nombre d’abonnés au fil de une (seulement le fil de une, sinon je n’ai jamais le temps de faire cet article ;-) ) :

1 L’Equipe 733 194
2 Le Monde 536 681
3 Nouvelobs 141 689
4 Libération 128 491
5 01 Net 97 317
6 Les Inrocks 90 717
7 Clubic 88 070
8 Pcinpact 70 937
9 LCI 38 588
10 Rue89 21 136

Les 10 blogs (étudiés) qui publient le plus (billets par semaine) :

1 Gizmodo 209,1
2 Morandini 183,4
3 Beta politique 107,3
4 Chauffeur de buzz 84
5 TV News 82,4
6 Le blog auto 80,3
7 Journal du geek 74,4
8 The inquirer 58,6
9 Pingoo 55,3
10 GuiM 52,5

Les 10 médias (étudiés) qui publient le plus (par semaine) :

1 Le Figaro 861,2
2 Le Monde 716,6
3 L’Equipe 573,8
4 LCI 561,4
5 LePost 540,6
6 L’Express 513,1
7 Le Parisien 466,7
8 Métro 461,8
9 20 minutes 440,3
10 Nouvelobs 340,7

Bref, à partir de là je me suis amusé (tout à fait, cela m’amuse énormément) à relever le nombre d’abonnés et la fréquence de publication pour :

- les blogs du top 100 de Wikio

- une bonne trentaine de médias en ligne (les plus hauts dans les classements Nielsen et Médiamétrie ; les plus cités par la blogosphère ; les sites média de quelques « grands médias » traditionnels, des pure players emblématiques, etc.)

Un magnifique fichier excel, une formule de calcul, et hop, on a, pour environ 130 blogs et médias en ligne, un « indice d’audience relative ». Qui ne signifie rien en soi mais permet des comparaisons, donc de faire un classement.

Les médias en ligne dominent-ils les blogs ? Voilà ce que ça donne (désolé pour la mise en page, c’est un copié-collé du fichier excel), avec les médias professionnels en gras :

1 KozToujours 3537,3
2 Diner’s room 2317,4
3 01 Net 2306,1
4 Les Inrocks 1727,9
5 L’Equipe 1277,8
6 Le Monde 748,9
7 Clubic 727,3

8 Techcrunch 695,8
9 Pcinpact 562,1
10 Standblog 514,3
11 Nouvelobs 415,9
12 Rue89 408,0
13 Libération 403,7
14 Fubiz 331,0
15 Zorgloob 289,9
16 Doctissimo 283,5
17 Transnets 249,8
18 Révolution web 2.0 en live ! 236,9
19 Fred Cavazza 221,2
20 Technologies du langage 163,3
21 Netvibes.com blog 155,0
22 Agoravox 139,4
23 Presse Citron 122,6
24 Le blog d’abondance 105,5
25 L’internaute 93,5
26 Arrêt sur images 93,2

27 2803 by Henri Labarre 87,2
28 Journal d’un avocat 84,9
29 Emob 81,7
30 Fran6art 74,5
31 Jean-Michel Billaut 69,4
32 LCI 68,7
33 Blogeee.net 65,5
34 Bienbienbien 63,9
35 Intruders TV 63,1
36 Les Echos 58,5
37 Beau à la louche 55,4
38 La République des Livres 49,1
39 Accessoweb2.0 49,1
40 Le journal du net 44,9
41 Trends Now 43,4
42 Papygeek 42,9
43 Futura Sciences 39,5
44 Journal du geek 39,4
45 Jacques Froissant 38,2
46 Iphon 38,0
47 Mashable 37,6
48 WordPress Francophone 36,7
49 Bakchich 35,9
50 Génération NT 35,8
51 Kelblog 34,6
52 Jarodxxx 33,3
53 Mais pourquoi est-ce que je vous raconte ça 33,0
54 Coulisses de Bruxelles 32,2
55 Bleebot blog 31,7
56 Versac 30,1
57 Vinvin entertainment 29,6
58 Le monde du blog 28,5
59 Gonzague Dambricourt 28,3
60 Kick and blog 26,9
61 Embruns 26,9
62 Tapahont 26,5
63 Neteco 25,9
64 Marianne2 25,5
65 3 couleurs 25,0
66 Affordance 23,2
67 Biologeek 22,5
68 Plume de presse 22,4
69 Le Figaro 22,2
70 L’Express 21,8
71 France Football 21,2
72 Contre Journal 20,7
73 Ecrans 20,0
74 L’observatoire des médias 18,6
75 MrBoo.fr 17,6
76 ZDNet 16,3
77 La vie des idées 16,0
78 Veille2com 15,6
79 Cuisine plurielle 15,4
80 Webilus 14,8
81 Actualités de la Recherche en Histoire Visuelle 14,7
82 Adscriptor 14,7
83 Et si c’était bon 14,7
84 Benoît Descary 12,8
85 La Tribune 12,3
86 De source sûre 11,5
87 Loïc Le Meur 11,2
88 Bagatelles 10,8
89 Wikio blog 10,4
90 Papilles et pupilles 10,1
91 Le tiers livre 10,1
92 Le blog auto 9,9
93 Chauffeur de buzz 9,8
94 NTIC 8,7
95 Nowhere else 2.0 8,6
96 Ma vie en Narcisse 8,4
97 Eryn et sa folle cuisine 8,1
98 Choses vues 7,9
99 Chez Clarabel 7,7
100 Crise dans les médias 7,7
101 Ligne et papilles 7,5
102 Contre info 7,4
103 GuiM 7,1
104 Korben 6,3
105 20 minutes 5,1
106 Morandini 4,6
107 Le Point 4,5
108 L’Expansion 4,3
109 Intox2007 4,2
110 Psychologies 4,2
111 Le Parisien 3,5
112 Bozarblog 3,3
113 Pingoo 3,1
114 France2 3,1
115 TV News 2,3
116 Gizmodo 2,0
117 The inquirer 1,9
118 Le vinZ de blog 1,8
119 Partageons mon avis 1,7
120 Beta politique 1,4
121 Marc Vasseur 1,4
122 Peuples.net 1,2
123 Bizet’s blog 1,1
124 Caledosphere 1,0
125 Sarkofrance 1,0
126 Homo Sapiens Internetus 0,7
127 iSubway 0,7
128 MesOpinions.com 0,6
129 LePost 0,6
130 Métro 0,4
131 Investir 0,1
132 Challenges 0,1

Des résultats très très étonnants à mon sens :

- dans le classement très mélangé entre blogs et médias en ligne. Beaucoup de médias en ligne sont assez haut dans le classement ce qui est finalement rassurant pour eux… mais beaucoup sont aussi très, très bas dans le classement…

- dans les chiffres qui montrent des disparités énormes. Pour prendre des concurrents directs, le Figaro a 22 quand le Monde a 748…

- Classement assez moyen de beaucoup de blogueurs « historiques »…

Que faut-il en penser ? Mon ami Koz, 88ème du classement Wikio, est-il en réalité le site le plus influent du web français ? Ne nous emballons pas, il y a de nombreux et sérieux problèmes :

- Fiabilité des données Google Reader ? Il y a forcément un problème, justement, avec Koz : Google Reader indique 18 000 abonnés. Pourquoi pas. mais le Feedburner de Koz mesure 18600 abonnés au total. Or il est rigoureusement impossible qu’il n’y ait pas au moins 3 abonnés Netvibes pour un abonné Google Reader, étant donné l’utilisation faite de ces deux services en France. Google Reader ne peut pas réaliser 97% des abonnements de Koz. Il peut y avoir le même problème pour le deuxième du classement, Diner’s Room.

- Le nombre d’abonnés est biaisé pour les sites proposés par défaut par Google Reader, comme, je crois… TechCrunch

- Quand il y a plusieurs flux pour un même site, faut-il additionner les abonnés à chaque flux, y compris quand le flux est un flux Feedburner ? C’est ce que j’ai fait pour les blogs. Pour les médias en ligne, je me suis arrêté au flux principal, celui des dernières infos, qui est en général le plus important.

- Sur-représentation des sites dans les thématiques High-tech et Internet, dont les lecteurs sont plus facilement utilisateurs de flux RSS

- Enfin un classement thématique serait plus juste : on mélange des torchons et des serviettes. Il faudrait faire le même exercice pour sites et blogs high-tech ; sites et blogs actu générale ; etc.

Quelle est votre analyse ? Voyez-vous des moyens d’améliorer cette méthodologie ?

De mon côté, je ne prends rien de tout ça au pied de la lettre, mais les résultats me semblent intéressants. Je ne sais pas si les explications méthodologiques sont très claires mais la pédagogie de l’évaluation et des chiffres est difficile. Il me semble que la signification d’un indicateur d’audience relative est à chercher du côté de l’influence. Même si l’influence, quand on veut la quantifier, est aussi une affaire :

- d’audience absolue (si, quand même)

- de reconnaissance (le lien entrant étant le signe de reconnaissance sur le web, d’où les méthodes basées sur cette notion : PageRank, Autorité, classement Wikio…)

Sans compter ce qu’on ne peut pas quantifier (l’influence dépend des circonstances, du hasard, des sujets abordés, etc.)

Là où je suis assez sûr de moi, c’est qu’il y a une piste à creuser dans l’analyse de l’audience relative pour mesurer les rapports de force entre médias et blogs.

Du rôle de la notion d’audience dans l’évaluation de « l’influence » sur le web

« Ce site / blog / média en ligne est-il influent ? ». C’est une des questions les plus courantes, j’allais dire tarte à la crème, dans les RP online. Que la couverture soit voulue ou subie, favorable ou défavorable, analytique ou irréfléchie, morale ou factuelle, étayée ou superflue, chaque fois qu’on parle de vous la question se pose et le rôle du conseil est de donner les clés de décryptage de « l’influence » ou de « l’importance » d’une couverture donnée sur un site donné.

Cette analyse d’influence repose à la fois sur la couverture elle-même (importance du sujet abordé aux yeux du client, nature et crédibilité des arguments, etc.) et sur le lieu où ce billet est déposé. D’où la question ci-dessus : « ce site est-il influent ou pas » ?

Sans vouloir entrer dans le détail de ce qu’on appelle l’influence sur le web (d’ailleurs personnellement je ne suis pas à l’aise avec l’usage permanent qui est fait de ce terme), on distingue trois niveaux d’analyse – complémentaires et imbriqués – pour apporter une réponse :

1. les indicateurs de reconnaissance dont le site / blog bénéficie (par exemple, la notion d’autorité basée sur les liens entrants Technorati, le PageRank Google, etc.)

2. les indicateurs de qualité du site (richesse / fréquence de la ligne éditoriale, commentaires, graphisme, etc.) qui sont analysés par l’oeil humain.

3. les indicateurs d’audience (c’est quand même bien de savoir combien de gens passent sur ces pages)

Toutes ces méthodes apportent quelque chose. Aucune de ces méthodes n’est satisfaisante. On en avait déjà parlé sur ces pages (d’ailleurs, ça me ferait plaisir si vous cliquiez ici pour aller relire notre papier d’analyse sur la méthodo du classement des blogs média et marketing d’Advertising Age).

Et on en a eu une nouvelle preuve récemment sur le troisième critère que je cite ici et qui est celui sur lequel nous allons nous attarder : l’audience.

Mais revenons un instant sur la notion d’audience en RP.

Si l’audience est le Graal en publicité, elle n’en est pas moins une notion majeure dans l’évaluation RP traditionnelle. Evaluation RP traditionnelle qui, si elle est compliquée et délicate, peut au moins s’appuyer sur des données de diffusion certifiées pour la majorité des titres de presse professionnelle : merci l’OJD.

Pas d’OJD de système de mesure généralisé de l’audience sur le web. Ou si peu. La notion d’audience des sites et des blogs en particulier est aussi mystérieuse que l’affaire des disparues de la gare de Perpignan (je regarde beaucoup Faites entrer l’accusé). Alors, des mesures d’audience, on en a : Médiamétrie, OJD Internet, Nielsen Netratings, Comscore… mais on parle de mesures – pas forcément publiques – qui concernent un nombre limité de sites à forte audience (il faut un minimum de 30 000 visiteurs uniques pour entrer dans Médiamétrie).

« Un nombre limité de références à forte popularité »… ça ne vous dit rien ? Bon sang mais c’est bien sûr : on est dans le haut de la longue traîne médiatique. La longue traîne médiatique, on en a déjà parlé sur ces pages : c’est l’idée, forcément schématique, qu’Internet, en facilitant la possibilité pour chacun de créer son propre média, donne (ou renforce, c’est selon) au paysage des médias une forme de longue traîne :

- des références en nombre limité qui ont de fortes audiences d’un côté (les médias « professionnels »)

- des références en très grand nombre avec des audiences de niche de l’autre, qui tendent vers zéro (les médias « personnels »).

(By the way rappelons que LiveJournal, un des services de blogs les plus populaires aux Etats-Unis, a indiqué que l’audience MOYENNE de ses 12.5 millions de blogs était de 7 lecteurs. Sept. Si c’est pas de la longue traîne, ça…)

longtail

Donc, puisque la question posée ici c’est : « et comment je fais pour savoir si ce site qui parle de moi est influent ? » et puisque là où je veux en venir, c’est la nécessaire prudence qu’il faut avoir avec la notion d’audience sur le web, on va dire que les méthodes « certifiées » de mesure d’audience, pour le conseil en RP, portent uniquement sur le haut de la longue traîne médiatique (en vert sur le graphe).

Et donc, comment je fais pour le bas de cette longue traîne (en jaune) ? Comment je fais quand, dans 97% des cas, je suis cité sur un blog dont l’audience n’est pas indiquée dans ces panels ?

Tentation : s’appuyer sur les « nombres d’abonnés au flux RSS » souvent (mais pas toujours, loin de là) affichés sur les blogs – vous savez, ces « XXXX readers » Feedburner qui nous disent que TechCrunch a « 154 K lecteurs », que Loïc Le Meur en a 25 279, que GuiM en a 1509 ou que Henri Labarre en a 7420 (on s’était même amusés il y a quelques semaines, sur i&o, à relever le nombre d’abonnés « déclarés » dans le top 50 de Wikio).

154Klecteurs

(TechChrunch compte les abonnés par 1000, comme i&o prochainement d’ailleurs)

Et bien non ou en tout cas : gaffe. La lisibilité des audiences du web « longue traîne » est encore moindre que ce qu’elle n’y paraît. C’est d’ailleurs l’objet de billets récents chez Emmanuel Parody et 2803 (à la suite d’un billet de Mashable U.S). Vous pensiez que le nombre d’abonnés indiqués par certains blogs allaient vous tirer de votre mauvais pas ? Que nenni. Tout porte à penser qu’il faut être extrêmement méfiants vis-à-vis de ces données.

Sans vouloir faire trop technique, on distingue plusieurs problèmes :

- les stats artificiellement gonflées par les moteurs de recherche qui indexent les flux (ça concerne tous les sites)

- les stats artificiellement gonflées par la présence du flux RSS dans un « package promotionnel » d’un service type Google Reader (ex : je m’abonne à Google Reader, on me met d’office un certain nombre de flux RSS en surveillance) : d’où des abonnés qui ne LISENT PAS les flux (ça concerne les gros sites)

- sans parler du décalage entre les stats d’abonnements au flux RSS et les stats « publiques » du site : si l’intégralité du contenu est dispo sur le flux RSS, je n’ai pas de raison de me rendre sur le site

- et (ça c’est moi qui le dis) le problème posé par la gratuité de l’abonnement : contrairement à la presse papier, on s’abonne mais on ne se désabonne jamais (ou si peu).

On peut observer ces décalages comme Henri Labarre l’a fait en jouant avec Google Reader : faire « add suscription » en entrant un bout d’url du blog recherché et voir le résultat (et après ça on préfère admirer son compteur WordPress). Pour ce qui le concerne, Feedburner indique environ deux fois plus de lecteurs via Google Reader… que Google Reader lui-même.

La compréhension de la notion d’audience, en tant que clé de lecture de l’influence, est donc encore plus complexe qu’il n’y paraît sur le web.

MAIS.

Mais est-ce que c’est grave ?

Pas pour les gens de publicité, mais pour les gens de RP, je veux dire.

Réfléchissons un instant : la notion d’audience a surtout du sens quand elle porte sur des sites dont les niveaux d’audience sont élevés (vous allez me dire, c’est quoi un niveau d’audience élevé et là je suis mal parce qu’effectivement je n’en sais rien. Mais vous allez voir où je veux en venir). Et quand les niveaux d’audience sont différenciés d’un média à l’autre.

Exemple : on réfléchissait récemment avec un client au choix d’un média papier à qui proposer une belle info. La réflexion a surtout été conduite autour de la cohérence rédactionnelle / profil du lecteur par rapport à l’info en question / image du support, mais aussi quand même un peu par rapport à l’audience du média. Et là, dans notre « short list », on avait des supports dont la diffusion variait de plus ou moins 100 000 exemplaires.

Les audiences des blogs, elles, ne varient pas de 100 000 lecteurs. C’est justement tout le principe de la longue traîne médiatique décrit plus haut : audiences de niche, peu différenciées.

Donc est-ce qu’on a besoin de connaître exactement ces audiences, puisque les blogs sont par définition et dans l’ensemble sur de « petites » audiences ? C’est ici qu’il nous faut rappeler que la réflexion « traditionnelle » de stratégie de communication fonctionne différemment sur le web. Elle obéit grosso modo à 3 finalités :

I. on est moins là pour faire de l’audience que pour parler à un public bien qualifié (ce qui est est complètement naturel dans les RP, au passage) – les fameuses « communautés » (qui ne sont d’ailleurs pas vraiment des communautés mais bon), ces relais d’opinion dont les niveaux d’expertise sont, on l’espère en tout cas, assez élevés sur leur sujet. On est dans une logique d’hyperqualification plus que d’audience.

II. on est aussi là pour « rendre un message disponible » : et oui, la navigation sur le web c’est beaucoup de search. L’idée des RP en ligne étant justement d’essaimer un message pour le rendre plus facilement accessible dans l’espace profondément décentralisé qu’est le web (notons à nouveau que cette idée « d’essaimer » est complètement naturelle dans les RP). C’est à dire faire en sorte que celui qui se renseigne puisse trouver son info : on agit alors moins sur de la puissance (audience) que sur de la crédibilité et de la conviction.

III. enfin on bénéficie du retour d’expérience du consommateur, dont les réactions ont souvent beaucoup de choses à apprendre à la marque. Soit une logique bottom-up.

Vous allez donc me dire : tout ce papier pour démolir la notion d’audience.

Mais nooooooooooooon.

On est bien contents, quand on a des audiences connues et fiables. Ca aide bien à la comprendre, cette mystérieuse « influence » sur le web.

Mais (et hop, résumé de l’article) : il y a deux points de relativisation de l’audience quand on fait des RP en ligne (au fait, « RP » c’est à dire : quand on apporte un message à un public).

1. la finalité de ces stratégies porte moins sur l’audience (la masse) que sur ce que je viens de lister en 3 points (vous remontez les yeux svp sur les I, II et III, je ne vais pas les recopier, je radote assez comme ça)

2. la compréhension de « l’influence » d’un site s’appuie sur la complémentarité de plusieurs critères (et là c’est au début de l’article que l’on remonte et ce sont les chiffres arabes, pas romains), l’audience n’étant que l’un d’eux. Et l’œil humain n’étant pas le moindre.