Octobre 2011 a vu l’apparition des requêtes en « not provided » dans les outils d’analyse. Si vous avec un Google Analytics par exemple, vous devriez en voir (sans doute même en première position) dans la section « sources de trafic », « vue d’ensemble ». Le problème, c’est que du coup il devient difficile d’analyser finement son trafic entrant par les recherches Google. Et depuis ce lancement, les requêtes en not provided n’ont cessé d’augmenter. Voyons au travers cet article ce que sont les « not provided », à quoi est dû leur apparition, et ce qui peut être éventuellement fait pour contourner le problème.
C’est quoi, et c’est dû à quoi ?not_provided_google_analytics
La cause ? Une mise à jour de Google permettant d’augmenter la sécurité et la vie privée. Pour les utilisateurs Google connectés, toutes les requêtes web passent en Https, protocole sécurisé. Et pour toutes ces personnes connectées avec leur compte Google et effectuant des recherches au travers du moteur, les mots clés qu’ils ont saisi pour arriver sur votre site ne sont plus en clair et apparaissent en « not provided » (ou via un autre terme, comme « encrypted_search_terms » sur les statistiques de wordpress.com).
Et depuis octobre 2011, plusieurs évènements ont eu lieu et ont contribué à augmenter le nombre de requêtes en « not provided ». Google a d’abord procédé à l’unification des comptes de plusieurs de ces outils. En début d’année, il a annoncé que les mots clés que les utilisateurs saisiront dans la barre de recherche de sa nouvelle version de Chrome (la 25) passeront également dans la catégorie des not provided, même si l’utilisateur n’est pas connecté (ce que Firefox avait déjà fait à l’été 2012). Et ces derniers jours, il a annoncé la mise en place d’un protocole permettant à des éditeurs de sites ou d’applications de proposer de se connecter via un compte Google+, Google+ SignIn (à l’image de Facebook Connect). Donc les occasions de se retrouver avec des personnes connectées avec leur compte Google vont se multiplier.
Conséquence, sur la fin 2012 on est à plus de 30% de not provided en moyenne en France (donc avant même les deux derniers points abordés ci-dessus), avec pour certains sites des pourcentage qui frôlent les 50%. Voir sur ce sujet l’article d’Abondance.
L’intention est donc louable (protéger la vie privée), mais sachant que les requêtes AdWords ne sont pas concernés, cela ressemble en partie à un argument de façade.

Il n’y a rien à faire ?
Pour toute personne essayant d’analyser un peu les données de son site pour essayer de l’améliorer ou le positionner, pour les départements marketing, pour les sociétés de SEO, il est clair qu’il devient plus difficile de travailler du fait qu’une bonne partie des mots clés n’est plus visible.
Il existe quelques solutions pour avoir des informations sur ces not provided, mais ce sont des solutions de contournement permettant surtout de deviner ou supposer ce qui amène ces visiteurs. Vous en trouverez un certain nombre en suivant ce lien (de nombreuses solutions en anglais),  celui-ci (une solution en français) ou encore celui-ci (en français).
Vous pouvez aussi avoir un aperçu des requêtes les plus populaires via les Google Webmaster Tools dans l’onglet « Trafic »… »Requêtes de recherche ». Cela vous donner les principales requêtes, avec pour chacun le nombre d’impressions dans les pages de résultat, une tendance du nombre de clics et la position moyenne dans les SERP.
Vous voyez que la plupart de ces solutions font se croiser des informations (notamment en regardant de plus près les pages de destination, ou landing page) pour arriver à isoler la tendance qui a amené l’internaute, mais elles ne remplacent pas ce qui aurait pu se trouver derrière le not provided.

Conclusion
On voit que la tendance va vers une disparition progressive dans les outils d’analyse des mots clés qui auront servi à accéder à votre site. Vu que les requêtes de recherche, au travers notamment de la personnalisation des SERP, croisent de nombreux paramètres privés, le fait de sécuriser les recherches des internautes va sans doute dans le bon sens. Mais le fait que les solutions payantes de Google passent à travers, le fait que toutes ces informations restent également à la disposition de Google laisse l’impression de deux poids deux mesures. Surtout que ces derniers temps les exemples se multiplient.
Pour des blogs comme ici, cela a surtout pour effet de faire disparaître une information intéressante, mais non vitale. Pour certains professionnels en revanche, le coup est rude. Cette information est disponible depuis tellement longtemps qu’elle a été prise pour acquis et beaucoup de stratégies de positionnement ou marketing reposent au moins pour partie sur son analyse.
Après, il est fort à parier que des solutions palliatives vont voir le jour. Les experts en SEO notamment ont appris à se mouvoir au fur et à mesure des évolutions venant de Mountain View, et après avoir dompté un panda et un pingouin les not provided risquent d’être leur prochain challenge.