Big data, big challenge
Nouveau défi des marketeurs, le «big data» consiste à traiter, en temps réel, de très gros volumes de données extrêmement variées et à les analyser. Toutes les entreprises sont concernées. Surtout celles qui possèdent de vastes gisements d'informations et souhaitent les passer au crible pour améliorer leur connaissance client et optimiser leurs campagnes.
Je m'abonneLe Web 2.0 est entré dans les moeurs, les réseaux sociaux aussi, idem pour le cloud computing... Aujourd'hui, c'est au tour du «big data». «Tout est parti des grands acteurs du numérique, qui sont assis sur des gisements massifs de données, rappelle Alexis Mons, directeur général en charge de la stratégie de l'agence française Emakina. En analysant les informations fournies par leurs clients et utilisateurs, ils espèrent valoriser leurs services.» Ce n'est pas un voeu pieux: certains, comme Google, Amazon, Facebook et Yahoo!, ont déjà contribué à populariser les modèles de programmation open source MapReduce et Hadoop, conçus pour faciliter le traitement de très grands volumes de données sur des architectures web «distribuées». Aujourd'hui, bien d'autres entreprises leur emboîtent le pas, aidées par l'augmentation continue des capacités de calcul et de stockage, mais aussi par la multiplication des outils informatiques permettant d'exploiter et de visualiser les données. Lesquels sont souvent des «versions industrialisées d'Hadoop, packagées pour les entreprises, telles Cloudera, MapR ou Tonworks», indique Vincent Heuschling, fondateur du cabinet AffiniTech.
5 Md
5 Md DE GIGAOCTETS DE DONNEES SONT GENERES DANS LE MONDE TOUS LES DEUX JOURS.
(Source: Eric Schmidt, président exécutif de Google, conférence Technonomy.)
Yelp France sonde les profondeurs de l'information locale
Créé en 2004 à San Francisco, le site de recommandation Yelp (58,4 millions de dollars de chiffre d'affaires en 2010) a déjà collecté 22 millions d'avis sur tous types de commerces de proximité et d'activités locales: restaurants, toiletteurs, brocantes, garages, piscines... Très active aux Etats-Unis, la société, qui prépare son introduction en Bourse, est aussi installée au Canada et dans huit pays européens, dont la France, où elle a posé ses valises en mai 2010. Quel que soit le pays, l'objectif consiste à «creuser au maximum dans les données liées au marché local et faciliter la recherche d'informations», précise Zeva Bellel, directrice marketing de Yelp France.
Yelp s'efforce de détecter des tendances, d'identifier les super-utilisateurs («la brigade d'élite») et de les convier à de petites réunions «dans la vraie vie», dans des lieux scrupuleusement choisis. Le 24 novembre dernier, les Parisiens ont ainsi été invités au café-torréfacteur Coutume Café, «l'une des adresses les plus recommandées actuellement dans la capitale», selon la directrice marketing de Yelp. Le décor ne devrait pas être le même à Lyon, où la petite communauté de Yelpers serait apparemment surtout friande de bagels. L'important? Fédérer une tribu de passionnés. Et pour Yelp? Choyer une audience très qualifiée, ce qui nécessite de modifier en permanence les outils de recherche et de filtrage des contenus. «Un algorithme secret détecte les contenus potentiellement suspects soumis par les Yelpers, précise Zeva Bellel. Ces contenus ne sont pas effacés, mais mis de côté pour ne pas nuire à l'information.» L'enjeu est de taille. Yelp génère la quasi-totalité de ses revenus avec les campagnes publicitaires menées sur son site par de grandes enseignes nationales et des commerces de proximité.
Un stéthoscope pour écouter les bruits de la Toile
Luca Paderni, analyste chez Forrester, explique que «la croissance du volume de données à gérer est exponentielle. Il faut bien sûr analyser tout ce qui se dit à propos de la marque sur le Web, les messages issus des réseaux sociaux et des forums. Mais on voit aussi de plus en plus arriver de nouvelles données provenant des voitures, des mobiles, des télévisions, des tablettes, des capteurs... Tous ces objets transmettent des informations qu'il faut apprendre à gérer». Cela ne va pas de soi. « On dit souvent que la difficulté réside dans les trois V: volume, vitesse et variété, souligne Isabelle Carcassonne, directrice marketing analyse décisionnelle chez IBM. On ne parle plus de «téraoctets» (1012), mais de «pétaoctets» (1015). Les data doivent être traitées en temps réel; et surtout, elles ne proviennent plus uniquement de bases d'informations structurées car relationnelles, mais comportent aussi un nombre croissant de contenus non structurés, comme des commentaires, des vidéos, des images, de l'audio... »
Pourquoi s'intéresser à ces données-là? «Si vous êtes un institut de recherche médicale, la possibilité d'accéder à des informations anonymisées sur la totalité des analyses de sang faites par un hôpital aura beaucoup de valeur pour vous», note Alexis Mons (Emakina) . Vous pourrez effectuer des analyses statistiques et dégager des tendances. » L'examen des appréciations des clients peut s'avérer tout aussi précieux. « Une marque de lessive a utilisé une de nos solutions pour jauger la perception de son produit sur le marché», explique Isabelle Carcassonne (IBM) . Après analyse de ce qui se disait sur la Toile, elle a découvert un problème d'odeur qu'elle méconnaissait et a revu sa formulation! Un point de vue que partage le consultant en nouvelles technologies Xavier Dalloz: « Le «big data» permet de vérifier une intuition. Il faut poser les bonnes questions, puis vérifier, à partir de la masse d'informations, si votre idée repose sur du concret ». Un panel 2.0, en somme, sur lequel certains instituts de sondages comptent déjà s'appuyer.
Pour Hervé Tranger, directeur méthodes et process de BVA, le «big data» a pu émerger grâce au développement de deux types d'outils: « Ceux permettant d'écouter la Toile, pour récupérer les verbatims autour d'un sujet donné, et les logiciels d'analyse sémantique et de codification automatisée, pour structurer et analyser de gros voilumes de verbatims » . Loin de concurrencer les études «traditionnelles», ces verbatims peuvent les compléter. « Ils ont facilité l'émergence de produits d'étude (e-réputation...), mais ont aussi enrichi les approches existantes », poursuit Hervé Tranger (BVA) .
Bastien Hillen (Scan & Target)
Bastien Hillen (Scan & Target)
« Le "big data" ne se résume pas à un type de données.»
Recouper les informations et... rester humain
Dans certains cas, le «big data» permet d'anticiper les difficultés pour améliorer le service client. L'éditeur français Scan & Target, dont les solutions sont utilisées par la Française des jeux et Pixmania, a développé un service en ligne d'analyse et de filtrage, en temps réel, des contenus générés par les internautes. Le club de basket américain San Antonio Spurs, un autre de ses clients, l'exploite, par exemple, pour modérer automatiquement sa page Facebook et détecter les fans qui peinent à se procurer des billets pour les matchs. « A chaque fois, nous alertons le community manager du club, qui contacte la personne pour l'aider ou pour lui proposer un produit répondant à ses attentes », relate Bastien Hillen, directeur général de Scan & Target.
Reste que l'approche s'avère encore souvent compliquée. « Le «big data» ne se résume pas à un type de données, précise Bastien Hillen.
Les réseaux sociaux sont un exemple, mais il en existe beaucoup d'autres. E-mails, appels téléphoniques aux services consommateurs, vidéos, SMS... sont d'autres canaux importants. Et aucun éditeur ne peut prétendre couvrir la totalité du «big data». » Quoi qu'en disent la majorité des acteurs qui se positionnent sur ce marché émergent, objet de nombreuses convoitises... « Il serait presque illusoire de vouloir gérer la totalité des données », ajoute le consultant Luca Paderni.
L'idéal selon lui? « Identifier une quinzaine de points d'interaction prioritaires avec les clients. Les consommateurs se forgent une opinion sur votre marque à partir de ces points de contact. Pour chacun, effectuez de nombreux tests, évaluez les comportements et cernez ce qui a le plus de valeur. » Ce faisant, vous devriez identifier de nouvelles idées pour satisfaire les consommateurs. Mais attention à ne pas tout miser sur le «big data». « La technique aide à cerner des tendances ou des grilles comportementales, comme la quantité d'informations publiées par un internaute, le nombre de pages lues à chaque visite, le nombre de pauses... », affirme Romain Chaumais, directeur business intelligence de la société de services Ysance. Pour autant, nul ne peut être sûr à 100 % de la qualité des données et mieux vaut recouper ses découvertes avec d'autres informations. « Les données n'ont pas d'intelligence en elles-mêmes. Elles doivent être mises en perspective, insiste Alexis Mons (Emakina) . On ne peut pas les détacher du contexte, des moyens ou de la qualité... » Le «big data» constitue un outil très précieux. Mais il n'est pas encore près de remplacer les analystes. Son développement devrait même créer de nouveaux métiers. « Il faut des experts pour veiller sur les sources, réaliser les bons échantillonnages... », assure le consultant Vincent Heuschling. Les têtes pensantes du marketing peuvent être rassurées.
Garantir l'anonymat
En France, lorsque des données réelles à caractère personnel sont utilisées pour des tests ou des développements, celles-ci doivent être rendues anonymes de façon irréversible, via des processus validés par des experts. Récemment, la Commission nationale de l'informatique et des libertés (Cnil) a défini les bonnes pratiques de l'utilisation de données à caractère personnel pour la géolocalisation. Si les «informations issues de points d'accès wi-fi sont utilisées pour fournir des services», celles-ci sont considérées comme des données à caractère personnel au sens de la loi. Leur traitement doit donc être déclaré à la Cnil et «la conservation des données de localisation associées à un point d'accès wi-fi ne doit pas dépasser cinq ans». Concernant la géolocalisation sur téléphone mobile, la Cnil précise que la plupart des services actuels «intègre des mécanismes permettant de définir précisément la diffusion d'informations de géolocalisation». Enfin, si «le marketing ciblé fondé sur de la géolocalisation n'est pas interdit», il faut «que les personnes souscrivant à des services ayant pour objet de localiser ses amis aient conscience de la possible réutilisation de ces données à d'autres fins et puissent s'y opposer».
Alexis Mons (Emakina)
Alexis Mons (Emakina):
« Les données n'ont pas d'intelligence en elles-mêmes. Elles doivent être mises en perspective. »
Expedia ne lâche plus la main des voyageurs
« Nous nous sommes toujours concentrés sur les données, et cela va croissant, lance Maryse Gauthier, directrice marketing France, Belgique et Pays-Bas chez Expedia, quand on l'interroge sur l'importance du «big data». Nous rassemblons des informations sur toutes sortes de choses: par exemple, sur l'heure de départ du vol du client, la disponibilité d'un sèche-cheveux ou d'un journal gratuit dans sa chambre d'hôtel... Avec plus de 3 millions de visiteurs par jour, nous disposons d'une grande quantité de données. » L'objectif du «big data» consiste, selon elle, à « utiliser ces informations pour proposer les services les plus pertinents possible ». Expedia s'est, par exemple, « aperçu que la majorité de ses clients utilise leur mobile pour réserver un hôtel à leur arrivée ». L'entreprise a donc lancé, en mars 201 1 , une application mobile de réservation d'hôtels qui, en s'appuyant sur le GPS du smartphone de l'utilisateur, le géolocalise et lui fait gagner du temps. De même, l'analyse du parcours d'achat de millions d'utilisateurs du site a permis d'identifier les difficultés rencontrées lors de leur navigation et d'améliorer les processus de réservation ainsi que la présentation des informations. La principale difficulté reste, selon la responsable marketing, « d'analyser la valeur locale des jeux de données ». Et de leur donner du sens.