big-data

90% des responsables IT interrogés par Intel (1) affirment qu’améliorer l’analyse des données de leur entreprise est très important voire primordial. Selon McKinsey (2), une entreprise du secteur privé utilisant pleinement le Big Data pourrait augmenter sa marge opérationnelle de 60%.
Plus qu’une tendance de l’année 2013, le Big Data est donc un véritable enjeu, aussi bien pour les entreprises que pour les institutions et les citoyens.

Article réalisé en partenariat avec le Women’s Forum

Depuis des années, les systèmes d’informations des entreprises et des institutions publiques récoltent des trillions d’octets de données via diverses sources. C’est là que le Big Data intervient.

Bien qu’une définition officielle n’existe pas, le Big Data représente des groupes de données dont la lourdeur, la taille mais aussi la complexité des calculs nécessaires pour les analyser ne permettent pas à un simple serveur ou logiciel de les stocker et les traiter.

Imaginez par exemple qu’une entreprise récolte chaque semaine, 300 téraoctets, soit 100 000 fois ce qu’un opérateur téléphonique classique vous laisse utiliser depuis votre Smartphone en un mois (3 Go). Que faire de toutes ces données? Qu’en tirer? Voici un des enjeux du Big Data. Car à l’image du NFC ou même de la technologie mobile il y a quelques temps, le Big Data est un socle, une source d’innovation encore très peu exploitée en termes d’applications.

Le Big Data oui, mais pour quoi faire?

Concrètement, à quoi peut servir le Big Data? L’application la plus connue est également celle à laquelle nous sommes quasiment accros… le moteur de recherche de Google et ses suggestions. Outre la remontée des pages les plus pertinentes en fonction des mots clés saisis, les calculs qui traitent le gargantuesque amas de données cachées sur le web s’enrichissent au fur et à mesure de l’utilisation de l’outil. Et pour réussir une application Big Data pertinente, ce point est des plus importants. Dans la même veine, on peut également citer Facebook aussi bien pour ses suggestions que pour l’ordre d’apparition des posts de vos « amis ».

Autre exemple également basé sur l’enrichissement continu des calculs et résultats proposés, le super ordinateur d’IBM, Watson.

Watson-Le-supercalculateur-dIBM

Plus connu pour avoir gagné au jeu américain « Jeopardy! », cette machine super puissante accompagne depuis un an certains médecins américains dans la définition de leur diagnostic et les traitements à prescrire. Ainsi pour tous les patients souffrant d’un cancer du poumon, les médecins peuvent cliquer sur « Ask Watson » et bénéficier de la base de connaissance de l’ordinateur. La machine ne remplace toutefois pas l’homme puisque Watson se contente de proposer en quelques secondes un certain nombre d’hypothèses, par ordre de pertinence par rapport aux antécédents et aux symptômes et examens du patient. On peut alors imaginer que demain, à l’heure de la centralisation de toutes les données médicales, des sites tels que PatientsLikeMe, basés sur le crowdsourcing et le croisement des données et les conseils entre particuliers, pourraient exploser et proposer des traitements personnalisés des plus pertinents à chaque patient.

Pour Rand Hindi, fondateur et CEO de Snips, entreprise spécialisée dans les modèles prédictifs et l’innovation par le Big Data, cette technologie est sur la pente ascendante de l’adoption. Dans une dizaine d’années, les applications basées sur le Big Data seront au cœur de tous les produits et services générant ou utilisant des données. Les données urbaines, notamment issues de l’internet des objets mais aussi de technologies existantes, permettront à chaque action de notre quotidien de se simplifier grâce à une offre de choix pertinente. Aujourd’hui déjà, Snips et la SNCF travaillent à vous proposer le trajet en transports en commun le plus confortable en fonction des prédictions du nombre de passagers à bord des trains du réseau Transilien et des incidents sur les lignes. Ce type d’application pourra naturellement s’étendre à tous les types de transports pour connaitre à un instant T le trajet le plus rapide, le moins cher mais aussi le plus confortable…

Enjeux, prérequis et freins au déploiement du Big Data

Vous l’aurez compris, les sources de données nourrissant le Big Data sont déjà nombreuses. Dans les entreprises interrogées par Intel (1), les données à analyser les plus demandées sont à 84% les documents, à 82% les différentes transactions commerciales et à 74% les emails. Il faut ajouter à cela un nombre croissant de contenus produits sur le web via les blogs ou les réseaux sociaux. Certaines de ces données sont structurées, à l’image des données commerciales, et d’autres beaucoup moins comme les réseaux sociaux qui peuvent demander une analyse sémantique préalable au traitement des données qu’elles contiennent.

Du fait de ces données déstructurées mais aussi du nombre de sources et de contenus, le Big Data est aujourd’hui plus que jamais devenu clé. De fait, les calculs cachés derrière cette technologie permettent d’observer des phénomènes, des comportements jusqu’alors invisibles. Invisibles parce que parfois rares ou spécifiques, selon Rand Hindi. L’accroissement du nombre de données analysées permettrait ainsi de trouver une significance statistique à des faits simplement observés mais jamais prouvés.

Concrètement, les logiciels CRM actuels ne se basent que sur un petit nombre de données récoltées par rapport à tout ce qu’une entreprise est capable de générer et récolter. Si l’on prend l’exemple d’un site d’e-commerce, la source principale est aujourd’hui les achats effectués, si tant est que l’acheteur dispose d’un compte. Mais qu’en est-il des pages visitées, des posts de satisfaction ou d’évaluation sur Twitter, des parcours d’achats non terminés… ? Amazon est un précurseur en la matière de par ses remontées de produits suggérés mais également de ses newsletters personnalisés suivant vos derniers achats. Encore mieux ? À terme, le Big Data pourrait permettre aux entreprises BtoC d’atteindre leur Saint Graal : la psychographie, segmentation marketing basée sur les styles de vies des consommateurs, de leurs valeurs à leur personnalité.

Au vu des bénéfices évidents, pourquoi certaines entreprises ne se sont-elles pas encore lancées dans l’aventure ? Tout simplement parce que déployer le Big Data est loin d’être simple. Au-delà des questions déjà sensibles de la centralisation et du stockage des données, toute application Big Data nécessite une technologie abordable pouvant accueillir la puissance de calculs nécessaire. C’est le cas du Cloud Computing. Mais l’intervention d’un acteur tiers, qui aura entre ses mains la totalité des vos données, aussi confidentielles soient elles, n’est pas sans donner quelques frissons aux responsables IT des entreprises. Ainsi, 59% de ceux interrogés par Intel (1) estiment qu’il s’agit d’un des obstacles perçus les plus importants. La sécurisation des données est donc un élément clé.

Au-delà des problématiques techniques, et comme dans tout grand projet, il ne faut pas sous-estimer l’aspect stratégique du Big Data. Pour ce faire, une feuille de route claire doit être établie par la direction. En effet, aujourd’hui on ne sait pas encore vraiment ce que comprennent certains groupes de données. Avoir des objectifs clairs permet donc de faciliter les premiers traitements. On le voit d’ailleurs dans les sources les plus analysées actuellement : documents, transactions commerciales et emails. Ce sont des sources familières, dont on peut assez facilement avoir une vision d’ensemble. Viendront dans un second temps les réseaux sociaux et autres contenus créés par les internautes. D’une part parce que ces données ne sont pas structurées et demandent donc des calculs plus complexes pour les analyser. D’autre part parce que ces contenus sont beaucoup plus nombreux, riches et que leurs contours restent assez flous pour la plupart des entreprises.

Les ressources-clés

Le Big Data étant un sujet relativement récent pour la plupart des acteurs, de nouvelles ressources doivent y être allouées.
Technologiquement parlant, un vaste champ des possibles s’offre encore aux entreprises souhaitant mettre à disposition de leur client des espaces totalement sécurisés de stockage et de traitement des données. Pour la création des calculs, les frameworks proposés sont également loin d’être arrivés à maturité.

En matière d’accompagnement, plusieurs niveaux peuvent être développés, depuis la définition de la stratégie globale à des modèles de restitution clairs pour les utilisateurs finaux notamment sous forme de Data Visualization.

Côté création des calculs, Rand Hindi explique qu’il recherche aujourd’hui des profils hybrides mêlant hacker, scientifique et créatif. Il est en effet nécessaire de posséder des capacités techniques pour coder, d’imaginer différentes applications devant une série de données mais aussi savoir si le résultat d’un calcul est un pur fruit du hasard ou s’il est significatif.

Les métiers purement marketing liés au Big Data se créeront dans un second temps, quand les premiers calculs auront prouvés leur efficacité via diverses applications et quand les diverses sources de données auront montré ce qu’elles contiennent au plus profond d’elles-mêmes.
Comme toute innovation qui émerge, le Big Data peut poser la question de la valorisation monétaire et du retour sur investissement. Bien que nous ayons cités quelques estimations, la véritable valeur reste une question délicate. Cette question se posera d’autant plus dans les entreprises des secteurs privées où les effets durables sur la croissance ou l’augmentation des marges opérationnelles se fera a minima sur du moyen terme. Mais comme dans toute innovation qui émerge et comme le rappel Rand Hindi, se lancer aujourd’hui dans l’aventure Big Data fera de votre entreprise un précurseur et un potentiel influenceur sur l’écosystème encore en création.

Retrouvez bientôt la version anglaise sur le site du Women’s Forum

(1) Peer Research – Big Data Analytics, enquête menée par Intel IT Center, août 2012

(2) Big Data : the nnext frontier for innovation, competition and productivity, McKinsey Global Institute, Mai 2011