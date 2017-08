Big Data: un concept à démystifier

vendredi, 18.08.2017

C’est parce qu’ils maîtrisent ce savoir-faire que les géants du net arrivent à détecter de nouvelles opportunités.

Patrice Bièvre*



Aujourd’hui le Big data est sur toutes les lèvres, mais combien d’entre nous savent réellement ce qui se cache derrière ce terme. Dans un univers où fréquemment nous prenons des décisions sous l’influence du tout nouveau tout beau, un peu de pédagogie s’avère nécessaire pour aider les décideurs peu, au fait, ou friand de nouvelles technologies à éviter les erreurs de casting.

Selon Bruno Cirousel, CEO de Business Investigation, aujourd’hui nous assistons à une explosion du volume des données dans le monde. Pour faire face à ce phénomène appelé Big data, les entreprises ont besoin de se doter de nouvelles technologies leur permettant d’exploiter au mieux cette masse accrue d’informations. C’est parce qu’ils maîtrisent ce savoir-faire que les géants du net (Google, Facebook, Amazon) arrivent à détecter tous les jours de nouvelles opportunités d’affaire au sein de leur portefeuille de clientèle. L’essentiel de ces nouveaux outils gravitent autour de l’intelligence artificielle, en particulier autour d’une de ces disciplines phares le machine learning.

Le machine learning

A l’aide du machine learning, on va concevoir des algorithmes de traitement auto apprenants qui vont remplir deux fonctions essentielles classifier les informations et faire de la prédiction. Pour ceux qui ne le savent pas, un algorithme est un ensemble d’instructions itératives qui vont permettre de résoudre un problème spécifique. Ces algorithmes développés dans le cadre du machine learning s’appuient essentiellement sur des statistiques et des probabilités poussées. Ils permettent d’analyser des données actuelles ou passées afin de détecter des tendances permettant d’anticiper le futur. Si nous prenons le cas du secteur bancaire, parmi les sujets, le plus fréquemment traités par l’analyse prédictive, il y a la détection des transactions bancaires frauduleuses ou l’évaluation du risque de non remboursement d’un crédit à partir de l’historique financier d’un emprunteur.

Avec le temps et l’expérience, les chercheurs se sont constitués des bibliothèques entières d’algorithmes dont la plupart ont été depuis implémentées dans différents outils ou boite à outils informatiques. C’est le cas de Watson la solution machine learning d’IBM. A notre époque, une entreprise qui veut assurer sa pérennité se doit de bien identifier les problématiques auxquelles elle est confrontée, trouver le bon algorithme qui va les résoudre et le paramétrer correctement. En général, cette nouvelle mission incombe à un nouvel acteur le data scientist. Son rôle consiste à donner du sens et de la valeur aux données.

Autre famille d’algorithmes

A côté de cela, il y a une autre famille d’algorithmes disposant de modules intelligents capables de remplacer le data scientist, mais ceci au prix d’une restriction du périmètre des questions à traiter. C’est le cas notamment de GPS, l’algorithme développé par la société Business Investigation qui se focalise uniquement sur les questions de performance, de risque et de conformité. Cette approche est idéale pour réduire au strict minimum les biais statistiques. Rappelons qu’ils sont à l’origine de la plupart des erreurs constatées dans le résultat d’une étude. En matière d’analyse prédictive on peut être confronté, à trois grandes catégories de biais, une question mal posée, des confusions au niveau des relations de cause à effets et le biais de sur ou sous apprentissage. Parmi les institutions les plus connues à en avoir été victimes, il y a l’armée américaine.

Lors de la seconde guerre mondiale, l’aviation américaine a réalisé des statistiques sur les avions qui revenaient de mission avec des dégâts provoqués par des tirs ennemis. L’objectif était d’identifier les parties d’un avion le plus susceptibles d’être touchées lors d’un affrontement, en vue de les renforcer. Aborder le problème sous cet angle fut une erreur manifeste, car dans tous les cas de figure ces dégâts n’empêchaient l’avion de retourner à la base. Il eut mieux valu se concentrer sur les impacts susceptibles de provoquer la chute de l’avion. C’est pour les aider à éviter tous ces écueils, que la société Business Investigation a décidé de proposer des formations sur le sujet, dès la rentrée prochaine, à tous ceux de ces futurs clients qui en feront la demande.

