La pyramide de la valeur

lundi, 09.09.2019

Xavier Bays*

Xavier Bays

Deepmind a développé une IA qui anticipe la survenue de lésions rénales. Largo FIilms prédit les succès au box-office. Netflix devine la prochaine série préférée d’un spectateur. Tesla développe cinq nouvelles méthodes de prévention d’accident. Quel est le point commun entre ces applications de la data science? Elles ont toutes pour objectif de fournir une prédiction. Si la majorité des progrès dans le domaine transmis par les médias concerne l’analyse prédictive, la réalité du terrain n’est pas toujours la même. Le chemin menant à la prédiction peut être long et semé d’embûches. Il y a des étapes qu’il ne faut pas brûler et il est impératif de respecter la pyramide de la valeur.

La pyramide de la valeur est constituée de trois étages: la description, l’explication et la prédiction. Le premier est le fondement de toute analyse de données. Il répond à la question «Quoi?». C’est le reporting. Les entreprises sont généralement bien équipées dans ce domaine, avec des statistiques qui comptent et décrivent le passé. Si la plupart d’entre elles le réalisent à l’interne, il arrive que des entreprises fassent appel à des data scientist, particulièrement bien armés pour dénicher des incohérences ou des erreurs grâce à leur approche rigoureuse.

L’analyse explicative constitue le deuxième étage de la pyramide. Du passé, elle ancre l’analyse dans le présent. Elle répond à la question «Pourquoi?». On ne se contente alors plus d’observer des processus mais on en cherche leurs causes. L’analyse explicative met en avant les liens entre les données, les relations qui y sont cachées. Le data scientist dispose de nombreux outils pour effectuer ses recherches, mais le meilleur moyen de parvenir à ses fins reste sans doute la compréhension des données. Il se doit donc de s’appuyer et de confronter ses observations avec l’expert métier, soit la personne qui travaille au quotidien dans le domaine en question.

Les demandeurs de cette analyse explicative sont divers et nombreux. Une application de plus en plus souhaitée est l’explication de phénomènes liés aux chaînes de production complexes. En effet, il arrive que des dizaines, voire des centaines de paramètres entrent en jeu et se croisent dans un même processus de fabrication. L’expert-métier (ou l’être humain en général) est perdu face à tant de tenants et aboutissants. L’analyse de données peut alors lui apporter du soutien, confirmer ses intuitions, ou encore offrir un nouveau point de vue par rapport à sa problématique.

La dernière marche de la pyramide est l’analyse prédictive. Comme son nom l’indique, l’objectif est de deviner le résultat d’une situation basée sur les données. Cet avenir peut être plus ou moins lointain selon le besoin: prédire la qualité à la fin d’une chaîne de production dans une heure, prédire la consommation d’une clientèle pour le lendemain, prédire la prochaine panne sur une machine dans une fenêtre temporelle maximale. L’analyse prédictive est évidemment un vaste sujet qui mériterait sa propre chronique. Nous aurons le plaisir d’en reparler ultérieurement.

Comprendre pour mieux prédire est une maxime qui ne devrait jamais quitter l’esprit des data scientist. D’ailleurs, lors de compétitions d’analyse de données, les modèles construits de manière intelligente basés sur la compréhension des enjeux et des données détrônent encore souvent les modèles en «boîtes noires».

* Data Scientist et cofondateur, Swiss Statistical Design and Innovation





 
 
 

...