Le Machine Learning n’est rien sans les données!

mercredi, 29.11.2017

Xavier Comtesse*

A peine le «Swiss Data Forum 2017» s’est-il achevé, sur un beau succès, que se pointe déjà la thématique de 2018: le Machine Learning. Il faut comprendre la logique de Dominique Duay, grand organisateur de ces rencontres romandes, qui font chaque année date parmi les spécialistes de la donnée. Cette année encore, ils étaient plus de 200 à se réunir à l’Aquatis devenu depuis trois ans le rendez-vous de ces poissons «pilote» d’un genre particulier qui gobent les données des entreprises comme une nourriture essentielle à leur prospérité. La société selon eux est «conduite» par les données ou du moins par l’analyse intelligente de celles-ci...

Donc à l’ère du tout numérique, un champ prometteur fait de plus en plus parler de lui: le Machine Learning.

Mais de quoi parlons-nous exactement? Définition: Le Machine Learning, ou apprentissage automatique en français, est un domaine de recherche de l’intelligence artificielle. Le Machine Learning est l’étude d’un type spécial d’algorithmes: les algorithmes auto-apprenantes. Ceux-ci utilisent l’analyse de données pour évoluer de manière efficace.

Face à l’augmentation massive du volume de données stockées par les entreprises, ces dernières doivent faire face à de nombreux défis tels que la compréhension des masses de données ainsi stockées, l’intégration des données dans les activités de l’entreprise, ou encore à l’accessibilité des données IoT, etc. Le Machine Learning peut s’avérer très utile pour relever ces différents défis.

En effet, toutes les entreprises accumulent au fil du temps de grandes quantités de données qui demeurent inutilisées. Grâce au Machine Learning et aux différents algorithmes qui lui sont liés, il est possible de faire le tri parmi ces différents types de données stockées. Par la suite, un humain qualifié (data scientist) peut les passer en revue et y apporter les décisions nécessaires.

Pour la rétention de données, cette pratique peut également s’avérer efficace. Le Machine Learning peut identifier les données qui ne sont pas utilisées et suggérer lesquelles peuvent être supprimées. Même si les algorithmes n’ont pas la même capacité de discernement que les êtres humains, le Machine Learning permet de faire un premier tri dans les données. Ainsi, les entreprises économisent un temps précieux avant de procéder à la suppression définitive des données obsolètes.

Le Machine Learning est aussi utile pour l’intégration des données qu’ils doivent agréger pour leurs activités. Les «data scientist» créent généralement une base de données dans lequel ils placent différents types de données en provenance de sources variées pour créer un bassin de données analytique. 

Pour ce faire, il est nécessaire de développer des méthodes d’intégration pour accéder aux différentes sources de données. Cette technique peut faciliter le processus en créant du «mapping» entre les sources de données et les bases de données. Cela permet de réduire le temps d’intégration et d’agrégation.

Enfin, l’apprentissage des données permet d’organiser le stockage de données pour un meilleur accès. Au cours des cinq dernières années, les vendeurs de solutions de stockage de données ont mis leurs efforts dans l’automatisation de la gestion de stockage. Ainsi, l’optimisation n’a pas besoin d’être effectuée manuellement.

Mais désormais, l’ère du «Machine Learning» s’ouvre à tous.

*Mathématicien, digital shaper 


 

 
 

 
 
agefi_2017-11-29_mer_02



...