Les data platforms, une gestion des données et des référentiels centralisés

Temps de lecture : 4 minutes

Au vu de la multiplication des données récoltées par les entreprises et dans un but d’amélioration du processus de traitement de la donnée, depuis la collecte jusqu’à l’utilisation, les grandes Maisons de luxe sont amenées à implémenter des data platforms. Dans cet article, nous vous proposons un premier niveau d’explication et d’éclairage sur l’utilisation des data platforms.

 

Qu’est-ce qu’une Data Platform ?

 

Une data platform est une solution complète pour ingérer, traiter, gouverner, analyser et présenter des données de tous types (structurées et/ou non structurées) générées par les différents systèmes de l’entreprise et des données externes (données financières, marketing, logistiques, commerciales, open data, …). Il s’agit donc de l’ensemble du système de gestion des datas (briques software et hardware) hébergé sur un cloud public et consommé “as a service”.

 

Quels sont les bénéfices pour l’entreprise ?

 

  • Facilitation de la gouvernance globale de la donnée : processus de gestion des droits d’accès aux données, gestion de la qualité des données, lineage des données, centralisation et partage des définitions communes (data glossary)
  • Unification et diffusion des KPIs : Partage des méthodes de calcul communes et des KPIs calculés pour l’ensemble de l’organisation

 

 

Comment la donnée est-elle enrichie dans la Data Platform ?

 

Il s’agit de l’une des fonctionnalités fortes des data platforms : enrichir les données collectées. L’enrichissement peut être vu de différentes façons et prendre différentes formes :

  • Amélioration de la qualité des données collectées via des process globaux et des outils centralisés de gestion de la qualité des données (faisant parfois appels à des algorithmes d’intelligence artificielle et/ou des services tiers comme la vérification de validité des emails)
  • Standardisation de certains champs pour permettre une analyse globale (ex pour un champ « Pays » : la valeur FR est indiquée pour France dans toutes les données “Pays”)
  • Création de KPIs tels que la segmentation des clients
  • Création de “scores” suite à l’analyse comportementale des clients et prospects

 

Quels sont les utilisateurs concernés ?

 

On peut scinder les utilisateurs d’une data platform en deux groupes :

  • Les utilisateurs business ou “métiers” qui vont “consommer” les données au travers d’outils de data vizualisation, de dashboarding ou encore d’analyse de données en fonction de leurs besoins et objectifs.
  • Les profils “data” de l’entreprise tels que les data scientists qui vont utiliser les données à leur disposition pour faire ressortir des tendances, repérer des signaux faibles ou encore faire de l’analyse prédictive en s’appuyant sur l’algorithmie et l’intelligence artificielle.

 

Cliquer sur l’image pour l’agrandir.

 

Conclusion

Le marché des data platforms est dominé par trois acteurs majeurs : Microsoft, Google, et Amazon. Leurs produits respectifs partagent un grand nombre d’avantages comme la force de calcul, la scalabilité et la possibilité d’utiliser toutes les solutions software de traitement et d’utilisation de la data (collecte de données, data management, datastorage, data vizualisation, datascience, IA, …). En plus de toutes ces solutions proposées, les data platforms donnent également la possibilité d’intégrer des technologies externes, comme par exemple des solutions software de datacatalog. Cela permet aux entreprises de conserver les solutions sur lesquelles elles ont investi en acquisition et en savoir-faire de leurs équipes. L’une des grandes problématiques actuelles du marché est le choix de l’architecture cloud utilisée dans la data platform. Les entreprises ont le choix entre tout héberger sur un même cloud ou faire du multicloud. Ce choix n’est pas uniquement technique ou technologique, mais bien évidemment stratégique et politique.