La Big Dataviz: Etape décisive pour le Big Data

keyrus - Sakil MAMODE ALLY

Une exclusivité Les-Experts.tech

Par Sakil MAMODE ALLY, Directeur Hub Data, Keyrus

Généralisée dans les environnements de Business Intelligence traditionnels, la visualisation de données (Dataviz) est un maillon décisif pour passer à une large exploitation du potentiel du Big Data à tous les niveaux de l’entreprise.

 

La digitalisation de la société met chaque entreprise à la tête d’un inépuisable trésor de données où elle pourra puiser en permanence pour trouver de nouveaux leviers d’efficacité et de nouvelles sources de création de valeur. La minimisation des exigences techniques et des expertises a laissé plus d’une entreprise dans l’incapacité de faire face à la réalité diluvienne du Big Data et d’exploiter cette masse de données pour gagner en performance et mieux piloter son activité.

 

S’ADAPTER A DES VITESSES ET DES VOLUMETRIES EN CONSTANTE EVOLUTION

Pour extraire l’intelligence de leurs données, les entreprises s’appuient sur des systèmes de Business Intelligence permettant aux utilisateurs d’interroger les données et de visualiser les résultats sous forme de rapports et d’indicateurs, sans être confrontés à la complexité sous-jacente des données. Historiquement, ces systèmes ne prenaient en compte que les données structurées générées par les applications de l’entreprise. Aujourd’hui, il s’agit de traiter des données de provenance et de formats divers dont la vitesse de production et les volumétries sont sans commune mesure avec ceux pour lesquels les environnements de BI traditionnels ont été conçus.

C’est l’objet même du Big Data de rendre exploitable l’ensemble des données que l’entreprise génère et peut collecter. Si un réceptacle tel qu’une base Hadoop – typiquement un lac de données (Data Lake) – peut centraliser les données de tous types sans limite quantitative, la difficulté est d’étendre la Dataviz à ce type d’environnement. La visualisation est un maillon clé de la chaîne puisqu’elle permet aux utilisateurs d’accéder à l’intelligence des données et de se concentrer sur les actions à valeur ajoutée.

 

DES ETAPES TECHNIQUES A NE PAS NEGLIGER POUR UN RESULTAT DE QUALITE

Il est illusoire de croire qu’il suffit de « pluguer » un outil de Data Visualisation sur un Data Lake pour étendre les bénéfices du Big Data à toute l’entreprise. Pour que les performances soient acceptables, un travail de structuration est indispensable.

Du fait de la diversité des données, les Data Lakes ne sont jamais organisés sous forme de bases de données relationnelles. Ce sont généralement des bases de type « NoSQL » n’obéissant pas au schéma en étoile/flocon¹ qui prévaut dans les environnements de BI traditionnels. Il existe cependant des stratégies pour interroger les données qui se trouvent dans un Data Lake avec des outils de type SQL. C’est typiquement ce que permettent de faire les outils on-Hadoop. L’autre possibilité est d’exposer les données par le biais de web services.

Quelle que soit l’option, la préparation des données est indispensable. Pour pallier l’impossible recours à un schéma en étoile, on dénormalise les données. Cette opération consiste à créer une table unique contenant toutes les données. Cette table est très volumineuse parce que les dimensions qui étaient mutualisées dans un modèle en étoile sont dupliquées, ce qui pose deux types de problèmes :

  • Des problèmes de cohérence des données, obligeant à avoir une politique de mise à jour et d’alimentation du Data Lake extrêmement rigoureuse.
  • Des problèmes de performance au niveau des requêtes et de la restitution, obligeant à pré-définir les périmètres et la granularité des requêtes de façon à constituer des sous-ensembles de données plus facilement exploitables par la Dataviz.

 

Quels que soient le modèle des données et la volumétrie, c’est un travail d’expert qui fait intervenir des outils intermédiaires, des mises en cache et des indexations. L’objectif est que la navigation reste agréable dans l’outil de Dataviz.

 

SOIGNER L’EXPERIENCE UTILISATEUR POUR DEMOCRATISER LE BIG DATA

Le but de la visualisation des données est de permettre aux utilisateurs de détecter facilement et rapidement une problématique dans leur activité. Des orientations d’action peuvent ensuite être suggérées par le biais d’une couche d’analyse intelligente. Mais c’est à l’expérience utilisateur qu’il faut veiller si l’on veut capitaliser sur la dimension visuelle.

Il est souvent nécessaire de guider les utilisateurs dans le choix des représentations visuelles pour qu’elles soient vraiment adaptées à leurs indicateurs.

S’appuyer sur les bonnes pratiques des spécialistes de l’UX et de la visualisation des données permet de construire des visualisations simples et épurées parce qu’elles mettent en valeur les indicateurs importants pour son activité. De même qu’il doit être protégé de la complexité et de l’hétérogénéité des données sous-jacentes par le travail de structuration des données et d’optimisation des requêtes réalisé par les ingénieurs de données, l’utilisateur final ne doit pas avoir d’effort à faire pour comprendre ce qu’il a devant les yeux et en tirer parti pour améliorer son activité. Une approche couplant ces deux dimensions – ingénierie des données et expertise UX – permet d’élever le niveau de data-alphabétisation des collaborateurs de l’entreprise et de démocratiser les usages du Big Data.

 

¹ Base structurée sous forme de tables reliées entre elles et où chaque table est reliée à des tables de dimension correspondant aux axes selon lesquels les faits peuvent être explorés et analysés.

 

Sakil MAMODE ALLY

Avec plus de 17 ans d’expérience dans les domaines de la Data Intelligence où il a notamment exercé des responsabilités de développement d’activités BI Data Reporting mais également de business development, Sakil a construit son style de management autour des valeurs humaines et technologiques qu’il met au service des clients et des collaborateurs.

Il rejoint Keyrus en 2016 comme responsable de la practice Smart Data à Paris pour répondre aux enjeux/besoins des clients de Keyrus  autour des problématiques de Dataviz et de Dataprep.

Avec son appétence au commerce et son background opérationnel, il a ensuite accompagné au développement du secteur Retail & CPG, tant sur les plans business et opérationnel que stratégique, avant de prendre la direction du Hub Data. Il a notamment pour mission d’accompagner Keyrus, autant les Sales, les Opérationnelles que l’avant-vente, sur des sujets autour de la Data.


 

Keyrus, créateur de valeur à l’ère de la Data et du Digital

 Acteur international du conseil et des technologies, spécialiste de la Data et du Digital, Keyrus a pour mission d’aider les entreprises à tirer profit du paradigme de la Donnée et du Numérique pour accroître leur performance, faciliter et accélérer leur transformation et générer de nouveaux leviers de croissance, et de compétitivité.

Plaçant l’innovation au cœur de sa stratégie, Keyrus développe une proposition de valeur unique sur le marché autour d’une offre novatrice qui s’appuie sur la combinaison de trois expertises majeures et convergentes : Data Intelligence / Digital Experience / Conseil en Management et Transformation.

Présent dans une quinzaine de pays et sur 4 continents, le Groupe Keyrus emploie plus de 3 000 collaborateurs.

%d blogueurs aiment cette page :