Programme du cours

2 jours (14 H) | 1-BData-3Renseignez-vousCette formation vous intéresse ? 
 

Objectifs

L’objectif est, à partir d’une plateforme Big Data, apprendre à manipuler les flux entrants et sortants pour construire un modèle de données exploitable. Une plateforme Big Data qui ne restitue pas de données aux métiers et aux décideurs de l’entreprise n’apporte aucune plus-value à la société.
Les processus d’alimentation et d’agrégation seront détaillés ainsi que les différentes techniques d’accès aux données. Cette formation s’adresse en particulier aux personnes désireuses d’apprendre la construction d’un Big Data d’un point de vue « donnée » et non « infrastructure ».

Contenu

Introduction

  • Origine du Big Data, les nouvelles problématiques des SI
  • Apparition de nouveaux métiers (datascientist, scalability architecture)

Architecture d’entreprise avec Hadoop (1ère partie)

  • Alimentation des données
    • Concept des ETL
    • Focus sur le leader des ETL Big Data : TALEND
    • Open Data
  • Processing et technologies d’agrégation (PIG, HIVE, HQL)
  • Stockage des informations
    • HDFS
    • Format des données

Travaux pratiques sur la manipulation des données

  • Mise en pratique des techniques de processing et d’agrégation (PIG, HIVE)
    • Création de tables
    • Création d’index
    • Création de scripts

Travaux pratiques sur les traitements d’alimentation

  • Construction d’un modèle de données
  • Installation de Talend Big Data (ETL leader du marché)
  • Alimentation des données
  • Suivi et exploitation des traitements de chargement

Restitution

Architecture Big Data Hadoop (2ème partie)

  • Restitution de la donnée
    • Branchement avec des outils de reporting existants (QlikView, BO)
    • Création de requêtes ad-hoc (HUE, Drill)
    • Big Data, fournisseur d’API

Différence entre Big Data et Business Intelligence

  • Scalabilité horizontale VS verticale
  • Modèle en étoile VS Modèle de données répliquées
  • Analyse décisionnelle VS Données opérationnelles

Travaux pratiques sur la restitution des données

  • Installation d’un outil de reporting QlikView
    • Manipulation des données
    • Construction de rapports
    • Aperçu des fonctionnalités
  • Exploration des données de la plateforme avec HUE
    • Mises en place de niveaux de sécurité
    • Requete de type Search
    • Aperçu des fonctionnalités

Discussion autour d’un retour d’expérience

  • Retour d’expérience dans le domaine du E-COMMERCE et du MARKETING

Conclusion

 
Cette formation vous intéresse ? Renseignez-vous