Sélectionner une page

Objectifs de la formation

  • Utiliser R et Python dans le cadre de modèles d'apprentissage et de fonctions algorithmiques

Participants / Pré-requis

  • Cette formation s’adresse au profil métier orienté Data Scientist

  • Bonnes bases de statistiques et de data mining

Moyens pédagogiques

  • Formation avec un formateur, dans une salle dédiée à la formation, équipée d'un vidéoprojecteur, d'un tableau blanc ou à distance dans le cas de solutions de Digital Learning
  • 1 poste de travail par stagiaire adapté aux besoins de la formation + 1 support de cours et/ou un manuel de référence au format numérique ou papier
  • Modalités pédagogiques : Exposés – Cas pratiques – Synthèse

Programme

1. Généralités

  • Présentation et installation du logiciel R
  • GUIs et IDEs
  • Prise en main et premiers pas
  • Fonctions et packages
  • Utilisation des aides

2. Rappel des concepts de base du Data Mining

  • Introduction à R - Concepts de base
  • Syntaxe
  • Type de données
  • Import/Export de données
  • Manipulation des librairies

3. Manipulation des données

  • Rappels des grandeurs statistiques de bases
  • Calcul des grandeurs statistiques de bases avec R
  • Aperçu des types de visualisation courants en Data Mining
  • Fonctions et librairies de base de visualisation avec R

4. Data Preprocessing

  • Data Cleaning
  • Data Reduction (Analyse en composantes principales)
  • Data Preprocessing et ACP avec R

5. Règles d'association

  • Rappels théoriques de l'algorithme Apriori
  • Application et exploitation des règles d'association avec R

6. Classification et Regression

  • Règles bayesiennes naïves
  • Rappels théoriques
  • Initiation à la librairie "e1071" de R
  • Arbre de décision CART
  • Rappels théoriques
  • Initiation à la librarie "party" de R
  • Arbre de décision RandomForest
  • Rappels théoriques
  • Initiation à la librairie "randomForest" de R
  • Régression linéaire
  • Rappels théoriques
  • Initiation à la fonction lm() de R

7. Clustering

  • Centroid-based clustering
  • Algorithme du K-means
  • Fonction kmeans de R
  • Hierarchical clustering
  • Concepts théoriques
  • Fonction hclust de R
  • Density-based clustering
  • Concepts théoriques
  • Application dans R

8. Outils de support à R

  • Data preprocessing avec Dataiku
  • Utilisation de R dans Dataiku

Intéressé par une de nos formation ? Inscrivez-vous ou contactez votre conseiller AFIB !

Intéressé par une de nos formations ? Inscrivez-vous ou contactez votre conseiller AFIB !