Ref: DS 03

Pré requis

  • Connaissances de base en analyse décisionnelle. Connaissances de base en statistiques

Public

  • Responsables Infocentre, responsables marketing, statisticiens, responsables informatiques, chefs de projets et experts décisionnels. Utilisateurs et gestionnaires métiers de bases de données.

Objectifs

Cette formation vous apprendra à :

  • Comprendre les principes et la finalité du Data Mining (DM)
  • Identifier les principales techniques du DM et leur cas d’utilisation
  • Mettre en oeuvre sur un cas simple les méthodes de scoring et de géomarketing
  • Découvrir les méthodes prédictives et les méthodes descriptives du DM
  • Connaître les principales étapes d’un projet Data Mining

Durée

  • 2 jours

Moyens pédagogiques

  • Alternance d’exposés et d’applications pratiques.
  • Les moyens pédagogiques et les méthodes d’enseignement utilisés sont principalement : aides audiovisuelles, documentation et support de cours, exercices pratiques d’application et corrigés des exercices pour les stages pratiques, études de cas ou présentation de cas réels pour les séminaires de formation.

Programme

Le Système d'Information Décisionnel (SID)

  • Les enjeux du SID : besoins, domaines d’application.
  • Architecture type d’un SID, état de l’art.
  • Elaboration des informations décisionnelles.
  • Conception d’un SID : étapes, optimisation, organisation des données, dictionnaires.

Comprendre le Data Mining (DM)

  • Définition et finalité du Data Mining (DM).
  • Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l’informatique ?
  • Différence entre DM et OLAP ?
  • Les attentes des entreprises, les réponses du DM.

Les techniques du Data Mining

  • Apprendre à réduire la complexité d’un
    problème pour le résoudre
  • Data augmentation : création de nouvelles
    variables pour aider à résoudre le problème

La méthode descriptive du Clustering

  • Définition et méthodologie.
  • Les critères pour structurer les données à classer.
  • Evaluation et validation des classes obtenues.
  • Les différentes sous-familles du Clustering.

Application
Présentation d’applications du Clustering.

Exemples d'application du DM

  • Le scoring : définition, finalité, méthodologie.
  • Le géomarketing : définition, finalité, méthodologie.

Application :
Mise en œuvre de la méthode de scoring. Cas pratique d’utilisation de géomarketing.

Les données de l'entreprise

  • Rappel de la problématique des données du SI.
  • Qualité des données et administration des données.
  • Processus de collecte et d’exploration.
  • Création d’agrégats et de nouvelles données.
  • Transformation des données.

Méthodologie de projet Data Mining

  • Définition du problème métier à résoudre et des objectifs à atteindre.
  • Inventorier, décrire et classer les données.
  • Concevoir et alimenter la base Data Mining.
  • Explorer, segmenter des entités analysées.
  • Etablir et appliquer les modèles d’analyse.

Panorama des outils

  • Principaux outils du marché : SAS, R, IBM SPSS…
  • Zoom sur l’outil SAS et sur l’ETL Powercenter.
  • Quels critères de choix pour ce type d’outils ?
  • Itérer, déployer auprès des utilisateurs.
  • Maintenir le modèle et le logiciel associé.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

fr_FR
en_GB fr_FR