Ref: ST 014

Pré requis

  • Connaissances de base en statistiques (régressions, analyse en composantes principales, classification) et des concepts de programmation.

Public

  • Etudiants, Chercheurs, Doctorants, Utilisateurs finaux, statisticiens, analystes type Data Miner, Chefs de projets…

Objectifs

  • Installer l’environnement d’analyse R
  • Utiliser la console de R, et les environnements de travail Tinn-R et RStudio
  • Créer et regrouper plusieurs types d’objets de R
  • Créer des programmes d’analyse avec R
  • Elaborer des graphiques avec R
  • Utiliser les packages de R pour mettre en oeuvre des modélisations statistiques (régression, ACP…)

Durée

  • 2 jours

Moyens pédagogiques

  • Alternance d’exposés et d’applications pratiques.
  • Les moyens pédagogiques et les méthodes d’enseignement utilisés sont principalement : aides audiovisuelles, documentation et support de cours, exercices pratiques d’application et corrigés des exercices pour les stages pratiques, études de cas ou présentation de cas réels pour les séminaires de formation.

Programme

INTRODUCTION

  • Présentation du logiciel R et de ses fonctionnalités.
  •  Avantages et inconvénients.
  •  Accès au site de téléchargement de l’outil et installation
  •  Installation de l’environnement d’analyse
  •  Environnement de base (console, script).
  •  Utilisation de la console.
  •  Création et sauvegarde d’un script.
  •  Le répertoire sous R Installation.
  •  Aide et commentaires.
  •  Les autres éditeurs Tinn-R et R Studio.
  •  Création de scripts

Objets et notions de programmation R

  • Les objets de type vecteurs, matrix, array, factor, data.frame, list.
  •  Manipulation des objets, classe d’objet, fonctions spécifiques, jointure.
  •  Sauvegarde, suppression de mémoire.
  •  Notions de boucle (for et while), condition (if), switch.
  •  Manipulation des types d’objets

GESTION DE L’INSTANCE

  • Méthodes de contrôle d’identification
  • Démarrer une instance
  • Arrêter la base de données
  • Redémarrage rapide après un crash d’instance

Création et utilisation de fonctions

  • Structure d’une fonction.
  •  Fonctions de type mathématique.
  •  Fonctions de type chaîne de caractères.
  •  Fonctions liées au temps/date.
  •  Opérations ensemblistes.
  •  Les tables de contingences.
  •  Création et utilisation de fonctions

Génération, gestion et visualisation des données

  • Les données : séquences régulières et aléatoires.
  •  Données exemples de R.
  •  Importation et exportation de données.
  •  Modifier les données d’un objet.
  •  Exemples de graphiques construits avec R.
  •  Création des graphiques de base.
  •  Les options graphiques, partager une fenêtre graphique, sauvegarder un graphique.
  •  Exercice d’application sur les données.

Analyses statistiques

  • Présentation de la notion de package (librairie).
  •  Télécharger/charger des packages.
  •  Quelques packages utiles.
  •  Cas de la régression linéaire multiple.
  •  Cas de l’ANOVA et le test t-student
  •  Cas de la régression logistique
  •  Cas de l’analyse en composantes principales ACP.
  •  Cas de la classification CAH
  •  Exercice d’application sur les packages
en_GB
fr_FR en_GB