Mis a jour le 2016-05-22, 16:22

caret

C'est un package qui permet d'appeler de nombreuses méthodes de machine learning en offrant une interface unifiée et qui comporte des fonctions utilitaires diverses. Appeler la fonction getModelInfo() pour avoir les informations grâce auxquelles caret sait utiliser les différentes librairies.
createDataPartition : permet de séparer un dataset en training et test :
createFolds : partitionne les données en plusieurs folds :
createResample : crée des échantillons de bootstrap (avec répétitions possibles).
preProcess : fonction pour préprocesser les features :
train : fonction pour faire l'apprentissage :
predict appliqué sur un objet train (fonction predict.train) : fonction pour faire la prédiction à partir du résultat de l'apprentissage :
featurePlot : permet de tracer la variable à predire en fonction de chacune des features sur un panel de graphes :
cut2 du package Hmisc : permet de convertir facilement une variable numérique en facteur correspondant à des intervalles de valeurs :
nearZeroVar : identifie les variables qui ne sont presque par variables et qu'on l'on peut donc éliminer pour la prédiction :
confusionMatrix : permet de créer une matrice de confusion (effectifs croisés de chaque couple de valeurs) ainsi que les statistiques associées à partir du facteur prédit et du facteur réel :

Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R