> Statistiques > Analyse de données > Fonction dist
Fonction dist
permet de calculer la matrice de distance entre les différentes lignes d'une matrice ou d'un vecteur :
- dist(c(4, 5, 3, 1)) : renvoie la matrice de distances entre chaque paire d'éléments.
- mat <- matrix(c(4, 5, 3, 1, 4, 5), nrow = 3); dist(mat) : renvoie la matrix de distances entre chaque paire de lignes de la matrice donnée.
Dans les deux cas, l'objet renvoyé est de la classe dist
dist(mat, diag = TRUE) : renvoie un objet dist, sauf que la diagonale est affichée (et elle est à 0).
dist(x, diag = TRUE, upper = TRUE) : renvoie un objet dist, sauf que la matrice complète est affchée (diagonale et demi-matrice supérieure).
as.matrix(myDist) : convertit en matrice un objet dist.
as.dist(myMatrix) : convertit en objet dist une matrice (en ne considérant que la sous-diagonale).
Différentes distances :
- dist(mat, method = "euclidean") : calcule la matrice de distance, avec la distance par défaut (euclidienne) et renvoie un objet de classe dist.
- dist(mat, method = "minkowski", p = 3) : distance avec la norme L3.
- dist(mat, method = "manhattan") : distance avec la norme L1.
- dist(mat, method = "maximum") : distance avec la norme L-infini (maxi de 2 composantes).
- dist(mat, method = "binary") : les vecteurs sont considérés comme binaires (1 si <> 0, 0 si 0) et la distance entre 2 vecteurs est la proportion de bits où seulement l'un des 2 est allumé sur le total où l'un au moins est allumé.
Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R