Mis a jour le 2016-05-22, 16:22

Manipulation de données

colsplit : permet de splitter un vecteur selon un sépateur pour en faire un dataframe (inverse de paste) :
v <- c("A-a-1", "B-b-2", "C-c-3")
colsplit(v, split = "-", names = c("upper", "lower", "digits"))
donne :
  upper lower digits
1     A     a      1
2     B     b      2
3     C     c      3
  
melt : permet de réarranger un dataframe pour empiler les lignes partageant certaines valeurs des variables identifiant, en indiquant le nom et la valeur de la variable mesurée :
cast : permet de faire l'inverse de melt :
expand.grid.fr : permet de faire toutes les combinaisons de lignes de 2 frames :
expand.grid.df(data.frame(x = c("a", "b", "c")), data.frame(y = c("A", "B", "C")))
  
donne
  x y
1 a A
2 b A
3 c A
4 a B
5 b B
6 c B
7 a C
8 b C
9 c C
  
rescaler : permet de rescaler une variable selon différentes stratégies :
untable : repète les lignes d'un dataframe autant de fois qu'indiqué :
untable(fr, c(1, 4, 2, 2, 2))
  
le vecteur doit indiquer pour chaque ligne combien de fois la répéter (1 fois pour la première, 4 fois pour la seconde, etc ...)

Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R