> Statistiques > Analyse de données > Régression linéaire généralisée
Régression linéaire généralisée
C'est un modèle de type y = f(b0 + b1.x1 + b2.x2 + e) si par exemple on a 2 variables explicatives x1 et x2 et y est la variable dépendante. e est l'erreur sur la prédiction et il s'agit de trouver les meilleurs coefficients b0, b1 et b2 pour minimiser e. f est la fonction lien
On peut utiliser glm pour les regressions linéaires généralisées :
lin <- glm(y ~ x + u, family = "binomial") où x et u sont les variables explicatives et y la variable dépendante, et family indique la fonction lien et la distribution des erreurs :
- family="gaussian" : la fonction est l'identité et la distribution des erreurs est gaussienne. C'est donc équivalent à une regression linéaire simple, comme avec la fonction lm.
- family="binomial" : la fonction lien est logit (logit(x) = 1 / (1 + exp(-x))).
- family="poisson" : la fonction lien est la fonction log (utile quand la variable à estimer est un comptage et que la dépendance est log-linéaire.
Copyright Aymeric Duclert
programmer en R, tutoriel R, graphes en R