Glossaire Intelligence Artificielle : Overfitting

à supprimer certaines branches de l’arbre afin d’éviter qu’il ne devienne trop spécifique aux données d’entraînement. Dans les réseaux de neurones, cela peut se traduire par la réduction du nombre de couches ou de neurones. Un modèle plus simple a généralement une meilleure capacité de généralisation.

Validation croisée

La validation croisée est une méthode permettant d’évaluer la robustesse d’un modèle en divisant les données en plusieurs sous-ensembles (ou folds). L’entraînement se fait sur une partie des données, tandis que la validation est effectuée sur les autres. La technique la plus courante est la validation croisée en k-folds, où les données sont divisées en k sous-ensembles et le modèle est entraîné k fois en utilisant une partie différente comme ensemble de validation à chaque itération. Cela aide à éviter le surajustement en garantissant que le modèle ne s’adapte pas trop à un seul ensemble de données.

Régularisation

La régularisation est une approche qui ajoute une pénalité aux modèles trop complexes. Deux techniques populaires sont utilisées :

Régularisation L1 (Lasso) : Elle encourage la suppression de certains paramètres, ce qui peut aider à sélectionner les caractéristiques les plus pertinentes.
Régularisation L2 (Ridge) : Elle réduit la magnitude des coefficients du modèle sans les annuler complètement, rendant le modèle plus stable et moins sensible aux variations des données d’entraînement.

Augmentation des données

Dans le cas des modèles d’apprentissage supervisé, augmenter la quantité et la diversité des données peut réduire le surajustement. Par exemple, en vision par ordinateur, des techniques comme la rotation, le zoom ou le changement de luminosité des images permettent d’entraîner un modèle sur un ensemble plus varié et de le rendre plus robuste face à de nouvelles données.

Dropout

Le dropout est une technique spécifique aux réseaux de neurones consistant à désactiver aléatoirement un certain pourcentage de neurones à chaque itération d’entraînement. Cela empêche le réseau d’apprendre trop fortement des relations spécifiques aux données d’entraînement et favorise une meilleure généralisation.

En combinant ces différentes approches, il est possible de minimiser les risques de surajustement et d’obtenir des modèles plus performants en conditions réelles.

Surajustement (overfitting)

Définition

Comprendre le surajustement

Définition du surajustement

Illustration du surajustement

Historique du surajustement

Origines du concept

Évolution avec l’apprentissage automatique

Causes du surajustement

Complexité excessive du modèle

Taille insuffisante de l’ensemble de données

Bruit dans les données

Conséquences du surajustement

Performance dégradée sur de nouvelles données

Complexité inutile du modèle

Techniques pour éviter le surajustement

Validation croisée

Régularisation

Arrêt anticipé (Early Stopping)

Réduction de la complexité du modèle

Validation croisée

Régularisation

Augmentation des données

Dropout

En bref

Aller plus loin

Sur le site :

Sur le Web :

Continuer sur le site

Glossaire de l'IA

Astuces

Cours en ligne

Formations