Best Software for 2025 is now live!

What is “overfitting”?

I've heard the term "overfitting", can you explain to me what this means?
1 commentaire
On dirait que vous n'êtes pas connecté.
Les utilisateurs doivent être connectés pour répondre aux questions
Se connecter
Qlik AutoML
Réponse officielle
Qlik AutoML
David C.
DC
Director of Product Marketing
0
« Surapprentissage » signifie qu'un modèle est trop complexe et, par conséquent, peu fiable pour prédire de nouvelles données. Le surapprentissage a tendance à se produire lorsqu'il y a trop de variables par rapport au nombre de points de données disponibles. Par exemple : vous pouvez n'avoir que 50 lignes de données et 100 variables (colonnes) dans le jeu de données. Le modèle prédictif peut utiliser toutes les variables pour élaborer une série de règles compliquées qui fonctionnent bien avec les données utilisées pour entraîner le modèle, alors qu'en réalité, la métrique prédite peut être influencée par seulement un ou deux prédicteurs. En règle générale, plus c'est simple, mieux c'est. Plus de variables sont introduites dans un modèle, plus il existe d'erreurs qui peuvent potentiellement masquer la véritable relation sous-jacente que vous souhaitez découvrir.
On dirait que vous n'êtes pas connecté.
Les utilisateurs doivent être connectés pour écrire des commentaires
Se connecter
Répondre