Quantification
La quantification, en contexte d’IA, fait souvent référence au processus de réduction de la précision des paramètres d’un modèle (comme les poids d’un réseau de neurones) pour réduire la taille du modèle et accélérer l’inférence, tout en essayant de maintenir la performance.
Exemple : Pour déployer un modèle d’IA sur un smartphone, les chercheurs peuvent quantifier le modèle pour qu’il fonctionne efficacement sans compromettre significativement l’exactitude des prédictions.
Retourner à l'index du lexique