Modèle additif annonce légale

Lors de la création de modèles de machine learning, il n`est souvent pas suffisant de simplement faire des prédictions. Souvent, les développeurs de machine learning, les décideurs et les personnes affectées par les modèles doivent comprendre comment les modèles de machine learning prennent des décisions et quelles fonctionnalités contribuent à leur performance. Les modèles additifs généralisés (GAMs) sont utilisés en interne chez Microsoft pour l`explainabilité du modèle pour aider les développeurs de machine learning à créer des modèles de grande capacité qui peuvent être facilement interprétés par d`autres. Les GAMs sont une classe de modèles interprétables qui sont des modèles linéaires où les termes sont des fonctions non linéaires, appelées «fonctions de forme» d`une seule variable. En tant que modèles linéaires, ils sont facilement interprétés, mais parce que les modèles apprennent les fonctions des entités au lieu d`un seul poids, ils peuvent modéliser des relations plus complexes qu`un simple modèle linéaire. Le prédicteur GAM résultant a un terme d`interception qui représente la prédiction moyenne sur le jeu d`apprentissage et les fonctions de forme qui représentent l`écart par rapport à la prédiction moyenne. Les fonctions de forme peuvent être inspectées par les yeux pour voir la réponse du modèle à différentes valeurs d`une entité, et visualisées comme le graphique suivant qui est créé à la fin de l`exemple de code. Le formateur GAM dans ML.NET est implémenté en utilisant des arbres boostés par gradient de faible profondeur (par exemple souches d`arbres) pour apprendre les fonctions de forme non paramétrique, et est basé sur la méthode décrite dans modèles intelligibles pour la classification et la régression par Lou, Caruana, et Gehrke. Modélisation des séries temporelles paléoécologiques à l`aide de modèles additifs généralisés spécification de l`analyse. Ouvrez le fichier de données Program.

STA. Dans le menu exploration de données, sélectionnez modèles d`additifs généralisés pour afficher le panneau de démarrage des modèles d`additifs généralisés. Sélectionnez ensuite la distribution binomiale dans la liste distribution; la fonction de liaison logit sera automatiquement sélectionnée. Des covariables efficaces ont été choisies en suivant Wood (2001). Les covariables ont été supprimées des modèles si les trois critères suivants ont été remplis: (i) les degrés de liberté estimés étaient proches de 1; II) l`intervalle de confiance était nul partout; et (III) le score du GCV a diminué lorsque le terme a été abandonné. Les modèles avec les scores de GCV les plus bas ont été sélectionnés. Toutefois, si l`utilisation d`un modèle sélectionné a entraîné: (i) des biomasses de grande taille non réalistes par rapport à celles prédites par la méthode d`échantillonnage aléatoire stratifiée, ou (II) des erreurs de convergence dans l`estimation de l`incertitude de la biomasse, les covariables ont été supprimées jusqu`à ce que les niveaux de signification approximative de tous les termes plus lisses étaient < 0,001. Wood (2001) a indiqué que la suppression des termes est parfois subjective, et que si la suppression d`un terme aboutit à une légère modification du score de GCV, le terme devrait être supprimé.

Nous remercions le capitaine de RV “Takuyo-Maru”, Hiroaki Kimura, et son équipage qui nous ont aidés à collecter ce jeu de données précieux. L`étude a été menée dans le cadre de la composante côtière du JARPN II; Nous remercions les coordinateurs Hidehiro Kato (Université de la science et de la technologie marines de Tokyo) et Yoshihiro Fujise (l`Institut de recherche sur les cétacés) pour leurs précieux commentaires sur l`enquête. Kazushi Miyashita (Université d`Hokkaido) a gentiment fourni des commentaires critiques sur les méthodes d`analyse des données acoustiques. L`enquête a été soutenue par l`Agence des pêches du Japon, l`Agence de recherche sur les pêches du Japon, la préfecture de Miyagi et l`Institut de recherche sur les cétacés. Nous remercions ces institutions pour leur soutien. . Ce modèle est similaire à celui proposé par @Aaron, mais il est quelque peu différent en détail.

Comments are closed