en savoir plus
Permet à tous ses détenteurs d'obtenir 5% de réduction sur tous les livres lors du retrait en magasin (réduction non cumulable avec les réductions de type étudiant).
Offre également un certain nombre d'avantages auprès de nos partenaires.
Avec les favoris, retrouvez dans un espace les sélections effectuées au fur et à mesure de vos navigations dans le site.
Constituez pour votre usage personnel vos listes de livres en prévisions d'achats futurs et votre sélection d'articles, dossiers, événements, vidéos ou podcasts préférés ou à découvrir plus tard...
Il suffit simplement de cliquer sur "Ajout Favori" sur chaque page qui vous intéresse pour les retrouver ensuite dans votre espace personnel.
Requiert un compte Mollat
Requiert un compte Mollat
L'ouvrage couvre l'essentiel des connaissances pour comprendre et appliquer les techniques du data mining et de la statistique décisionnelle. Il présente les méthodes classiques (analyse factorielle, régression linéaire, arbres de décision, etc.) ainsi que les plus récentes (régressions robustes, réseaux de neurones, etc.), et aborde l'exploration, le contrôle et la préparation des données. ©Electre 2025
Data science, Statistique et Machine learning
Depuis la première édition de cet ouvrage, il y a vingt ans, les méthodes et les outils de la science des données ont beaucoup évolué.
Avec l'arrivée des big data, les bases de données sont de plus en plus volumineuses et variées, provenant de la finance, de la médecine, de l'industrie, des objets connectés, ou encore des textes et images du Web. Mais si l'on parle de « data science » et plus de « data mining », il s'agit toujours d'entraîner des modèles à extraire des informations dans ces bases de données, à détecter des tendances et à faire des prédictions.
Les méthodes de modélisation vont de la statistique la plus théorique à des réseaux de neurones profonds si puissants qu'on parle à leur sujet d'intelligence artificielle. Nous mentionnons les plus récents, les transformers, à la base des grands modèles de langage popularisés par ChatGPT. Malgré la diversité de ces méthodes et de leurs applications, elles s'appuient toutes sur des principes fondamentaux exposés dans l'ouvrage. En apprentissage supervisé, un modèle est une expression mathématique, combinant des fonctions décrites par des paramètres, prenant des données en entrée et donnant en sortie un résultat qui doit être le plus proche possible d'un résultat attendu : pour cela, on ajuste les paramètres à l'aide d'algorithmes d'optimisation, en recherchant aussi la généralité, l'explicabilité et la rapidité de calcul du modèle. En apprentissage non supervisé, un modèle ne vise pas à prédire un résultat mais à détecter des structures dans les données.
Cet ouvrage propose une présentation claire et détaillée des méthodes supervisées (analyse discriminante, régression logistique, modèles linéaires généralisés, régression pénalisée, réseaux de neurones, algorithmes génétiques, machines à vecteurs de support, arbres de décision, forêts aléatoires, gradient boosting, etc.) et non supervisées (analyse factorielle, classification automatique, etc.), illustrées de nombreux exemples réalisés avec les logiciels libres R et Python et les logiciels commerciaux SAS et IBM SPSS, lesquels sont aussi comparés en détail dans un chapitre spécifique.
Il aborde aussi les aspects méthodologiques de la conduite des projets jusqu'aux facteurs de réussite et aux pièges à éviter, en passant par l'évaluation, la comparaison des modèles, et leur insertion dans les processus opérationnels.
Un guide indispensable pour tous ceux qui souhaitent comprendre et maîtriser les fondements et les avancées de la science des données.
Paru le : 11/09/2025
Thématique : Management- Théories et généralités
Auteur(s) : Auteur : Stéphane Tufféry
Éditeur(s) :
Technip
Collection(s) : Non précisé.
Contributeur(s) : Préfacier : Gilbert Saporta
Série(s) : Non précisé.
ISBN : 978-2-7108-1201-2
EAN13 : 9782710812012
Reliure : Broché
Pages : XXIV-999
Hauteur: 24.0 cm / Largeur 17.0 cm
Épaisseur: 4.5 cm
Poids: 1512 g