Les Data Sciences De A À Z
Dernière mise à jour : 11/2017
MP4 | Video: h264, 1920x1080 | Audio: AAC, 44.1 KHz
Language: Français | Size: 4.58 GB | Duration: 19h 30m
Dernière mise à jour : 11/2017
MP4 | Video: h264, 1920x1080 | Audio: AAC, 44.1 KHz
Language: Français | Size: 4.58 GB | Duration: 19h 30m
Data Science, Business Analytics, Data Analysis, Data Mining, Tableau, Statistiques, Modélisation, Régression, SQL, SSIS
What you'll learn
Réaliser correctement toutes les étapes d'un projet complexe de Data Science
Créer des Visualisations dans Tableau
Faire du Data Mining dans Tableau
Comprendre comment appliquer le test du khi-deux
Appliquer la méthode des Moindres Carrés Ordinaires pour faire des Régressions Linéaires
Evaluer tous types de modèles grâce au R-Squared
Evaluer tous types de modèles grâce au Adjusted R-Squared
Créer un modèle de Régression Linéaire Simple
Créer un modèle de Régression Linéaire Multiple
Créer des Dummy Variables
Interpréter les coefficients de la Régression Linéaire Multiple
Lire des outputs de modèles de Régression Linéaire
Utiliser les méthodes de Backward Elimination, Forward Selection et Bidirectional Elimination pour créer des modèles statistiques
Créer un modèle de Régression Logistique
Intégrer l'intuition de la Régression Logistique
Analyser les False Positives & False Negatives et comprendre la différence
Lire une Matrice de Confusion
Créer un Modèle Robuste de Segmentation Géo-Démographique
Transformer des variables indépendantes pour la modélisation
Dériver des variables indépendantes pour la modélisation
Vérifier la présence de multicolinéarité en utilisant le VIF (Variance Inflation Factor)
Avoir l'intuition de la multicolinéarité
Utiliser la courbe CAP (Cumulative Accuracy Profile) pour évaluer des modèles
Construire la courbe CAP dans Excel
Utiliser le Training set et le Test set pour construire des modèles robustes
Tirer des insights de votre courbe CAP
Comprendre le Odds Ratio
Tirer des business insights des coefficients d'une Régression Logistique
Comprendre à quoi ressemble la détérioration de modèle
Appliquer trois niveaux de maintenance de modèle pour empêcher la détérioration de modèle
Installer et utiliser SQL Server
Installer et utiliser Microsoft Visual Studio Shell
Nettoyer les données et chercher des anomalies
Utiliser SSIS (SQL Server Integration Services) pour uploader vos données dans une base de données
Créer des Conditional Splits dans SSIS
Gérer les erreurs de Text Qualifier
Créer des scripts dans SQL
Tirer profit de SQL pour des projets de Data Science
Créer des procédures stockées dans SQL
Présenter des projets de Data Science à des directeurs ou à un public
Requirements
Seulement une passion pour la réussite
Tous les logiciels utilisés dans ce cours sont disponibles gratuitement ou en démo
Description
Ce cours est la traduction française du cours de Data Sciences le plus vendu sur Udemy.
Extrêmement Utile…Incroyablement Pratique…Ultra Réaliste !
Il ne s'agit pas de l'un de ces cours utopiques où tout fonctionne parfaitement de manière irréaliste. Ce cours vous prépare au monde réel.
Dans ce cours vous allez vivre l'expérience réelle d'un Data Scientist, et cela inclut tous les moments difficiles qu'il peut ressentir dans son travail au quotidien: données corrompues, anomalies, irrégularités, tous les obstacles auxquels doit faire face le data scientist !
Ce cours va vous faire voyager dans le monde entier des Data Sciences. A l'issue de ce voyage, vous saurez:
Comment nettoyer et préparer vos données pour vos analysesComment bien visualiser vos donnéesComment créer des modèlesComment faire des prédictionsEt finalement, comment présenter vos découvertes et impressionner votre public
Ce cours va si bien vous préparer à la réalité du métier de Data Scientist que vous jonglerez avec vos divers projets de Data Science. Vous serez si bien entraînés et si bien formés que le monde réel sera pour vous un jeu d'enfant. Vous aurez des travaux à faire tout seul, si provocants et si challengings qu'ils vont vous mettre dans tous vos états… Mais vous n'abandonnerez pas ! Vous vaincrez !
Dans ce cours vous développerez une bonne maîtrise des outils suivants:
TableauSQLSSISGretl
Ce cours vous propose différentes approches préparées pour vous en fonction de vos besoins et objectifs. En utilisant ces approches, vous pouvez parcourir le cours et combiner les sections dans VOTRE PROPRE voyage qui va vous mener aux compétences dont VOUS avez besoin.
Ou bien sûr vous pouvez faire le cours en entier et vous former pour une incroyable carrière en Data Science.
Le choix est le votre. Rejoignez-nous dans ce voyage et commencez à apprendre dès aujourd'hui !
A très vite.
Bien à vous,
Kirill Eremenko & Hadelin de Ponteves
Overview
Section 1: Soyons enthousiastes !
Lecture 1 Bienvenue au cours Data Science A-Z
Section 2: Que sont les Data Sciences ?
Lecture 2 Intro (ce que vous allez apprendre dans cette section)
Lecture 3 Le job du futur
Lecture 4 Les domaines des Data Sciences
Lecture 5 Important: Approches du cours
Section 3: –––––––––––––- Partie 1: Visualisation –––––––––––––-
Lecture 6 Bienvenue à la Partie 1
Section 4: Introduction à Tableau
Lecture 7 Intro (ce que vous allez apprendre dans cette section)
Lecture 8 Installer Tableau Desktop et Tableau Public
Lecture 9 Description du challenge et des données
Lecture 10 Connecter Tableau à un fichier CSV
Lecture 11 Naviguer dans Tableau - Mesures et Dimensions
Lecture 12 Créer un calculated field
Lecture 13 Ajouter des couleurs
Lecture 14 Ajouter des labels et changer le format
Lecture 15 Exporter votre worksheet
Lecture 16 Récapitulatif de la section
Section 5: Utiliser Tableau pour le Data Mining
Lecture 17 Intro (ce que vous allez apprendre dans cette section)
Lecture 18 Obtenir le Dataset
Lecture 19 Connecter Tableau à un fichier Excel
Lecture 20 Visualiser un A-B test dans Tableau
Lecture 21 Travailler avec les Aliases
Lecture 22 Ajouter une Reference Line
Lecture 23 Chercher des anomalies
Lecture 24 Une astuce pratique pour valider votre approche
Lecture 25 Récapitulatif de la section
Section 6: Data Mining avancé avec Tableau
Lecture 26 Intro (ce que vous allez apprendre dans cette section)
Lecture 27 Créer des bins et visualiser des distributions
Lecture 28 Créer un test de classification pour une variable numérique
Lecture 29 Combiner deux graphes et travailler avec dans Tableau
Lecture 30 Valider le Data Mining dans Tableau avec un test du khi-deux
Lecture 31 Test du khi-deux quand il y a plus de deux catégories
Lecture 32 Visualiser le solde et la distribution du salaire estimé
Lecture 33 Bonus: Test du khi-deux Partie 1 (Tutoriel de Stats)
Lecture 34 Bonus: Test du khi-deux Partie 2 (Tutoriel de Stats)
Lecture 35 Récapitulatif de la section
Section 7: –––––––––––––– Partie 2: Modélisation ––––––––––––––
Lecture 36 Bienvenue à la Partie 2
Section 8: Rappels de Statistiques
Lecture 37 Intro (ce que vous allez apprendre dans cette section)
Lecture 38 Types de variables: Catégorique vs Numérique
Lecture 39 Types de régressions
Lecture 40 Méthode des moindres carrés ordinaires
Lecture 41 R-squared
Lecture 42 Adjusted R-squared
Section 9: Régression Linéaire Simple
Lecture 43 Intro (ce que vous allez apprendre dans cette section)
Lecture 44 Introduction à Gretl
Lecture 45 Obtenir le dataset
Lecture 46 Importer les données et faire des statistiques descriptives
Lecture 47 Lire des outputs de Régression Linéaire Simple
Lecture 48 Tracer et analyser un graphe
Section 10: Régression Linéaire Multiple
Lecture 49 Intro (ce que vous allez apprendre dans cette section)
Lecture 50 Attention: les hypothèses de la Régression Linéaire Multiple
Lecture 51 Obtenir le dataset
Lecture 52 Les Dummy Variables
Lecture 53 Le piège des Dummy Variables
Lecture 54 Manières de construire un modèle: BACKWARD, FORWARD, STEPWISE
Lecture 55 Backward Elimination - Un peu de pratique
Lecture 56 Utiliser le Adjusted R-squared pour créer des modèles robustes
Lecture 57 Interpréter les coefficients de la Régression Linéraire Multiple
Lecture 58 Récapitulatif de la section
Section 11: Régression Logistique
Lecture 59 Intro (ce que vous allez apprendre dans cette section)
Lecture 60 Obtenir le dataset
Lecture 61 Problèmes Business de type Oui/Non
Lecture 62 L'intuition de la Régression Logistique
Lecture 63 Votre première Régression Logistique
Lecture 64 False Positives et False Negatives
Lecture 65 Matrice de Confusion
Lecture 66 Interpréter les coefficients de la Régression Logistique
Section 12: Construire un modèle robuste de segmentation géo-démographique
Lecture 67 Intro (ce que vous allez apprendre dans cette section)
Lecture 68 Obtenir le dataset
Lecture 69 Qu'est-ce que la segmentation géo-demographique ?
Lecture 70 Construisons le modèle - première itération
Lecture 71 Construisons le modèle - backward elimination: STEP-BY-STEP
Lecture 72 Transformer des variables indépendantes
Lecture 73 Créer des variables dérivées
Lecture 74 Vérifier la multi-colinéarité en utilisant VIF
Lecture 75 Matrice de Corrélation et Intuition de la multi-colinéarité
Lecture 76 Récapitulatif de la section
Section 13: Evaluer votre modèle
Lecture 77 Intro (ce que vous allez apprendre dans cette section)
Lecture 78 Le paradoxe de la précision
Lecture 79 Cumulative Accuracy Profile (CAP)
Lecture 80 Construire une courbe CAP avec Excel
Lecture 81 Evaluer le modèle en utilisant une courbe CAP
Lecture 82 Obtenir le template de courbe CAP
Lecture 83 Utiliser un test set pour empêcher l'overfitting
Lecture 84 Appliquer le modèle à un test set
Lecture 85 Comparer la performance sur le training set et le test set
Lecture 86 Récapitulatif de la section
Section 14: Tirer des insights de votre modèle
Lecture 87 Intro (ce que vous allez apprendre dans cette section)
Lecture 88 Des insights puissants tirés de votre courbe CAP
Lecture 89 Les coefficients de la Régression Logistique - Plan d'attaque (avancé)
Lecture 90 Le Odds Ratio (avancé)
Lecture 91 Odds Ratio vs Coefficients de la Régression Logistique (avancé)
Lecture 92 Tirer des insights des coefficients (avancé)
Lecture 93 Récapitulatif de la section
Section 15: Maintenir à jour votre modèle
Lecture 94 Intro (ce que vous allez apprendre dans cette section)
Lecture 95 A quoi ressemble la détérioration de modèle ?
Lecture 96 Pourquoi les modèles se détériorent-ils ?
Lecture 97 Trois niveaux de maintenance pour les modèles déployés
Lecture 98 Récapitulatif de la section
Section 16: ––––––––––– Partie 3: Préparation des données –––––––––––
Lecture 99 Bienvenue à la partie 3
Section 17: Outils de Business Intelligence (BI)
Lecture 100 Intro (ce que vous allez apprendre dans cette section)
Lecture 101 Travailler avec les données
Lecture 102 Qu'est-ce que le Data Warehousing ? Qu'est-ce qu'une base de données (database)
Lecture 103 Installer Microsoft SQL Server 2014
Lecture 104 Créer une base de données test
Lecture 105 Qu'est-ce que le processus ETL (Extract Transform Load) ?
Lecture 106 Outils BI de Microsoft: Que sont SSDT-BI et SSIS/SSAS/SSRS ?
Lecture 107 Installer SSDT avec MSVS Shell
Section 18: ETL Phase 1: Data Wrangling avant l'upload
Lecture 108 Intro (ce que vous allez apprendre dans cette section)
Lecture 109 Préparer la structure de votre dossier pour votre projet de Data Science
Lecture 110 Obtenir le dataset pour cette section
Lecture 111 Deux choses que vous DEVEZ faire avant l'upload
Lecture 112 Notepad ++
Lecture 113 Editpad Lite
Section 19: ETL Phase 2: Procédure step by step d'upload des données dans SSIS
Lecture 114 Intro (ce que vous allez apprendre dans cette section)
Lecture 115 Créer un projet SSIS
Lecture 116 Préparer le dataflow
Lecture 117 Mettre en place la flat file source
Lecture 118 Mettre en place la OLE DB destination
Lecture 119 Exécuter l'upload
Lecture 120 Attention: contrôle de la qualité
Section 20: Gérer les erreurs pendant l'ETL (Phases 1 et 2)
Lecture 121 Intro (ce que vous allez apprendre dans cette section)
Lecture 122 Obtenir le dataset pour cette section
Lecture 123 Comment Excel peut mettre vos données en désordre
Lecture 124 Procédure à suivre pour le Data Wrangling avant l'upload
Lecture 125 Erreur de text qualifier dans SSIS
Lecture 126 Que faire quand votre fichier source est corrompu ? (Partie 1)
Lecture 127 Que faire quand votre fichier source est corrompu ? (Partie 2)
Lecture 128 Erreur de data truncation dans SSIS
Lecture 129 Astuce pratique pour trouver des anomalies en SQL
Lecture 130 Gestion automatique d'erreurs dans SSIS avec un Conditional Split
Lecture 131 Gestion automatique d'erreurs dans SSIS avec plusieurs Conditional Splits
Lecture 132 Analyser des fichiers d'erreur
Lecture 133 Attention: la chose que vous DEVEZ faire à chaque fois
Lecture 134 Les différents types d'erreurs dans SSIS
Lecture 135 Récapitulatif de la section
Lecture 136 Homework
Section 21: La programmation SQL pour les Data Sciences
Lecture 137 Intro (ce que vous allez apprendre dans cette section)
Lecture 138 Obtenir le dataset pour cette section
Lecture 139 Apprendre à connaître MS SQL Management Studio
Lecture 140 Raccourci pour uploader les données
Lecture 141 Utiliser SELECT * pour sélectionner les données
Lecture 142 Utiliser WHERE pour filtrer les données
Lecture 143 Utiliser des wildcards (% et _)
Lecture 144 Ajouter des commentaires
Lecture 145 Utiliser ORDER BY pour ordonner les données
Lecture 146 Les types de données
Lecture 147 La conversion implicite de type
Lecture 148 Utiliser Cast() vs Convert()
Lecture 149 Travailler avec les NULLs
Lecture 150 Comprendre comment fonctionnent les LEFT, RIGHT, INNER et OUTER Joins
Lecture 151 Les Joins avec des duplicates (valeurs dupliquées)
Lecture 152 Les Joins sur plusieurs colonnes
Lecture 153 Un peu de pratique avec les Joins
Section 22: ETL Phase 3: Data Wrangling après l'upload
Lecture 154 Intro (ce que vous allez apprendre dans cette section)
Lecture 155 Les trois types de tables: RAW table, WRK table, DRV table
Lecture 156 Obtenir le dataset pour cette section
Lecture 157 Créer une procédure stockée
Lecture 158 Exécuter une procédure stockée
Lecture 159 Modifier une procédure stockée
Lecture 160 Procédure stockée - Bloc CREATE TABLE
Lecture 161 Procédure stockée - Bloc INSERT INTO
Lecture 162 Procédure stockée - Blocs DROP TABLE et TRUNCATE TABLE
Lecture 163 Récapitulatif intermédiaire
Lecture 164 Créer la procédure stockée pour le second fichier source
Lecture 165 Ajouter des préfixes zéros
Lecture 166 Convertir des données à la main
Lecture 167 Créer un template de procédure stockée
Lecture 168 Archiver une procédure stockée
Lecture 169 Ce que vous pouvez faire après avec ces tables (DRV tables)
Section 23: Gérer les erreurs pendant l'ETL (Phase 3)
Lecture 170 Intro (ce que vous allez apprendre dans cette section)
Lecture 171 Obtenir le dataset pour cette section
Lecture 172 Uploader les données dans la RAW table
Lecture 173 Préparer la procédure stockée
Lecture 174 Gérer des erreurs en utilisant la fonction isnumeric()
Lecture 175 Gérer des erreurs en utilisant la fonction len()
Lecture 176 Gérer des erreurs en utilisant la fonction isdate()
Lecture 177 Vérifications supplémentaires pour le contrôle de la qualité - Balance
Lecture 178 Vérifications supplémentaires pour le contrôle de la qualité - Zipcode
Lecture 179 Vérifications supplémentaires pour le contrôle de la qualité - Birthday
Lecture 180 Partie 3 complétée
Lecture 181 Homework
Section 24: –––––––––––––- Partie 4: Communication –––––––––––––-
Lecture 182 Bienvenue à la Partie 4
Section 25: Travailler avec des personnes
Lecture 183 Intro (ce que vous allez apprendre dans cette section)
Lecture 184 Travailler entre plusieurs départements
Lecture 185 Venez me voir avec un problème business
Lecture 186 Fixer les attentes avant de commencer le projet
Lecture 187 Allez vous asseoir avec eux
Lecture 188 L'art de dire "Non"
Lecture 189 Parfois vous devez aller au sommet
Lecture 190 Construire une culture de données
Section 26: Présenter ses résultats
Lecture 191 Intro (ce que vous allez apprendre dans cette section)
Lecture 192 Etude de cas
Lecture 193 Introduction de la présentation
Lecture 194 Analyse de l'introduction
Lecture 195 Les slides de la présentation - Pour que votre public dise "WOW"
Lecture 196 Ma méthode de brainstorming
Lecture 197 Comment faire une présentation à des directeurs
Lecture 198 La vérité n'est pas toujours belle
Lecture 199 La passion et le fameux "WOW"
Lecture 200 Bonus: ma présentation entière | LIVE 2015
Lecture 201 Bonus: liens vers d'autres exemples de storytelling
Section 27: Solutions des Homeworks
Lecture 202 Data Mining avancé avec Tableau - Visualiser Credit Score & Tenure
Lecture 203 Data Mining avancé avec Tableau - Test du khi-deux pour le pays
Lecture 204 Gérer les erreurs pendant l'ETL (Phases 1 et 2)
Lecture 205 Gérer les erreurs pendant l'ETL - "Vehicle Service" - Partie 1
Lecture 206 Gérer les erreurs pendant l'ETL - "Vehicle Service" - Partie 2
Lecture 207 Gérer les erreurs pendant l'ETL - "Vehicle Service" - Partie 3
Toute personne intéressée par les Data Sciences,Toute personne souhaitant améliorer ses compétences en data mining,Toute personne souhaitant améliorer ses compétences en modélisation statistique,Toute personne souhaitant améliorer ses compétences en préparation de données,Toute personne souhaitant améliorer ses compétences en communication et présentation