Web data
Code UE : EAR212
- Cours
- 4 crédits
- Volume horaire de référence
(+ ou - 10%) : 40 heures
Responsable(s)
Héloïse PETIT
Public, conditions d’accès et prérequis
Aucun pré-requis sauf des notions de mathématiques basiques.
Le cours nécessite d'avoir un ordinateur portable sur lequel Python peut être installé (gratuit).
Le cours nécessite d'avoir un ordinateur portable sur lequel Python peut être installé (gratuit).
Objectifs pédagogiques
Ce cours est une introduction à la collecte, au traitement et à l'analyse des données en Python. Ce cours ne nécessite aucun pré-requis sauf des notions de mathématiques basiques.
Contenu
Dans un premier temps, nous présenterons les concepts de base en programmation, à savoir la création de variables, les conditions et les boucles. Dans une seconde partie, nous présenterons les principales structures de données intégrées à Python telles que les listes et les dictionnaires qui permettent de structurer des données. Nous verrons également comment ouvrir, lire, écrire et sauvegarder des objets ou structures de données dans des fichiers. Dans une troisième partie, nous verrons comment traiter, fusionner et analyser des bases de données dans différents formats. Enfin, dans une quatrième partie, nous présenterons des méthodes de collecte de données sur internet via du web scraping et l'utilisation des API web.
Différents modules seront utilisés. En particulier:
- pandas qui permet la manipulation et l'analyse des données. Ce module propose en particulier des structures de données et des opérations de manipulation de tableaux numériques
- matplotlib qui permet de tracer et visualiser des données sous forme de graphiques
- numpy qui permet de manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux
- requests qui permet d’effectuer programmatiquement des requêtes HTTP (comme celles que fait un navigateur)
- re qui permet de travailler sur les expressions régulières qui sont utilisées pour la lecture, la modification, la manipulation et l'analyse de textes
- tweepy qui permet de collecter des données sur Twitter
Différents modules seront utilisés. En particulier:
- pandas qui permet la manipulation et l'analyse des données. Ce module propose en particulier des structures de données et des opérations de manipulation de tableaux numériques
- matplotlib qui permet de tracer et visualiser des données sous forme de graphiques
- numpy qui permet de manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux
- requests qui permet d’effectuer programmatiquement des requêtes HTTP (comme celles que fait un navigateur)
- re qui permet de travailler sur les expressions régulières qui sont utilisées pour la lecture, la modification, la manipulation et l'analyse de textes
- tweepy qui permet de collecter des données sur Twitter
Modalité d'évaluation
- Contrôle continu
- Projet(s)
Bibliographie
- Vincent Le Goff : Apprenez à programmer en Python
Cette UE apparaît dans les diplômes et certificats suivants
Rechercher une formation
CRITERES
- Le champ Mot-clé permet de rechercher les formations grâce à un mot ou à une expression présent dans l’intitulé ou dans les index d’une formation.
Des index vous sont suggérés à partir du 3e caractère saisi, mais vous pouvez aussi saisir librement tout autre chaîne de caractères . - les différents items sélectionnés sont croisés.
ex: "Comptabilité" et "Région Alsace"
CODE
- Vous pouvez utiliser le caractère joker * pour remplacer un nombre quelconque de caractères
- UE : le code comprend 3 lettres immédiatement suivies de 3 chiffres
- Certificat : le code comprend 2 ou 3 lettres immédiatement suivies de 3 chiffres. Certains certificats se déclinent selon plusieurs parcours :
- pour afficher le tronc commun, tapez le code simple (ex : LG005).
- pour afficher un parcours précis dans un diplôme, faites suivre le code de la lettre "p", et du numéro de parcours (ex : LG005p2). Si le diplôme ne comporte qu'un seul parcours, faites suivre la lettre "p" de -1 (ex : CYC17p-1).
Dans tous les cas, veillez à ne pas insérer d'espace ou de ponctuation supplémentaire.
Chargement du résultat...

Intitulé de la formation |
Type |
Modalité(s) |
Lieu(x) |
|
---|---|---|---|---|
Intitulé de la formation
Master Stratégies Economiques, Numérique et Données
|
Lieu(x)
Package
|
Lieu(x)
Paris
|
||
Intitulé de la formation | Type | Modalité(s) | Lieu(x) |
Contact
EPN09 - EFAB
40 rue des jeuneurs Bureau C 256
75002 Paris
Tel :01 40 27 23 66
Virginie Moreau
40 rue des jeuneurs Bureau C 256
75002 Paris
Tel :01 40 27 23 66
Virginie Moreau
Voir le site
Voir le calendrier, le tarif, les conditions d'accessibilité et les modalités d'inscription dans le(s) centre(s) d'enseignement qui propose(nt) cette formation.
UE
-
-
Paris
-
Centre Cnam Paris
- Année 2022 / 2023 : Présentiel soir ou samedi
-
Centre Cnam Paris
-
Paris
Code UE : EAR212
- Cours
- 4 crédits
- Volume horaire de référence
(+ ou - 10%) : 40 heures
Responsable(s)
Héloïse PETIT