Apprendre à manipuler de diverses manières une collection de fichiers (texte), afin d’en extraire différentes informations et les visualiser.
Apprendre à récupérer des données textuelles à partir du web, à traiter les métadonnées afin de classifier ou regrouper un ensemble de textes.
Construire un système de recherche d’informations : s’initier à l’indexation de texte et la construction d’espace sémantique (topic modeling).
Conception d’interfaces graphiques.
Conception d’une application déployée sur le web.
Exploiter des données géo localisée et les visualiser sur une carte.
Introduction au domaine de l’analyse des images des documents. Les applications aborderont les tâches de binarisation de l’image, la segmentation des lignes de textes, ou encore la reconnaissance des caractères dans une image.
Pour le suivi du cours je vous invite à installer Jupyter notebook en suivant ce lien.
Résumé | Activités | TD PDF | TD python notebook | données |
---|---|---|---|---|
Dans cette partie du cours, l’étudiant apprendra à manipuler de diverses manières une collection de fichiers (texte), afin d’en extraire différentes informations et de les visualiser. | Lire depuis un fichier texte. Écrire dans un fichier texte. Utilisation des fichiers de type csv. | jupyter | jupyterjupyter |
Résumé | Activités | TD PDF | TD python notebook | données |
---|---|---|---|---|
Dans cette partie du cours, l’étudiant apprendra à récupérer les données depuis le web avec une requête http, construire un analyseur syntaxique, et stocker les données. | Construire un aspirateur de données. Écrire une fonction pour analyser la syntaxe XML. Utilisation des fichiers de type json. Connexion à une base de données de type MongoDB. | jupyter |
Résumé | Activités | TD PDF | TD python notebook | données |
---|---|---|---|---|
Dans cette partie du cours, l’étudiant apprendra à maîtriser des opérations basiques de nettoyage des données textuelles et leur visialisation | jupyter | jupyter |