Informatique et Techniques Numériques en Economie
-
TD 5 - Arbres de décision

<< précédent index

1- Présentation générale

Les TDs précédents ont permis de générer des données. L'analyse OLAP qui a été menée sur ces données a permis d'illustrer l'utilisation de ce premier outil d'analyse. On considère ici un nouvel outil d'apprentissage : les arbres de décision. Ce TD doit aboutir au rendu d'une synthèse -au plus tard lors de la dernière séance- sur l'utilisation de l'outil, son intérêt dans le cas du site créé précédemment, son intérêt dans l'analyse de données en général.


2- Compétences à acquérir


3- Premiers Essais

On commence par travailler sur deux ensembles tests. L'applet se trouve sur : DTree. En lançant l'applet, on accède cette interface :



Le menu File offre plusieurs possibilités :

Dans un premier temps, on va travailler via Load Sample Dataset. Chargez notamment les données MailReading et TestSet :


4- Travail sur les données générées.

4.1 Recupération des données de la table Achat

Pour rentrer vos données, vous devez produire un ensemble de données CSV à partir de votre table Achat, avec la dernière valeur de chaque ligne qui correspond à la variable d'apprentissage. Voici un exemple de fichier qui convient : Exemple sur des données bancaires. Une fois votre fichier produit à ce format, copier l'ensemble du contenu du document et aller sur : EntreeCSV, donner un nom à votre ensemble de données, par exemple votreNom_data, envoyer vos données. Vous retrouverez ensuite vos données dans la liste de l'applet via Load Sample Dataset.

4.2 Analyse des données