Monday, November 22, 2010

LE DATA MINING (FR)

“Les données ne naissent pas pertinentes, elles le deviennent... »

Définition

Le data Mining, ou fouille de données, est l'ensemble des méthodes et techniques destinées à l'exploration et l'analyse de bases de données informatiques, de façon automatique ou semi-automatique, en vue de détecter dans ces données des règles, des associations, des tendances inconnues ou cachées, des structures particulières restituant l'essentiel de l'information utile tout en réduisant la quantité de données.

Il s'agit de "fouilles" pour extraire "de l'information cachée" que les données renferment et que l'on découvre à la recherche d'associations, de tendances…etc.

Les tâches et les techniques du Data Mining

1. La classification :

Elle consiste à examiner des caractéristiques d’un élément nouvellement introduit afin de l’affecter à une classe d’un ensemble prédéfini.

Parmi les techniques appropriées on trouve:

  • Les arbres de décision,
  • L’analyse des liens.

    2. L’estimation :

    Le résultat d’une estimation permet d’obtenir une variable continue. On combinant les données en entrée. Le résultat d’une estimation permet de procéder aux classifications.

    Un des intérêts de l’estimation est de pouvoir ordonner les résultats pour ne retenir que les n meilleures valeurs.

    La technique la plus appropriée à l’estimation est : les réseaux de neurones.

    3. La prédiction :

    Tout comme les tâches précédentes, elle s’appuie sur le passé et le présent mais le résultat se situe dans le futur généralement précisé. Parmi les techniques de prédiction :

  • Le raisonnement basé sur la mémoire.
  • Les arbres de décision.
  • les réseaux de neurones.

    4. Le regroupement par similitudes :

    Cette technique consiste à grouper les éléments qui vont naturellement ensembles. La technique la plus appropriée au regroupement par similitudes est l’analyse du panier de la ménagère.

    5. L’analyse des clusters :

    Cette analyse consiste à segmenter une population hétérogène en sous populations homogènes. Sachant que les sous populations ne sont pas préétablis. La technique la plus appropriée à la clustérisassions est l’analyse des clusters.

    6. La description:

    L’une des taches souvent demandée à un outil du Data Mining c’est la prédiction. On lui demande de décrire les données d’une base complexe. La technique appropriée est l’analyse du panier de la ménagère.

    Les objectifs du datamining

    1. Confirmer

    Le datamining est utilisée pour confirmer un comportement ou une hypothèse. Dans le cas où le décisionnaire a un doute sur un hypothèse ,en appliquant des méthodes statistiques ou d’intelligence artificielle le datamining pourra tenter de confirmer cette hypothèse .

    2. Expliquer

    On utilisant le Data Mining on peut expliquer un événement ou un incident indiscernable. Par la consultation des informations contenues dans l’entrepôt de données de l’organisation.

    3. Explorer

    Enfin, on peut extraire les liens « inconnus» avec le Data Mining. Quand le décisionnaire n’as pas d’hypothèse ou d’idée sur un fait précis, il peut demander au système de proposer des associations ou des corrélations qui pourront aboutir à une explication.

    La démarche et les prérequis d'une étude Data Mining

    Généralement une étude du Data Mining suit 6 étapes :

    1 - La définition du besoin métier

    La première étape est de définir le besoin métier, c'est à dire les questions auxquelles le Data Mining doit répondre.

    2 - La préparation des données

    Souvent c’est l'obtention de données de qualité qui prend le plus de temps. Notons que la qualité des données a un impact sur les données qui seront conservées et donc au final il est possible qu'il soit nécessaire de redéfinir le besoin métier.

    3 - L'étude statistique

    4 - La validation du modèle

    Avant la mise en production le modèle doit être validé.

    5 - La mise en production

    Une fois que l'analyse a trouvé le bon modèle de segmentation, il est important que le modèle puisse être mis en production.

    6 - L'évaluation de la qualité du modèle

    Il est important, dès la première étape, d'identifier les indicateurs qui seront utilisés pour mesurer la qualité du modèle.

    Principales difficultés du datamining

    1. Qualité des données

    Si l'entreprise dispose d'un Data Warehouse, les questions de qualité sont déjà traitées et la préparation des données peut ne représenter que 30 % du travail.

    Et si ce n’est pas le cas, 60 à 70 % du travail sera consacré à la préparation des données (sélection, correction, chargement…).

    2. Choix des méthodes et de l'itinéraire des travaux

    Pour pouvoir répondre aux questions posées par le client, les méthodes doivent être choisies en dialoguant avec lui. Pour cela l'expert en datamining doit être aussi un animateur et posséder des qualités comme : rigueur dans la méthode, ouverture et chaleur humaine dans la communication.

    3. Evaluation des résultats

    L’évaluation des résultats du Data Mining reste l’une des principales difficultés du Data Mining.

    Exemples d’applications du Data Mining

    Les applications du data Mining sont multiple on cite comme exemple :

    1. Marketing direct

    Afin de diminuer les coûts d’acquisition des clients Le Data Mining répond aux besoins de comprendre la relation client et de connaître les comportements des clients. Les solutions de Data Mining vont faire des prédictions de comportement et indiquer quels types de prospects devront être contactés en priorité par des opérations de marketing direct.

    2. Fidélisation des clients

    Lorsque une solution Data Mining est mise en place, les entreprises vont essayer d’allonger la durée de vie d’un client en repérant les risques de son départ.

    3. Comportement des clients de grandes et moyennes surfaces

    Les techniques d’associations de produits sont utilisées pour anticiper le comportement des clients dans le future. Un client qui achète une baignoire va probablement envisager l’achat de robinets.

    4. Satisfaction de clientèle

    On utilisant les techniques du Data Mining on peut déterminer le seuil de fréquence qui va générer l’insatisfaction de la clientèle.

    Pour télécharger la version en PDF. Voici le lien: http://tinyurl.com/2bm5hax

    Source

    • DAMACOSY. 2010. [En ligne] 2010. [Citation : 21 11 2010.] http://www.damacosy.fr/?q=content/data-mining.
    • FRODEAU, Christine. 2003. academy Versaille. [En ligne] 2003. [Citation : 21 11 2010.] http://www.creg.ac-versailles.fr/spip.php?article55.
    • MAISONS, David. 2006. DATAWAREHOUSE et DATAMINING, Architecture et technique de ces composants de l'informatique. 2006. Présenté en vue d’obtenir L’EXAMEN PROBATOIRE EN SYSTEME D’INFORMATION. Disponible sur: http://ledad.ovh.org/public/datawarehouse.pdf.
    • Tuffery, Stephane. 2007. Data Mining et statistique decisionnelle . s.l. : EDITIONS TECHNIP, 2007.
    • VOLLE, Michel. 2001. Intranet et Datamining. Volle.com. [En ligne] 2001. http://www.volle.com/lectures/ACM1.htm.


  • Les Tableaux de Bord Prospectifs (Balanced Score Cards) (FR)

    Critique des outils classiques de pilotage :

    La comptabilité générale, la comptabilité de gestion ou la gestion budgétaire sont des outils classiques. Du point de vue du pilotage de la performance, on peut reprocher à chaque outil qu'il souffre d’inconvénients.

    Le Tableau de Bord Prospectif (Balanced ScoreCards) :

    Il ne suffit pas de remonter les indicateurs financiers de l’entreprise pour pouvoir manager, il faut aussi que le manager ait des informations relatives aux ressources humaines de l’entreprise, et a l’innovation…etc. Ces nouveaux besoins ont donnés naissance à des nouveaux systèmes de pilotage comme le BSC.

    L’idée du tableau de bord prospectif, a été émise il y’a une quinzaine d’années par Robert Kaplan et David Norton. Ils proposent de bâtir un tableau de bord prospectif embrassant quatre perspectives reliés de manière causale.

    Les quatre perspectives du BSC:

    Le BSC traduit la vision et la stratégie de l’entreprise en objectifs et en indicateurs articulés autour de l’ensemble cohérant formé par les quatre axes.

    clip_image002

    Figure 1: Les 4 axes du tableau de bord prospectif (BSC) selon [Norton & Kaplan, 2003]

    La perspective financière : Le « haut » du tableau de bord prospectif est occupé par les indicateurs financiers ou économiques parce que c’est la finalité de toute entreprise. On y retrouve des indicateurs tels le ROI, ou retour sur investissement, le RCP, ou retour sur capitaux propres, le BPA, ou bénéfice par action, etc.

    La perspective client : Selon Kaplan et Norton, ce qui est le plus directement et causalement relié à la rentabilité financière d'une entreprise, c'est sa capacité à bien servir ses clients et à les conserver. Dans cette partie du tableau de bord, on retrouve des indi­cateurs comme le taux de satisfaction des clients, les parts de marché, le chiffre d'affaires, etc.

    La perspective des processus internes : Les deux auteurs pensent que les clients seront d'autant plus satisfaits que l'entreprise aura une « chaîne de valeur » de qualité. Si l'ensemble des processus allant de l'identification d'un besoin client jusqu'au ser­vice après-vente est parfaitement maîtrisé, les clients devraient être pleinement satisfaits du produit ou du service fourni. La chaîne part du besoin du client puis elle se poursuit avec la recherche et le développement du nouveau produit ou service, sa conception, sa réali­sation, sa production, sa distribution, sa vente et elle se termine par le service après-vente. Dans cette partie du tableau de bord prospectif, on retrouve des indicateurs comme : le nom­bre d'innovations-produits, le nombre de défauts de fabrication, le délai de mise en mar­ché, etc.

    La perspective de l'innovation et de l'amélioration (ou de l'apprentissage) : La chaîne de valeur sera d'autant plus solide qu'elle reposera sur une « infrastructure » solide. Celle- ci est composée du capital intellectuel et organisationnel que l'entreprise possède et du capi­tal humain dont elle dispose. Le premier recouvre grosso modo les systèmes d'information et l'accumulation de savoir et de savoir-faire dans l'entreprise. Dans le second, Kaplan et Norton placent la culture de l'entreprise, sa capacité à partager l'information.

    Organisation des indicateurs en chaîne (La chaîne de causalité):

    Il existe une interdépendance entre les quatre dimensions. Le tableau de bord prospectif crée une hiérarchie entre ces quatre dimensions, en les subordonnant toutes à l'axe financier. Le lien avec les objectifs financiers doit toujours être recherché et établi ; ceux-ci restant le but et la mesure de résultat ultimes, les trois autres dimensions n'en étant que les moyens. La chaîne causale du tableau de bord prospectif part des indicateurs contenus dans l'axe « apprentissage organisationnel » dont l'impact se traduit dans les indicateurs de l'axe processus internes. Les mesures sur les processus contributifs ont des conséquences directes sur la satisfaction des clients qui se répercutent sur les résultats financiers

    clip_image004

    Figure 2 Des indicateurs organisés en chaîne

    Limites du BSC

    – ergonomie limitée.

    – travail en équipe difficile.

    – pas d’attention spécifique portée aux projets.

    Ces limites ont participées à l’apparition du Management Cockpit.

    Pour télécharger la version en PDF, Voila le lien: http://bit.ly/aMWjTk

    Source

    1. Louarn, Jean-Yves Le. Les tableaux de bord Ressources humaines.

    2. Les tableaux de bords prospectifs. atlas du management. [En ligne] http://www.atlasdumanagement.com/index.php?article=85&zone=3.

    3. Abdelmalek, Chetta. élaboration d’un outil de pilotage de la performance d'entreprise.

    4. N, SOGUEL. Le management cockpit.

    5. Management Cockpit. Wikipedia. [En ligne] http://fr.wikipedia.org/wiki/Management_Cockpit.



    Wednesday, November 10, 2010

    Présenter un mémoire (FR)

    Voilà un autre article que je vois utile et qui rentre dans la préparation de mon Projet  Fin diplomed’Etude(PFE) qui a comme intitulé «Intégrer les techniques de Datamining et compléter les fonctions de pilotage de Maestro EPM ».

    On est toujours dans la première phase qui s’appelle l’état de l’art et qui a pour but de mentionner les connaissances existantes sur un sujet d'étude.

    Quelques tricks que j’ai jugé utiles

     

    Remarques générales sur le mémoire:

    • Ne pas négliger l’introduction, ni la conclusion : de nombreux correcteurs commencent par lire ces deux parties, et parfois s’arrêtent là.
    • Toujours indiquer la source de toutes les informations ; faire une bibliographie honnête  et surtout pas de document que vous n’avez pas lu ;
    • éviter les fautes d’orthographe
    • n’utiliser qu’une seule police de caractère ;
    • Police de caractère : Times ; réserver l’Arial pour les titres ;
    • Taille de caractère : 12 points ;
    • Impression : Recto seulement ;
    • Eviter « je », plutôt « on » et « nous »

    La bibliographie :

          Il existe des normes internationales de citation de références bibliographiques, comme la norme française ISO 690.

          Et pour simplifier vous pouvez se baser sur cela si vous utilisez:

    Monographie :

                  Nom, Prénom. Titre de l’ouvrage. Endroit de publication : Éditeur, Année.

    Ouvrage périodique :

                 Nom, Prénom. « Titre de l’article. » Titre du périodique Volume, Numéro, Date de publication : numéro de page de début-numéro de page de fin.

            Exemple : Desanctis G. & Gallupe R.B., “A foundation for the study of group decision support systems”, Management Science, Vol. 33, No. 5, May 1987.

    Internet :

           Nom, Prénom (ou en cas d’absence, le titre du site web). « Titre du document [si disponible] » Titre du site Web. Date de la dernière mise à jour ou date de la publication dans Internet. Date de consultation <adresse URL>.

           

      Ça c’était la méthode manuelle mais n’empêche qu’ils existent des outils qui gèrent automatiquement la bibliographie. Comme : Biblioexpress ou Papyrus .

                                  Bonne chance a tous et a toutes.

     

                                                             Source : http://bit.ly/b1V5nI | http://slidesha.re/bYQhZq | Ecrit universitaire (GHOMARI)