Data Mining

Qu'est-ce que l'exploration de données:

L'exploration de données est un terme anglais lié à l' informatique dont la traduction est l'exploration de données . Il consiste en une fonctionnalité qui agrège et organise les données, en y trouvant des modèles, des associations, des modifications et des anomalies pertinents.

Le terme data mining est apparu en 1990 dans les communautés de bases de données. L'exploration de données est l'étape d'analyse de processus connue sous le nom de KDD ( Découverte de connaissances dans des bases de données ), sa traduction littérale étant "Découverte de connaissances dans des bases de données".

L'exploration de données peut être divisée en quelques étapes de base: exploration, création de modèle, définition de modèle, validation et vérification.

L'exploration de données est une pratique relativement récente dans le monde de l'informatique. Elle utilise la recherche d'informations, l'intelligence artificielle, la reconnaissance de formes et des techniques statistiques pour rechercher des corrélations entre différentes données permettant d'acquérir des connaissances utiles pour une entreprise ou un particulier. Pour une entreprise, l’exploration de données peut être un outil important qui améliore l’innovation et la rentabilité.

L'utilisation de l'exploration de données est assez courante dans les grandes bases de données, et le résultat final de leur utilisation peut être affiché via des règles, des hypothèses, des arbres de décision, des dendrogrammes, etc.

Une fouille de données bien exécutée doit accomplir des tâches telles que: la détection des anomalies, l’apprentissage des règles d’association (modélisation de la dépendance), la mise en grappes, la classification, la régression et la synthèse. Le processus d' exploration de données se produit généralement à l'aide de données contenues dans l' entrepôt de données .

Plusieurs sociétés et logiciels sont dédiés à l'exploration de données, l'identification de modèles dans les bases de données étant de plus en plus importante. Toutefois, l’identification des normes pertinentes n’est pas propre au monde de l’informatique. Le cerveau humain utilise un processus similaire pour identifier des modèles et acquérir des connaissances.

Au cours des dernières années, l’exploration de données a été largement utilisée dans les domaines de la science et de l’ingénierie tels que la bioinformatique, la génétique, la médecine, l’éducation et le génie électrique.

Le concept d' exploration de données est souvent associé à l'extraction d'informations sur le comportement des personnes. Pour cette raison, dans certaines situations, l'exploration de données soulève des problèmes juridiques et des problèmes liés à la confidentialité et à l'éthique. Malgré cela, de nombreuses personnes affirment que l’exploration de données est éthiquement neutre car elle n’a aucune implication éthique.

Exemples réels d' exploration de données

Les sociétés et les organisations ont souvent recours à l'exploration de données pour acquérir des connaissances sur les utilisateurs / employés / clients. Par exemple, dans le secteur public, il est possible de vérifier le statut matrimonial d'un employé et le salaire qu'il gagne pour voir si cela a une influence sur sa vie conjugale.

Les entreprises telles que les chaînes de supermarchés peuvent utiliser ces données croisées pour déterminer les produits achetés ensemble. Si un client qui achète le produit X achète également le produit Y, il peut être judicieux de placer les deux produits à proximité pour le rendre plus facile à acheter.