Entreposage de données
Qu'est-ce que l'entreposage de données?L'entreposage de données est le stockage électronique d'une grande quantité d'informations par une entreprise ou une organisation. L'entreposage de données est une composante essentielle de la veille stratégique qui utilise des techniques d'analyse des données d'entreprise.
Le concept d'entreposage de données a été introduit en 1988 par Barry Devlin et Paul Murphy, chercheurs chez IBM. La nécessité de stocker des données a évolué à mesure que les systèmes informatiques devenaient plus complexes et traitaient de plus en plus de données. Un ouvrage clé sur l'entreposage de données est le "Building the Data Warehouse" de WH Inmon, qui a été publié pour la première fois en 1990 et a été réimprimé à plusieurs reprises depuis.
Comment fonctionne l'entreposage de données
L'entreposage de données permet de mieux comprendre les performances d'une entreprise en comparant les données consolidées à partir de plusieurs sources hétérogènes. Un entrepôt de données est conçu pour exécuter une requête et une analyse sur des données historiques dérivées de sources transactionnelles.
Une fois que les données ont été incorporées dans l’entrepôt, elles ne changent pas et ne peuvent plus être modifiées puisqu’un entrepôt de données exécute des analyses sur les événements déjà survenus en se concentrant sur l’évolution des données dans le temps. Les données stockées doivent être stockées de manière sécurisée, fiable, facile à récupérer et à gérer.
Certaines étapes sont entreprises pour créer un entrepôt de données. La première étape est l'extraction des données, qui consiste à collecter de grandes quantités de données à partir de plusieurs points sources. Une fois les données compilées, les données sont nettoyées, processus consistant à les analyser pour en éliminer les erreurs et à corriger ou exclure les erreurs éventuelles.
Les données nettoyées sont ensuite converties d'un format de base de données à un format d'entrepôt. Une fois stockées dans l'entrepôt, les données sont triées, consolidées, résumées, etc. afin d'être mieux coordonnées et plus faciles à utiliser. Au fil du temps, davantage de données sont ajoutées à l'entrepôt à mesure que les multiples sources de données sont mises à jour.
Points clés à retenir
- L'entreposage de données est le stockage électronique d'une grande quantité d'informations par une entreprise ou une organisation.
- Un entrepôt de données est conçu pour exécuter une requête et une analyse sur des données historiques dérivées de sources transactionnelles à des fins de veille stratégique et d'exploration de données.
- L'entreposage de données permet de mieux comprendre les performances d'une entreprise en comparant les données consolidées à partir de plusieurs sources hétérogènes.
Considérations spéciales: exploration de données
Les entreprises peuvent stocker des données destinées à l'exploration et à l'exploration de données, en recherchant des modèles d'informations qui les aideront à améliorer leurs processus métier. Un bon système d'entreposage de données peut également faciliter l'accès des différents départements d'une entreprise aux données de chacun.
Par exemple, un entrepôt de données peut permettre à une entreprise d'évaluer facilement les données de l'équipe des ventes et d'aider à prendre des décisions sur la manière d'améliorer les ventes ou de rationaliser le service. L’entreprise peut choisir de se concentrer sur les habitudes de consommation de ses clients afin de mieux positionner ses produits et d’accroître ses ventes.
Avec l’entreposage de données, l’entreprise peut collecter des données historiques sur les dépenses de ses clients au cours des dernières décennies, par exemple 20 ans, et exécuter des analyses sur ces données. Les informations obtenues pourraient donner un aperçu des préférences de ses consommateurs. l'heure du jour, du mois ou de l'année avec des ventes plus importantes; ou le client qui dépense le plus pour l’année.
Le stockage et la gestion efficaces des données sont également ce qui rend possibles des processus, tels que l’initiation de réservations de voyages et l’utilisation de guichets automatiques.
Le processus d'exploration de données se décompose en cinq étapes:
- Les organisations collectent des données et les chargent dans leurs entrepôts de données.
- Ils stockent et gèrent ensuite les données, sur des serveurs internes ou dans le cloud.
- Les analystes commerciaux, les équipes de gestion et les professionnels des technologies de l'information accèdent aux données et déterminent comment ils souhaitent les organiser.
- Le logiciel d'application trie ensuite les données en fonction des résultats de l'utilisateur
- L'utilisateur final présente enfin les données dans un format facile à partager, tel qu'un graphique ou un tableau.
Entreposage de données et bases de données
Un entrepôt de données n'est pas nécessairement le même concept qu'une base de données standard. Une base de données est un système transactionnel configuré pour surveiller et mettre à jour les données en temps réel afin de ne disposer que des données les plus récentes. Un entrepôt de données est programmé pour agréger des données structurées sur une période donnée. Par exemple, une base de données peut ne contenir que l'adresse la plus récente d'un client, tandis qu'un entrepôt de données peut contenir toutes les adresses dans lesquelles le client réside depuis 10 ans.
Comparaison des comptes d'investissement Nom du fournisseur Description Divulgation par l'annonceur × Les offres figurant dans ce tableau proviennent de partenariats avec lesquels Investopedia reçoit une rémunération.