Site icon tachicart

Chapite II : Introduction aux systèmes de gestion des bases des données

I.1       Le système traditionnel de gestion des données par fichiers

I.1.1        Système traditionnel de gestion des données

Traditionnellement, les données étaient stockées et traitées à l’aide de systèmes de traitement de fichiers traditionnels (fichiers texte, csv, etc.) . Dans ces systèmes de fichiers traditionnels, chaque fichier est indépendant des autres fichiers, et les données des différents fichiers ne peuvent être intégrées qu’en écrivant un programme individuel pour chaque application. Par exemple, dans la figure suivante on considère que chaque département a son propre programme pour lire et transformer les données reçus (.xlsx, .txt, .docx ) dans une format quelconque (.xlsx).

Les données et les programmes d’application qui utilisent les données sont disposés de telle sorte que toute modification des données nécessite la modification de tous les programmes qui les utilisent. Ceci est dû au fait que chaque fichier est codé en dur avec des informations spécifiques comme le type de données, la taille des données, etc. Parfois, il n’est même pas possible tous les programmes qui utilisent ces données et l’identification se fait par essais et erreurs.

Le système de traitement des fichiers d’une organisation est illustré dans la figure suivante. Tous les domaines fonctionnels de l’organisation créent, traitent et diffusent ses propres fichiers. Les fichiers tels que l’inventaire et le paiement génèrent des fichiers séparés et ne communiquent pas entre eux.

Sans aucun doute, une telle organisation était simple à gérer et permettait un meilleur contrôle local, mais les données de l’organisation sont dispersées dans les sous-systèmes fonctionnels. De nos jours, les bases de données sont préférées en raison des nombreux inconvénients des systèmes de fichiers traditionnels comme on va détailler par la suite.

I.1.2        Inconvénients du système traditionnel de gestion des données

Un système de fichiers traditionnel présente les inconvénients suivants :

  • Redondance des données : comme chaque application a son propre fichier de données, les mêmes données peuvent être enregistrées et stockées dans plusieurs fichiers. Par exemple, le fichier inventaire et le fichier de paiement contiennent tous deux des données sur les produits de l’entreprise, leurs désignation, etc. Il en résulte des éléments de données inutiles, en double ou redondants. Cette redondance nécessite un espace de stockage supplémentaire ou plus important, coûte plus de temps et d’argent, et exige des efforts supplémentaires pour maintenir tous les fichiers à jour.
  • Incohérence des données : la redondance des données entraîne une incohérence des données, en particulier lorsque les données doivent être mises à jour. L’incohérence des données est due au fait que les mêmes éléments de données qui apparaissent dans plus d’un fichier ne sont pas mis à jour simultanément dans chacun des fichiers.

Par exemple, l’entreprise a augmenté le poids d’un de ses produit, le fichier inventaire est immédiatement mis à jour, mais pas nécessairement le fichier de paiement l’est aussi. Il en résulte deux spécifications différentes du même produit au même moment. Au fil du temps, ces divergences dégradent la qualité de l’information contenue dans le fichier de données, ce qui a une incidence sur la qualité de l’information contenue dans le fichier de données, ce qui affecte l’exactitude des rapports.

  • Manque d’intégration des données : Comme il existe des fichiers de données indépendants, les utilisateurs ont du mal à obtenir des informations sur toute requête qui nécessite l’accès aux données stockées dans plusieurs fichiers. Dans ce cas, des programmes compliqués doivent être développés pour récupérer les données de chaque fichier ou les utilisateurs doivent collecter manuellement les informations requises.
  • Dépendance du programme : Les applications/programmes dépendent des données surtout de leur organisation, format et de leur emplacement physique. Par exemple, les fichiers/rapports produits par le système de traitement des fichiers dépendent du programme, ce qui signifie que si un changement dans le format ou la structure des données et des enregistrements du fichier, les programmes doivent être modifiés en conséquence. De même, un nouveau programme devra être développé pour produire un nouveau rapport.
  • Partage de données limité : les possibilités de partage de données sont limitées avec le système de système de fichiers. Chaque application a ses propres fichiers privés et les utilisateurs ont peu de choix de partager les données en dehors de leurs propres applications. Ainsi, des programmes complexes doivent être développé pour obtenir des données de plusieurs fichiers incompatibles.
  • Mauvais contrôle des données : Dans l’approche traditionnelle, il n’y avait pas de contrôle centralisé au niveau des éléments de données, un système de fichiers traditionnel est donc décentralisé par nature. Il est possible que champ de données puisse avoir plusieurs noms définis par les différents départements d’une organisation et selon le fichier dans lequel il se trouve. Cette situation conduit à une signification différente d’un champ de données dans un contexte différent ou à une même signification pour des champs différents. Cela entraîne un mauvais contrôle des données.
  • Problème de sécurité : Il est très difficile de respecter les contrôles de sécurité et les droits d’accès dans un système de fichiers traditionnel, car les programmes d’application sont ajoutés de manière provisoire.
  • La capacité de manipulation des données est inadéquate : Elle est très limitée dans les systèmes de fichiers traditionnels puisqu’ils ne fournissent pas de relations solides entre les données de différents fichiers.
  • Nécessite un effort de programmation excessif : Un effort de programmation excessif est nécessaire pour développer un nouveau programme d’application en raison de l’interdépendance très élevée entre le programme et les données dans un système de fichiers. Chaque nouvelle application exige que les développeurs doivent repartir de zéro en concevant de nouveaux formats et descriptions de fichiers, puis la logique d’accès aux fichiers pour chaque nouveau fichier.

I.2       Système de gestion des bases des données (SGBD)

Une organisation doit disposer de données (informations) précises et fiables pour prendre des décisions efficaces. Les données (informations) constituent l’épine dorsale et la ressource la plus critique d’une organisation qui permettent aux gestionnaires et aux organisations d’obtenir un avantage concurrentiel. En cette ère d’explosion de l’information, où les gens se trouvent devant une quantité énorme de données, obtenir la bonne information, dans la bonne quantité, au bon moment n’est pas une tâche facile. Ainsi, seul les organisations qui gèrent l’information avec succès qui auront plus de performance.

Un Système de Gestion de Base de Données (SGBD) simplifie les tâches de gestion des données et d’extraction des informations utiles en temps voulu. Un SGBD est une collection intégrée de fichiers connexes, ainsi que les détails de l’interprétation des données. Un SGBD est un système ou un programme logiciel qui permet d’accéder aux données contenues dans une base de données.

L’objectif du SGBD est de fournir une méthode pratique et efficace pour définir, stocker et récupérer les informations stockées dans la base de données. La base de données et les systèmes de gestion de base de données sont devenus essentiels pour gérer des entreprises, des gouvernements, des écoles, des universités, des banques, etc.

Le SGBD est un programme ou un groupe de programmes qui fonctionne en conjonction avec le système d’exploitation pour créer, traiter, stocker, récupérer, contrôler et gérer les données. Il agit comme une interface entre le programme d’application et les données stockées dans la base de données.

Il peut également être défini comme un système d’enregistrement informatisé qui stocke des informations et permet aux utilisateurs d’ajouter, de supprimer, de modifier, de récupérer et de mettre à jour ces informations. Le SGBD remplit les cinq fonctions principales suivantes :

  • Définir, créer et organiser une base de données : Le SGBD établit les relations logiques entre les différents éléments de données (enregistrements) d’une base de données et définit également les schémas de la base données.
  • Saisir les données : Il remplit la fonction de saisie des données dans la base de données par le biais d’un dispositif d’entrée (comme un écran de données ou un système à commande vocale) avec l’aide de l’utilisateur.
  • Traitement des données : Il exécute la fonction de manipulation et de traitement des données stockées dans la base de données.
  • Maintenir l’intégrité et la sécurité des données : Il permet un accès limité de la base de données aux utilisateurs autorisés afin de maintenir l’intégrité et la sécurité des données.
  • Interroger la base de données : Il permet de répondre aux requêtes sollicitées par les utilisateurs et fournit aux décideurs les informations dont ils ont besoin pour prendre des décisions importantes. Ces informations sont fournies en interrogeant la base de données à l’aide du langage SQL.

Dans le marché, on peut trouver plusieurs SGBD, les plus populaires et les plus courants sont: Microsoft Access, Microsoft SQL Server, MySQL , Oracle, MariaDB, MongoDB, PostgreSQL, etc.

I.3       Concepts de base

Dans une organisation, les données sont la ressource la plus fondamentale. Pour gérer efficacement l’organisation, il est essentiel d’organiser et de gérer correctement les données. La définition formelle des principaux termes utilisés dans les bases de données et les systèmes de bases de données est définie dans cette section.

I.3.1        Les données [data]

Le terme “données” peut être défini comme des faits connus qui peuvent être enregistrés et stockés sur des supports informatiques. Il est également défini comme des faits bruts à partir desquels l’information requise est produite.

I.3.2        L’information

L’information constitue le support des connaissances et des communications humaines. Elle est à la fois un outil de communication interne (elle permet d’assurer la coordination entre les différents services et acteurs de l’entreprise), un outil de communication externe (une organisation diffuse de l’information vers son environnement extérieur en faisant par exemple de la publicité) et un outil de cohésion sociale (la diffusion d’informations sur les rôles de chacun dans l’entreprise permet de renforcer le sentiment d’appartenance à l’organisation et donc la motivation collective).

Les données et les informations sont étroitement liées et sont souvent utilisées de manière interchangeable. L’information n’est rien d’autre que des données raffinées. En d’autres termes, on peut dire que l’information est une donnée traitée, organisées ou résumées. L’l’information est une donnée qui a été transformée en un contenu significatif et utile et communiquées à un destinataire qui les utilise pour prendre des décisions. L’information consiste en des données, des images, du texte, des documents et de la voix, mais toujours dans un contenu significatif. Nous pouvons donc dire que l’information est quelque chose de plus que de simples données. Les données sont traitées pour créer des informations. Le destinataire reçoit l’information et ensuite prend une décision et entreprend une action, qui peut déclencher d’autres actions.

Les données [data] sont traitées [processing] pour créer des informations. Le destinataire [user] reçoit l’information, puis prend une décision et effectue une action, qui peut déclencher d’autres actions.

De nos jours, ce ne sont pas les données qui manquent, mais les informations de qualité. La qualité signifie que l’information est exacte, opportune et pertinente, ce qui constituent les trois principaux attributs clés de l’information :

  • Exactitude : cela signifie que l’information est exempte d’erreurs et qu’elle reflète clairement et précisément la signification des données sur lesquelles elle est basée. Cela signifie également qu’elle est exempte de tout parti pris et qu’elle transmet une image exacte au destinataire.
  • Actualité : les destinataires reçoivent l’information au moment où ils en ont besoin et dans les délais requis.
  • Pertinence : il s’agit de l’utilité de l’information pour les personnes concernées. Il s’agit d’une question très subjective. Certaines informations qui sont pertinentes pour une personne peuvent ne pas être pertinentes pour une autre et vice versa. Alors que le prix du lait pur est très important pour Centrale Danone, le prix du semi-conducteurs n’est pas important. Pour Xiaomi c’est l’inverse.

Ainsi, une organisation qui dispose d’un bon système d’information, qui produit des informations exactes, opportunes et pertinentes survivront et garderont une meilleure performance. Tandis que celles qui ne réalisent pas l’importance de l’information feront bientôt faillite.

I.3.3        Méta-données [metadata]

Les méta-données sont les données relatives aux données, ce sont les informations qui complètent les données réelles. Les méta-données décrivent les objets de la base de données et facilitent l’accès ou la manipulation de ces objets ou leur manipulation. Les méta-données décrivent la structure de la base de données, les tailles des types de données, les contraintes, les applications, les autorisations, etc. Ces éléments sont utilisées comme un outil intégral pour la gestion des ressources d’information.

I.3.4        Base de données [database]

Une base de données (BD) est une collection de données interdépendantes stockées ensemble avec une redondance contrôlée pour servir une ou plusieurs applications de manière optimale. Les données sont stockées de telle manière qu’elles sont indépendantes des programmes utilisés par les personnes pour accéder aux données. L’approche utilisée pour ajouter de nouvelles données, modifier et extraire les données existantes de la base de données est commune et contrôlée.

Une BD est également définie comme une collection de données logiquement liées stockées ensemble et conçues pour répondre aux besoins d’information d’une organisation.

Par exemple, les informations des étudiants (cne, apoge, nom, prenom…), les modules suivies et leurs notes obtenues forment une base de données.

Les bases de données sont organisées par champs, enregistrements et fichiers. Ces derniers sont brièvement décrits comme suit :

  • Champs [fields] : Il s’agit de la plus petite unité de données qui a une signification pour ses utilisateurs. C’est un élément de données. On peut dire que les champs sont des métadonnées au sein d’une table qui décrivent les données dans cette table. Le nom, CNE, la note et le numéro de téléphone sont des exemples de champs. En pratique, les champs sont représentés dans la base de données par des valeurs.
  • Enregistrements[records]: L’enregistrement est une collection de valeurs des champs logiquement liés et chaque champ possède un nombre fixe d’octets et un type de données fixe. On peut aussi dire qu’un enregistrement est un ensemble complet des valeurs des champs. Les enregistrements sont de deux types : les enregistrements de longueur fixe et les enregistrements de longueur variable. Par exemple, les valeurs liés à un seul étudiant dans la BD ( achiri, reda, 1123245, 1254, 12.5, validé) correspond à un enregistrement.
  • Fichiers [files] : Un fichier est une collection d’enregistrements liés. En général, tous les enregistrements d’un fichier ont la même taille et le même type d’enregistrement, mais ce n’est pas toujours vrai. Les enregistrements d’un fichier peuvent être de longueur fixe ou variable ou de longueur variable, en fonction de la taille des enregistrements contenus dans un fichier. La BD contenant des enregistrements sur les différents étudiants est un exemple de fichier.

I.3.5        Les composants d’une base de données

Une base de données se compose de quatre éléments, comme le montre la figure suivante :

  • Enregistrements : défini comme un élément d’information distinct et sont expliqué dans la section précédente.
  • Relations : elles représentent une correspondance entre divers enregistrements.
  • Contraintes : Ce sont les prédicats qui définissent les états corrects de la base de données.
  • Schéma : Il décrit l’organisation des données et des relations au sein de la base de données. Le schéma consiste en des définitions des différents types d’enregistrements de la base de données, les éléments de données qu’ils contiennent et les ensembles dans lesquels ils sont regroupés. La structure de stockage de la base de données est décrite par le schéma de stockage. Le schéma conceptuel définit la structure des données stockées. Le schéma externe définit une vue de la base de données pour des utilisateurs particuliers.
Quitter la version mobile