Les fichiers en langage C
Date de publication : 07 avril 2008
Par
Jessee Edouard (Accueil)
La manipulation des fichiers en langage C est relativement simple mais nécessite une bonne compréhension des principes qui sont à leur base.
C'est ce que ce tutoriel va tenter de vous expliquer.
I. Introduction
Les entrées/sorties (E/S) ne font pas partie du langage C car ces opérations sont dépendantes
du système. Néanmoins puisqu'il s'agit de tâches habituelles, sa bibliothèque standard est fournie
avec des fonctions permettant de réaliser ces opérations de manière portable. Ces fonctions
sont principalement déclarées dans le fichier stdio.h. Certaines ont déjà été présentées dans les
tutoriels précédents, de même que quelques concepts relatifs aux entrées/sorties en langage C. Aucun rappel ne sera
fait, sauf sur certains concepts jugés importants.
Les entrées/sorties en langage C se font par l'intermédiaire d'entités logiques, appelés flux,
qui représentent des objets externes au programme, appelés fichiers. En langage C, un fichier
n'est donc pas nécessairement un fichier sur disque (ou périphérique de stockage pour être
plus précis). Un fichier désigne en fait aussi bien un fichier sur disque (évidemment) qu'un
périphérique physique ou un tube par exemple. Selon la manière
dont on veut réaliser les opérations d'E/S sur le fichier, qui se font à travers un flux, on
distingue deux grandes catégories de flux à savoir les flux de texte et les flux binaires.
Les flux de texte sont parfaits pour manipuler des données présentées sous forme de texte. Un
flux de texte est organisé en lignes. En langage C, une ligne est une suite de caractères
terminée par le caractère de fin de ligne (inclus) : '\n'. Malheureusement, ce n'est pas
forcément le cas pour le système sous-jacent. Sous Windows par exemple, la marque de fin
de ligne est par défaut la combinaison de deux caractères : CR (Carriage Return) et LF (Line
Feed) soit '\r' et '\n' (notez bien que c'est CR/LF c'est-à-dire CR suivi de LF pas LF
suivi de CR). Sous UNIX, c'est tout simplement '\n'. On se demande alors comment on
va pouvoir lire ou écrire dans un fichier, à travers un flux de texte, de manière portable. Et
bien c'est beaucoup plus simple que ce à quoi vous-vous attendiez : lorsqu'on effectue une
opération d'entrée/sortie sur un flux de texte, les données seront lues/écrites de façon à ce
qu'elles correspondent à la manière dont elles doivent être représentées et non caractère pour
caractère. C'est-à-dire par exemple que, dans une implémentation où la fin de ligne est
provoquée par la combinaison des caractères CR et LF, l'écriture de '\n' sur un flux de texte
va provoquer l'écriture effective des caractères '\r' et '\n' dans le fichier associé. Sur un
flux binaire les données sont lues ou écrites dans le fichier caractère pour caractère.
II. Les fichiers sur disque
La communication avec une ressource externe (un modem, une imprimante, une console, un périphérique de stockage, etc.) nécessite un
protocole de communication (qui peut être texte ou binaire, simple ou complexe, ...)
spécifique de cette ressource et qui n'a donc rien à voir le langage C. La norme définit tout
simplement les fonctions permettant d'effectuer les entrées/sorties vers un fichier sans pour autant définir la notion de matériel ou
même de fichier sur disque afin de garantir la portabilité du langage (ou plus précisément de
la bibliothèque). Cependant, afin de nous fixer les idées, nous n'hésiterons pas à faire appel à ces
notions dans les explications.
Les fichiers sur disque servent à stocker des informations. On peut « naviguer » à l'intérieur
d'un tel fichier à l'aide de fonctions de positionnement (que nous verrons un peu plus loin).
A chaque instant, un « pointeur » indique la position courante dans le fichier. Ce pointeur se
déplace, à quelques exceptions près, après chaque opération de lecture, d'écriture ou appel
d'une fonction de positionnement par exemple. Bien entendu, cette notion de position n'est
pas une spécificité exclusive des fichiers sur disque. D'autres types de fichiers peuvent très
bien avoir une structure similaire.
III. Les messages d'erreur
En langage C il est coutume de retourner un entier même quand une fonction n'est censée
retourner aucune valeur. Cela permet au programme de contrôler les erreurs et même d'en
connaître la cause. Certaines fonctions comme malloc par exemple retournent cependant une
adresse, NULL en cas d'erreur. Pour fournir d'amples informations quant à la cause de
l'erreur, ces fonctions placent alors une valeur dans une variable globale appelée errno (en
fait la norme n'impose pas qu'errno doit être forcément une variable globale !), cette valeur
bien entendu est à priori dépendante de l'implémentation. Ces valeurs doivent être déclarées
dans le fichier errno.h. Par exemple, une implémentation peut définir un numéro d'erreur
ENOMEM qui sera placée dans errno lorsqu'un appel à malloc a échoué car le système
manque de mémoire.
La fonction strerror, déclarée dans string.h, permet de récupérer une chaîne à priori définie
par l'implémentation décrivant l'erreur correspondant au numéro d'erreur passé en argument.
La fonction perror, déclarée dans stdio.h, quant à elle utilise cette chaîne, plus une chaîne
fournie en argument, pour afficher la description d'une erreur. Le texte sera affiché sur
l'erreur standard (stderr). Pour résumer :
est équivalent à :
fprintf(stderr, "%s: %s\n", msg, strerror(errno));
|
Si nous n'avons pas parlé de ces fonctions auparavant, c'est parce que nous n'en avions pas
vraiment jusqu'ici besoin. A partir de maintenant, elles vont être très utiles car les fonctions
d'entrées/sorties sont sujettes à de très nombreuses sortes d'erreurs : fichier non trouvé,
espace sur disque insuffisant, on n'a pas les permissions nécessaires pour lire ou écrire dans le fichier, ...
IV. Ouverture d'un fichier
Toute opération d'E/S dans un fichier commence par l'ouverture du fichier. Lorsqu'un
fichier est ouvert, un flux lui est associé. Ce flux est représenté par un pointeur vers un objet
de type FILE.
Pendant l'ouverture d'un fichier, on doit spécifier comment en désire l'ouvrir : en lecture
(c'est-à-dire qu'on va lire dans le fichier), en écriture (pour écrire), ou en lecture et écriture.
La fonction fopen :
FILE * fopen(const char * filename, const char * mode);
|
permet d'ouvrir un fichier dont le nom est spécifié par l'argument filename selon le mode,
spécifié par l'argument mode, dans lequel on souhaite ouvrir le fichier. Elle retourne l'adresse
d'un objet de type FILE qui représente le fichier à l'intérieur du programme. En cas d'erreur,
NULL est retourné et une valeur indiquant la cause de l'erreur est placée dans errno.
En pratique, dans le cas d'un fichier sur disque, l'argument nom peut être aussi bien un
chemin complet qu'un chemin relatif. Notez bien que les notions de chemin, répertoire (qui
inclut également les notions de répertoire courant, parent, etc.), ... sont dépendantes du
système, elles ne font pas partie du langage C. La plupart du temps, le répertoire courant est
par défaut celui dans lequel se trouve le programme mais, si le système le permet, il est
possible de spécifier un répertoire différent.
Fondamentalement, les valeurs suivantes peuvent être utilisées dans l'argument mode :
- "r" : ouvrir le fichier en lecture. Le fichier spécifié doit déjà exister.
- "w" : ouvrir le fichier en écriture. S'il n'existe pas, il sera créé. S'il existe déjà,
son ancien contenu sera effacé.
- "a" : ouvrir le fichier en mode ajout, qui est un mode dans lequel toutes les
opérations d'écriture dans le fichier se feront à la fin du fichier. S'il n'existe pas, il
sera créé.
Quel que soit le cas, le fichier sera associé à un flux de texte. Pour spécifier qu'on veut ouvrir
le fichier en tant que fichier binaire, il suffit d'ajouter le suffixe 'b' (c'est-à-dire "rb", "wb"
ou "ab").
Sauf dans le cas du mode "ab" et dérivés, dans lequel le pointeur pourrait, selon
l'implémentation, être positionné à la fin du fichier, il sera positionné au début du fichier.
On peut également ajouter un '+' (par exemple : "wb+") dans l'argument mode ce qui aura
pour effet de permettre d'effectuer aussi bien des opérations de lecture que d'écriture sur le
fichier. On dit alors que le fichier est ouvert en mode mise à jour. Il y a cependant une
remarque très importante concernant les fichiers ouverts en mode mise à jour :
- avant d'effectuer une opération de lecture juste après une opération d'écriture, il
faut tout d'abord appeler fflush ou une fonction de positionnement
- avant d'effectuer une opération d'écriture juste après une opération de lecture, il
faut d'abord appeler une fonction de positionnement, à moins d'avoir atteint la fin
du fichier
- dans de nombreuses implémentations, tout fichier ouvert en mode mise à jour est
supposé être un fichier binaire qu'on ait mis oui ou non la lettre 'b'. Personnellement,
je recommande donc de n'utiliser le mode mise à jour qu'avec les fichiers binaires.
Lorsqu'on n'en a plus besoin, il faut ensuite fermer le fichier :
Le programme suivant crée un fichier, hello.txt, pour y écrire ensuite une et une seule ligne :
Hello, world.
#include <stdio.h>
int main()
{
FILE * f;
f = fopen("hello.txt", "w");
if (f != NULL)
{
fprintf(f, "Hello, world\n");
fclose(f);
}
else
perror("hello.txt");
return 0;
}
|
En supposant que pour le système la fin de ligne est représentée par la combinaison des
caractères CR et LF, ce programme est aussi équivalent au suivant :
#include <stdio.h>
int main()
{
FILE * f;
f = fopen("hello.txt", "wb");
if (f != NULL)
{
fprintf(f, "Hello, world\r\n");
fclose(f);
}
else
perror("hello.txt");
return 0;
}
|
V. Exemple : copier un fichier
Il y a plusieurs moyens de réaliser la copie d'un fichier, le plus simple est peut-être de copier
la source vers la destination octet par octet. Voici un programme qui réalise une telle copie :
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
char * saisir_chaine(char * lpBuffer, int buf_size);
int main()
{
FILE * fsrc, * fdest;
char source[FILENAME_MAX], dest[FILENAME_MAX];
int c;
printf("source : ");
saisir_chaine(source, sizeof(source));
fsrc = fopen(source, "rb");
if (fsrc == NULL)
{
perror(source);
exit(EXIT_FAILURE);
}
printf("dest : ");
saisir_chaine(dest, sizeof(dest));
fdest = fopen(dest, "wb");
if (fdest == NULL)
{
perror(dest);
exit(EXIT_FAILURE);
}
while ((c = getc(fsrc)) != EOF)
putc(c, fdest);
fclose(fdest);
fclose(fsrc);
return 0;
}
char * saisir_chaine(char * lpBuffer, int buf_size)
{
char * p;
fgets(lpBuffer, buf_size, stdin);
if ((p = strchr(lpBuffer, '\n')) != NULL)
*p = '\0';
else
{
int c;
do
c = getchar();
while (c != EOF && c != '\n');
}
return lpBuffer;
}
|
VI. Les erreurs d'E/S
Une erreur d'E/S est erreur qui peut se produire lors d'une tentative d'opération d'E/S, par
exemple : fin de fichier atteinte, tentative d'écriture dans un fichier ouvert uniquement en
lecture, tentative de lecture dans un fichier ouvert uniquement en lecture, etc.
La fonction feof :
peut être appelé à n'importe quel moment pour connaître si l'on a déjà atteint la fin du fichier.
Je rappelle qu'un programme ne peut affirmer que la fin d'un fichier a été atteinte qu'après avoir tenté
de lire dans le fichier alors qu'on se trouve déjà à la fin c'est-à-dire derrière le dernier octet,
pas juste après avoir lu le dernier octet, donc faites gaffe.
Evidemment, une telle fonction ne sera utilisée que sur un fichier ouvert en lecture. Elle
retourne VRAI si la fin de fichier a été atteinte et FAUX dans le cas contraire. Cette
information est en fait maintenue par un indicateur de fin de fichier qui indique à tout
moment si on a oui ou non déjà atteint la fin du fichier. Après un appel fructueux à une
fonction de positionnement, l'indicateur de fin de fichier est remis à zéro.
La fonction ferror :
permet de connaître si une erreur s'est produite lors de la dernière opération d'E/S sur f. Cette
information est maintenue en permanence par un indicateur d'erreur.
Attention, une fois qu'une erreur s'est produite, l'indicateur d'erreur ne sera remis à zéro
qu'après un appel à clearerr.
Cette fonction remet à zéro l'indicateur d'erreur du fichier f.
VI. Positionnement dans un fichier
La fonction fseek
int fseek(FILE * f, long offset, int origin);
|
Permet de modifier la position courante dans un fichier. La nouvelle position dépend des
valeurs des arguments offset qui représente le déplacement et origin qui représente l'origine.
Les valeurs qu'on peut donner à origin sont :
- SEEK_SET : le pointeur sera ramené à offset caractères par rapport au début du
fichier
- SEEK_CUR : le pointeur sera ramené à offset caractères par rapport à la position
courante
- SEEK_END : le pointeur sera ramené à offset caractères par rapport à la fin du
fichier.
Bien entendu, le déplacement peut être positif ou négatif. Si la fonction réussit, 0 est retourné
(une valeur différente de zéro indique donc une erreur).
L'utilisation de cette fonction avec un flux de texte peut donner des résultats inattendus à
cause du coup du '\n' ... Pour aller au n-ième caractère d'un fichier associé à un flux de
texte (ce qui entraîne que la fin de ligne sera vue du programme comme un et un seul
caractère : '\n') par exemple, utilisez la méthode suivante :
fseek(f, 0L, SEEK_SET);
for(i = 0; i < n; i++)
getc(f);
|
Cette technique est aussi connue sous le nom d'accès séquentiel, par opposition à accès
aléatoire (utilisant fseek, etc.).
Dans la pratique, on ne sera jamais confronté à un tel cas. Bon, « jamais » c'est peut être un
peu trop mais en tout cas je peux vous affirmer que je n'ai jamais eu à le faire. Si on doit faire
beaucoup de « va et vient » dans un fichier, c'est tout simplement une erreur de l'avoir ouvert
en tant que fichier texte.
La fonction ftell
Permet de connaître la position courante dans le fichier. Dans le cas où le fichier est associé à
un flux binaire, il s'agit du nombre de caractères entre le début du fichier et la position
courante. Si le fichier est associé à un flux de texte, la valeur retournée par cette fonction est
tout simplement une information représentant la position actuelle dans le fichier et on ne peut
rien dire de plus. Quel que soit le cas, le retour de ftell pourra éventuellement être utilisée
dans un futur appel fseek avec SEEK_SET pour revenir à la même position.
Les fonctions fgetpos et fsetpos
La fonction fgetpos permet de sauvegarder la position courante dans un fichier. On
pourra ensuite ultérieurement revenir à cette position à l'aide de la fonction fsetpos.
int fgetpos(FILE * f, fpos_t * p_pos);
int fsetpos(FILE * f, const fpos_t * p_pos);
|
Le type fpos_t est un type limité à usage de ces fonctions. On ne doit passer à fsetpos qu'une
valeur obtenue à l'aide de fgetpos. En cas de succès, 0 est retourné.
La fonction rewind
Cette fonction permet de « rembobiner » un fichier.
est équivalent à :
fseek(f, 0L, SEEK_SET);
clearerr(f);
|
Position courante
En général, les opérations de lecture (respectivement d'écriture) commencent la lecture
(respectivement l'écriture) à partir de la position courante puis ensuite déplacent le pointeur
selon le nombre de caractères lus (respectivement écrits). Il existe toutefois des exceptions
comme dans le cas ou le fichier est ouvert en mode ajout par exemple, auquel cas toutes les
opérations d'écriture se feront à la fin du fichier, indépendamment de la position courante.
VIII. Le traitement par blocs
La bibliothèque standard offre également des fonctions permettant de réaliser des opérations
d'entrées/sorties par blocs d'octets. Il s'agit des fonctions fread et fwrite.
size_t fread(void * buffer, size_t size, size_t nobj, FILE * f);
size_t fwrite(const void * buffer, size_t size, size_t nobj, FILE * f);
|
fread lit nobj objets de taille size chacune à partir de la position courante dans f pour les placer
dans un buffer. Elle retourne ensuite le nombre d'objets effectivement lus.
A l'inverse fwrite écrit nobj objets de buffer de taille size chacune en destination de f. Elle
retourne ensuite le nombre d'objets effectivement écrits.
Par exemple, voici une manière d'écrire "Bonjour" dans un fichier en utilisant fwrite.
#include <stdio.h>
#include <string.h>
int main()
{
FILE * f;
char s[] = "Bonjour";
f = fopen("bonjour.txt", "wb");
if (f != NULL)
{
fwrite(s, sizeof(char), strlen(s), f);
fclose(f);
}
else
perror("bonjour.txt");
return 0;
}
|
IX. Opérations sur les fichiers
IX-A. Renommer ou déplacer un fichier
La fonction rename :
int rename(const char * oldname, const char * newname);
|
permet de renommer un fichier lorsque cela est possible. Si la fonction réussit, 0 est retourné.
IX-B. Supprimer un fichier
La fonction remove :
int remove(const char * filename);
|
permet de supprimer un fichier. Si la fonction réussit, 0 est retourné.
X. Les fichiers temporaires
Un fichier temporaire est un fichier utilisé par un programme puis supprimé lorsque celui-ci
se termine. La fonction tmpfile :
permet de créer un fichier en mode "wb+" qui sera automatiquement supprimé à la fin du
programme.
On peut toujours bien sûr créer un fichier temporaire « manuellement ». Dans ce cas, il vaut
mieux lui donner un nom généré par tmpnam afin de s'assurer qu'aucun autre fichier porte
déjà ce nom.
char * tmpnam(char * name);
|
Cette fonction requiert que name soit un buffer d'au moins L_tmpnam octets autrement il est
possible qu'elle ne pourra pas contenir le nom généré par cette fonction ce qui va provoquer
un débordement de tampon !
XI. Rediriger un flux d'E/S
La fonction freopen :
FILE * freopen(const char * filename, const char * mode, FILE * f);
|
ferme le fichier associé au flux f, ouvre le fichier dont le nom est spécifié par filename selon le
mode spécifié par mode en lui associant le flux représenté par f puis retourne f ou NULL si
une erreur s'est produite. Dans le programme suivant, la sortie standard est redirigée vers le
fichier out.txt.
#include <stdio.h>
int main()
{
if (freopen("out.txt", "w", stdout) != NULL)
{
printf("Hello, world\n");
fclose(stdout);
}
else
perror("out.txt");
return 0;
}
|
XII. Exercices
1. Ecrire un programme qui écrit le contenu entier d'un tableau de 10 entiers dans un fichier
puis écrire un autre programme qui lit les dix entiers du fichier puis les affiche sur la sortie
standard.
2. Ecrire un programme qui affiche la longueur d'un fichier dont le nom sera fourni par
l'utilisateur (astuce : utiliser ftell).
3. Ecrire un programme qui permet de découper un fichier en un ou plusieurs morceaux puis
écrire un autre programme qui permet de restituer le fichier original à l'aide des découpes.
4. Trouver puis implémenter une méthode simple permettant de compresser un fichier (même
un programme qui n'est vraiment efficace que pour un type particulier de fichier).


Les sources présentées sur cette page sont libres de droits,
et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation
constitue une oeuvre intellectuelle protégée par les droits d'auteurs. Copyright ©
2008 Melem. Aucune reproduction,
même partielle, ne peut être faite de ce site et de l'ensemble de son contenu :
textes, documents, images, etc sans l'autorisation expresse de l'auteur.
Sinon vous encourez selon la loi jusqu'à 3 ans de prison et jusqu'à 300 000 E
de dommages et intérêts.
Cette page est déposée à la
SACD.