Comment fonctionne la compression de fichiers?

La compression des fichiers est au cœur du fonctionnement du Web moderne, pourrait-on dire, car cela nous permet de partager des fichiers qui seraient autrement trop longs à transférer. Mais comment ça fonctionne?

La compression des fichiers est au cœur du fonctionnement du Web moderne, pourrait-on dire, car cela nous permet de partager des fichiers qui seraient autrement trop longs à transférer.  Mais comment ça fonctionne?
Publicité

Nous avons tous entendu parler de la compression de fichiers. Quiconque télécharge régulièrement des fichiers sur le Web connaît des formats comme ZIP et RAR, et quiconque édite des fichiers multimédia sait que la compression est nécessaire pour partager des images, de la musique et des vidéos sur le Web sans utiliser toute la bande passante. La compression des fichiers est au cœur du fonctionnement du Web, pourrait-on dire, car cela nous permet de partager des fichiers qui seraient autrement trop longs à transférer. Mais comment ça fonctionne?

Ce n'est rien de magique, mais c'est le résultat de beaucoup de travail de la part de beaucoup de gens très intelligents. Explorons comment fonctionne la compression de fichiers en examinant les deux principaux types de compression: sans perte et avec perte.

Juste un avertissement - je vais trop simplifier les choses ici pour tenter de le rendre lisible par des majors non-maths. Consultez les articles liés à Wikipedia pour plus de profondeur, et les sources de Wikipedia pour encore plus.

Compression sans perte

La compression sans perte fonctionne essentiellement en supprimant la redondance. Qu'est-ce que ça veut dire? Simplifions les choses. Cette pile de briques représentera nos données:

comment fonctionne la compression de fichiers

Comme vous pouvez le voir, nous avons deux briques rouges, cinq jaunes et trois bleues. La manière la plus simple de représenter ceci est celle que vous voyez ci-dessus: les briques elles-mêmes. Mais ce n'est pas la seule façon de le représenter. Je pourrais aussi faire ceci:

comment fonctionne la compression de fichiers

Dans l'image ci-dessus, vous pouvez voir exactement la même information - deux rouges, cinq jaunes et trois bleus - mais cela prend beaucoup moins de place. J'ai représenté des briques redondantes en utilisant des nombres, ce qui signifie que je n'ai besoin que de trois briques pour représenter dix.

Cela vous donne une idée approximative de la façon dont la compression sans perte est possible. Les informations redondantes sont remplacées par des instructions indiquant à l'ordinateur combien de données identiques sont répétées. Un autre exemple simplifié:

fffffffuuuuuuuuuuuu

Peut être "compressé" pour:

f7u12

Ce n'est qu'une méthode de compression sans perte, bien sûr, mais elle montre comment cela est possible. D'autres astuces mathématiques sont utilisées, mais la principale chose à retenir à propos de la compression sans perte est que si l'espace est temporairement sauvegardé, il est possible de reconstruire le fichier original entièrement à partir du fichier compressé. Si vous voyez trois briques avec des chiffres, vous savez exactement comment faire la pile. Aucune information n'est perdue, tout comme le nom sans perte implique.

Des programmes comme WinZip sont basés sur la compression sans perte. Ils suppriment ces informations redondantes lorsque vous compressez (ou "zip") le fichier et le restaurez lorsque vous décompressez (ou "décompressez"). Rien n'est perdu.

Dans le monde de l'image, les fichiers PNG utilisent également la compression sans perte. C'est pourquoi ils offrent une taille de fichier plus petite pour les images avec beaucoup d'espace uniforme: cette information redondante est représentée en utilisant des instructions.

Bien sûr, tout cela est simplifié à l'extrême, mais le point fondamental est franchi. En savoir plus sur la compression sans perte sur Wikipedia, si vous êtes intéressé.

La compression avec perte

Bien sûr, il y a seulement beaucoup de choses que vous pouvez accomplir en utilisant uniquement des méthodes sans perte. Heureusement, ils ne sont pas la seule option: vous pouvez également simplement supprimer des informations. C'est ce qu'on appelle la compression avec perte, et ce n'est pas aussi fou que cela puisse paraître; en fait, vous avez probablement beaucoup de fichiers sur votre ordinateur faits en utilisant une compression avec perte.

Un MP3, par exemple. Si vous êtes comme la plupart des gens, votre ordinateur stocke des milliers d'entre eux pour vous, mais saviez-vous qu'ils ne contiennent pas toutes les informations audio de l'enregistrement original? Certains sons, que les humains ne peuvent ou ne peuvent à peine entendre, sont supprimés dans le cadre de la compression. Plus vous compressez un fichier, plus les informations sont supprimées, c'est pourquoi un fichier trop compressé commencera à paraître boueux.

La compression avec perte a tendance à être principalement utilisée pour les fichiers multimédias - images, sons et vidéos. L'utilisation d'une compression avec perte pour un fichier texte serait problématique, car l'information résultante serait brouillée. Toutefois, il n'est pas toujours nécessaire que les fichiers multimédias incluent toutes les informations.

Un autre exemple de compression avec perte est l'image JPEG. D'une manière générale, les images vues sur le web n'ont pas besoin d'être aussi de haute qualité que les images destinées à l'impression. En tant que tel, vous pouvez supprimer beaucoup d'informations redondantes dans une image Web, même si cela aurait l'air terriblement imprimé.

Bien sûr, la compression répétée d'un fichier à l'aide de méthodes avec perte diminue la qualité - chaque fois que vous le faites, plus de données sont perdues. Voici une photo que j'ai compressée trois fois pour le démontrer:

comment fonctionne la compression de fichiers

Vous pouvez voir de gauche à droite comment la qualité diminue. Cela peut ne pas avoir d'importance, en fonction de l'utilisation de l'image, et c'est pourquoi la compression avec perte existe.

Il est important de se rappeler que les fichiers compressés à l'aide de méthodes avec perte perdent réellement des données, ce qui signifie que vous ne pouvez pas recréer le fichier original à partir d'un fichier compressé à l'aide de méthodes avec perte. C'est évident quand on y pense, mais de nombreux projets d'impression ont été ruinés par manque de compréhension de ce point clé.

Je n'ai vraiment que gratté la surface ici, alors s'il vous plaît: en savoir plus sur la compression avec perte sur Wikipedia. C'est plutôt fascinant.

Conclusion

La compression a contribué à faire du Web ce que c'est. Dans les jours de dialup les images compressées ont apporté des photos à notre navigateur, au moins pas à une vitesse acceptable. La vidéo compressée rend les sites comme YouTube possibles, et quiconque utilise des réseaux de partage de fichiers connaît les fichiers ZIP et RAR.

Avez-vous quelque chose à ajouter? Je suis sûr que j'ai manqué quelques points clés afin de me renseigner (et les autres lecteurs) dans les commentaires ci-dessous.

Crédit d'image: image de printemps via Shutterstock

In this article