Spécification du conteneur WebP

Introduction

WebP est un format d'image qui utilise (i) l'encodage d'image clé VP8 pour compresser des données d'image avec pertes ou (ii) utiliser l'encodage WebP sans perte. Ces schémas d'encodage devraient être plus efficaces que les anciens formats, tels que JPEG, GIF et PNG. Il est optimisé pour le transfert rapide d'images sur le réseau (par exemple, pour les sites Web). Le format WebP présente également une parité de fonctionnalités (profil de couleur, métadonnées, animation, etc.) avec d'autres formats. Ce document décrit la structure d'un fichier WebP.

Le conteneur WebP (c'est-à-dire le conteneur RIFF pour WebP) permet de prendre en charge des fonctionnalités au-delà du cas d'utilisation de base de WebP (c'est-à-dire un fichier contenant une seule image encodée en tant que frame clé VP8). Le conteneur WebP est compatible avec les éléments suivants :

Compression sans perte : une image peut être compressée sans perte à l'aide du format WebP sans perte.
Métadonnées : les métadonnées d'une image peuvent être stockées au format Exif (Exchangeable Image File Format) ou XMP (Extensible Metadata Platform).
Transparence : une image peut être transparente, c'est-à-dire comporter un canal alpha.
Profil de couleur : une image peut comporter un profil ICC intégré, comme décrit par le International Color Consortium.
Animation : une image peut comporter plusieurs images avec des pauses entre elles, ce qui en fait une animation.

Dénomination

Il est RECOMMANDÉ d'utiliser les types suivants lorsque vous faites référence au conteneur WebP :

Nom du format du conteneur	WebP
Extension de nom de fichier	.webp
MIME-type	image/webp
Identifiant de type uniforme	org.webmproject.webp

Terminologie et principes de base

Les mots clés "DOIT", "NE DOIT PAS", "OBLIGATOIRE", "DEVRAIT", "NE DOIT PAS", "DEVRAIT", "NE FAUT PAS", "RECOMMANDÉ", "NON RECOMMANDÉ", "PEUT" et "FACULTATIF" dans cette doivent être interprétées conformément à la norme BCP 14 RFC 2119 RFC 8174. quand, et seulement quand, ils apparaissent en majuscules, comme illustré ici.

Un fichier WebP contient une image fixe (c'est-à-dire une matrice de pixels encodée) ou une animation. Elle peut également contenir des éléments de transparence des informations, un profil de couleur et des métadonnées. Nous appelons la matrice de pixels comme le canevas de l'image.

La numérotation des bits dans les diagrammes de fragments commence à 0 pour le bit le plus significatif. ("MSB 0"), comme décrit dans le document RFC 1166.

Vous trouverez ci-dessous d'autres termes utilisés dans ce document :

Lecteur/Rédacteur: Le code qui lit les fichiers WebP est appelé lecteur, tandis que le code qui les écrit est appelé écrivain.
uint16: Entier petit-endian non signé de 16 bits.
uint24: Entier non signé de 24 bits, little-endian.
uint32: Entier non signé de 32 bits, en ordre octets de basse à haute.
FourCC: Un code à quatre caractères (FourCC) est un uint32 créé en concatenant quatre caractères ASCII dans l'ordre little-endian. Cela signifie "aaaa" (0x61616161) et "AAAA" (0x41414141) sont traitées comme des valeurs FourCCs différentes.
Basé sur 1: Un champ d'entier non signé stockant des valeurs décalées de -1, par exemple, stockerait la valeur 25 sous la forme 24.
ChunkHeader('ABCD'): Utilisé pour décrire l'en-tête FourCC et Taille de bloc de blocs individuels, où "ABCD" est le code FourCC du bloc. La taille de cet élément est de 8 octets.

Format de fichier RIFF

Le format de fichier WebP est basé sur le format de fichier RIFF (Resource Interchange File Format). le format du document.

L'élément de base d'un fichier RIFF est un fragment. Il comprend les éléments suivants:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                         Chunk FourCC                          |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                          Chunk Size                           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         Chunk Payload                         :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Segment FourCC: 32 bits: Code ASCII à quatre caractères utilisé pour l'identification des fragments.
Taille de fragment : 32 bits (uint32): La taille du fragment en octets, à l'exclusion de ce champ, le fragment ou une marge intérieure.
Charge utile du fragment : taille du fragment en octets: Charge utile des données. Si la valeur Chunk Size est impaire, un seul octet de remplissage (qui DOIT être 0 pour être conforme à RIFF) est ajouté.

Remarque : Selon la convention RIFF, les codes FourCC de bloc en majuscules sont des blocs standards qui s'appliquent à tous les formats de fichier RIFF, tandis que les codes FourCC spécifiques à un format de fichier sont tous en minuscules. WebP ne respecte pas cette convention.

En-tête du fichier WebP

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|      'R'      |      'I'      |      'F'      |      'F'      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                           File Size                           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|      'W'      |      'E'      |      'B'      |      'P'      |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

'RIFF' : 32 bits: Les caractères ASCII R, I, F et F.
Taille de fichier : 32 bits (uint32): Taille du fichier en octets, à partir du décalage 8. La valeur maximale de ce champ est de 2^32 moins 10 octets, et la taille de l'ensemble du fichier est donc 4 Gio moins 2 octets.
"WEBP" : 32 bits: Les caractères ASCII "W", "E", "B", "P".

Un fichier WebP doit commencer par un en-tête RIFF avec le code FourCC "WEBP". La taille du fichier dans l'en-tête correspond à la taille totale des fragments qui suivent, plus 4 octets pour le code FourCC "WEBP". Le fichier NE DOIT PAS contenir de données après les données spécifiées par Taille de fichier. Les lecteurs PEUVENT analyser ces fichiers, en ignorant les données. Comme la taille d’un segment est égale, la taille donnée par l’en-tête RIFF est également. Le contenu de chaque fragment est décrit dans les éléments suivants : .

Format de fichier simple (avec perte)

Cette mise en page DOIT être utilisée si l'image nécessite un encodage avec perte et qu'elle ne ont besoin de transparence ou d'autres fonctionnalités avancées offertes par le format étendu. Les fichiers ayant cette mise en page sont plus petits et pris en charge par des logiciels plus anciens.

Format de fichier WebP (avec perte) simple :

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                    WebP file header (12 bytes)                |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        'VP8 ' Chunk                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

"VP8" Fragment:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8 ')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                           VP8 data                            :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Données VP8 : taille de bloc en octets: Données du flux de bits VP8.

Notez que le quatrième caractère du code FourCC "VP8" est un espace ASCII (0x20).

La spécification du format VP8 bitstream est décrite dans Format de données VP8 et Guide de décodage. Notez que l'en-tête de la trame VP8 contient la trame VP8. la largeur et la hauteur. Il s'agit de la largeur et de la hauteur du canevas.

La spécification VP8 explique comment décoder l'image au format Y'CbCr. Pour convertir en RVB, la recommandation BT.601 DOIT être utilisée. Candidatures MAI utilisent une autre méthode de conversion, mais les résultats visuels peuvent varier d'un décodeur à l'autre.

Format de fichier simple (sans perte)

Remarque : Les lecteurs plus anciens ne sont pas forcément compatibles avec les fichiers au format sans perte.

Cette mise en page DOIT être utilisée si l'image nécessite un encodage sans perte (avec un canal de transparence facultatif) et ne nécessite pas de fonctionnalités avancées fournies par le format étendu.

Format de fichier WebP (sans perte) simple:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                    WebP file header (12 bytes)                |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         'VP8L' Chunk                          :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

"VP8L" Fragment:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8L')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                           VP8L data                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Données VP8L: Taille des fragments octets: Données du flux de bits VP8L.

La spécification actuelle du flux de bits VP8L est disponible à l'adresse Format WebP Bitstream sans perte : Notez que l'en-tête VP8L contient la largeur et la hauteur de l'image VP8L. Il s'agit de la largeur et la hauteur du canevas.

Format de fichier étendu

Remarque : Les lecteurs plus anciens ne sont pas forcément compatibles avec les fichiers au format étendu.

Un fichier au format étendu comprend les éléments suivants:

Un modèle "VP8X" Fragment contenant des informations sur les fonctionnalités utilisées dans le fichier.
Un « ICCP » facultatif Fragment avec profil de couleur.
Un bloc "ANIM" facultatif avec des données de contrôle d'animation.
Données d'image.
Un « EXIF » facultatif Fragmenter avec les métadonnées Exif.
Un bloc "XMP" facultatif avec des métadonnées XMP.
Liste facultative de blocs inconnus.

Pour une image fixe, les données d'image se composent d'un seul frame, qui comprend les éléments suivants :

Un sous-segment alpha facultatif.
Un sous-segment bitmap.

Pour une image animée, les données d'image se composent de plusieurs images. Plus Les détails sur les images se trouvent dans la section Animation.

Tous les fragments nécessaires à la reconstruction et à la correction des couleurs, c'est-à-dire 'VP8X', 'ICCP', 'ANIM', 'ANMF', 'ALPH', 'VP8' et 'VP8L', DOIVENT apparaître dans l'ordre décrites précédemment. Les lecteurs DOIVENT échouer lorsque des fragments sont nécessaires à la reconstruction et la correction des couleurs sont dans le désordre.

Les métadonnées et les blocs inconnus peuvent apparaître dans le désordre.

Logique:Les fragments nécessaires à la reconstruction doivent apparaître en premier dans le fichier pour permettre à un lecteur de commencer à décoder une image avant de recevoir toutes les données. Faire varier l'ordre des métadonnées et l'emplacement des fragments personnalisés adaptés à l'implémentation.

En-tête de fichier WebP étendu :

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                                                               |
|                   WebP file header (12 bytes)                 |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('VP8X')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Rsv|I|L|E|X|A|R|                   Reserved                    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|          Canvas Width Minus One               |             ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...  Canvas Height Minus One    |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Réservé (Rsv) : 2 bits: DOIT être 0. Les lecteurs DOIVENT ignorer ce champ.
Profil ICC (I) : 1 bit: Définissez ce paramètre si le fichier contient une valeur "ICCP" Un morceau
Alpha (L): 1 bit: Indique si l'un des cadres de l'image contient des informations de transparence ("alpha").
Métadonnées EXIF (E): 1 bit: Indique si le fichier contient des métadonnées Exif.
Métadonnées XMP (X) : 1 bit: Définissez si le fichier contient des métadonnées XMP.
Animation (A) : 1 bit: Définie si l'image est animée. Données en ANIM et "ANMF" Les fragments doivent être utilisées pour contrôler l'animation.
Réservé (R) : 1 bit: DOIT être 0. Les lecteurs DOIVENT ignorer ce champ.
Réservé : 24 bits: DOIT être 0. Les lecteurs DOIVENT ignorer ce champ.
Largeur de la toile moins un : 24 bits: basée sur 1. La largeur réelle du canevas est 1 + Canvas Width Minus One.
Hauteur du canevas moins un: 24 bits: Hauteur du canevas en pixels, basée sur 1. La hauteur réelle du canevas est de 1 + Canvas Height Minus One.

Le produit de Canvas Width (Largeur du canevas) et de Canvas Height (Hauteur du canevas) DOIT être inférieur ou égal à 2^32 - 1.

D'autres champs pourront être ajoutés dans les futures spécifications. Les champs inconnus DOIVENT être ignorés.

Animation

Une animation est contrôlée par des segments ANIM et ANMF.

Morceaux "ANIM" :

Pour une image animée, ce bloc contient les paramètres globaux de l'animation.

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ANIM')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                       Background Color                        |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|          Loop Count           |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Couleur d'arrière-plan : 32 bits (uint32): Couleur d'arrière-plan par défaut du canevas en [bleu, vert, rouge, alpha] l'ordre des octets. Cette couleur PEUT être utilisée pour remplir l'espace inutilisé sur la toile autour des cadres, ainsi que les pixels transparents de la première image. La couleur d'arrière-plan est également utilisée lorsque la méthode de suppression est 1.

Remarques :

La couleur d'arrière-plan peut contenir une valeur alpha non opaque, même si l'option Alpha du bloc "VP8X" n'est pas définie.
Les lecteurs DOIVENT traiter la valeur de la couleur d'arrière-plan comme une indication et ne sont pas nécessaires pour l'utiliser.
Le canevas est effacé au début de chaque boucle. La couleur d'arrière-plan PEUT être utilisée à cette fin.

Nombre de boucles: 16 bits (uint16): Nombre de lectures en boucle de l'animation. Si la valeur est 0, cela signifie "infini".

Ce fragment DOIT apparaître si l'indicateur Animation du bloc "VP8X" Le bloc est défini. Si l'indicateur Animation n'est pas défini et que ce fragment est présent, il DOIT être sont ignorées.

Chunk "ANMF" :

Pour les images animées, ce bloc contient des informations sur un seul frame. Si l'indicateur d'animation n'est pas défini, ce bloc NE DOIT PAS être présent.

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ANMF')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                        Frame X                |             ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...          Frame Y            |   Frame Width Minus One     ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
...             |           Frame Height Minus One              |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                 Frame Duration                |  Reserved |B|D|
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                         Frame Data                            :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Frame X : 24 bits (uint24)

La coordonnée X de l'angle supérieur gauche du cadre est Frame X * 2.

Trame Y: 24 bits (uint24)

La coordonnée Y de l'angle supérieur gauche du cadre est Frame Y * 2.

Largeur de frame moins un : 24 bits (uint24)

Largeur basée sur 1 du cadre. La largeur du cadre est de 1 + Frame Width Minus One.

Hauteur de frame moins un : 24 bits (uint24)

Hauteur basée sur 1 du frame. La hauteur du frame est de 1 + Frame Height Minus One.

Durée du frame : 24 bits (uint24)

Délai d'attente avant l'affichage de l'image suivante, en unités d'une milliseconde. Notez que l'interprétation de la durée d'image de 0 (et souvent <= 10) est défini par l'implémentation. De nombreux outils et navigateurs attribuent une durée minimale semblable à celle des GIF.

Réservé : 6 bits

DOIT être 0. Les lecteurs DOIVENT ignorer ce champ.

Méthode de combinaison (B): 1 bit

Indique le niveau de transparence des pixels transparents de l'image actuelle. par les pixels correspondants du canevas précédent:

0: utilisez la combinaison alpha. Après avoir supprimé l'image précédente, effectuez le rendu cadre actuel sur le canevas en utilisant la combinaison alpha (voir ci-dessous). Si le frame actuel ne comporte pas de canal alpha, supposez que la valeur alpha est 255, ce qui remplace effectivement le rectangle.
1: ne pas fusionner. Après avoir supprimé le frame précédent, affichez le frame actuel sur le canevas en écrasant le rectangle recouvert par le frame actuel.

Méthode de mise au rebut (D): 1 bit

Indique comment l'image actuelle doit être traitée une fois qu'elle a été affiché (avant d'afficher l'image suivante) sur le canevas:

0 : ne pas supprimer. Laissez le canevas tel quel.
1: appliquer la couleur d'arrière-plan. Remplissez le rectangle sur le canevas recouvert par le cadre actuel avec la couleur d'arrière-plan spécifiée dans le bloc "ANIM".

Remarques :

L'élimination des frames ne s'applique qu'au rectangle de frame, c'est-à-dire au rectangle défini par Frame X, Frame Y, frame width et frame height. Il peut ou non recouvrir l'intégralité de la toile.
Combinaison alpha:

Étant donné que chacun des canaux R, V, B et A est de 8 bits et que le canal RVB les canaux ne sont pas prémultipliés par le canal alpha, la formule permettant de combiner "dst" dans "src" est:
```
blend.A = src.A + dst.A * (1 - src.A / 255)
if blend.A = 0 then
  blend.RGB = 0
else
  blend.RGB =
      (src.RGB * src.A +
       dst.RGB * dst.A * (1 - src.A / 255)) / blend.A
```
La combinaison alpha DOIT être effectuée dans un espace de couleurs linéaire, en tenant compte le profil de couleur de l'image. Si le profil de couleur n'est pas présent, le RVB standard (sRVB) est supposé. Notez que le format sRVB doit être linéarisée en raison d'un gamma d'environ 2,2).

Données de trame: Taille de fragments octets – 16

Comporte:

Un sous-segment alpha facultatif pour le frame.
Sous-segment bitmap pour la trame.
Liste facultative de fragments inconnus.

Remarque: L'ANMF Frame Data (Données de trame) est constituée de données fragments padded, comme décrit par le format de fichier RIFF.

Alpha

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ALPH')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|Rsv| P | F | C |     Alpha Bitstream...                        |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Réservé (Rsv): 2 bits

DOIT être 0. Les lecteurs DOIVENT ignorer ce champ.

Prétraitement (P) : 2 bits

Ces bits informatifs servent à signaler le prétraitement effectué lors de la compression. Le décodeur peut utiliser ces informations pour, par exemple, atténuer les valeurs ou lisser les dégradés avant l'affichage.

0: aucun prétraitement.
1: réduction du niveau.

Les décodeurs ne sont pas tenus d'utiliser ces informations d'une manière spécifique.

Méthode de filtrage (F): 2 bits

Les méthodes de filtrage utilisées sont décrites comme suit :

0: aucun.
1: filtre horizontal.
2: filtre vertical.
3: filtre de dégradé.

Pour chaque pixel, le filtrage est effectué à l'aide des calculs suivants. Supposons que les valeurs alpha entourant la position actuelle de X soient étiquetées comme suit:

 C | B |
---+---+
 A | X |

Nous cherchons à calculer la valeur alpha à la position X. Tout d'abord, une prédiction selon la méthode de filtrage:

Méthode 0: prédicteur = 0
Méthode 1 : prédicteur = A
Méthode 2 : prédicteur = B
Méthode 3: prédicteur = clip(A + B - C)

où clip(v) est égal à :

0 si v < 0,
255 si v > 255, ou
v sinon

La valeur finale est dérivée en ajoutant la valeur décompressée X au prédicteur et en utilisant l'arithmétique modulo-256 pour encapsuler la plage [256..511] dans la plage [0..255] :

alpha = (predictor + X) % 256

Il existe des cas particuliers pour les positions de pixel situées tout à gauche et tout en haut. Pour exemple, la valeur en haut à gauche à l'emplacement (0, 0) utilise 0 comme valeur de prédiction. Sinon :

Pour les méthodes de filtrage horizontal ou en dégradé, les pixels situés le plus à gauche (0, y) sont prédits à partir de la position (0, y-1) située juste au-dessus.
Pour les méthodes de filtrage vertical ou de gradient, les pixels les plus élevés à l'emplacement (x, 0) sont prédits à l'aide de l'emplacement (x-1, 0) à gauche.

Méthode de compression (C): 2 bits

Méthode de compression utilisée :

0: aucune compression.
1 : compressé à l'aide du format WebP sans perte.

Flux de bits alpha : taille de bloc en octets : 1

Flux de bits alpha encodé.

Ce fragment facultatif contient des données alpha encodées pour cette trame. Un cadre contenant le code Le bloc NE DEVRAIT PAS contenir ce fragment.

Rationalité : les informations de transparence font déjà partie du segment "VP8L".

Les données du canal alpha sont stockées sous forme de données brutes non compressées (lorsque le méthode de compression est '0') ou compressée au format sans perte (lorsque la méthode de compression est "1").

Données brutes : il s'agit d'une séquence d'octets de longueur = largeur * hauteur, contenant toutes les valeurs de transparence 8 bits dans l'ordre de balayage.
Compression de format sans perte : la séquence d'octets est un flux d'image compressé (comme décrit dans la section "WebP Lossless Bitstream Format") de dimensions implicites largeur x hauteur. Autrement dit, ce flux d'images ne contient AUCUN en-tête décrivant les dimensions de l'image.

Rationalité : Les dimensions sont déjà connues à partir d'autres sources. Il serait donc redondant et sujet à des erreurs de les stocker à nouveau.

Une fois le flux d'images décodé en couleurs Alpha, Rouge, Vert, Bleu (ARVB), , en suivant le processus décrit dans le format sans perte les informations de transparence doivent être extraites canal green du quadruplet ARVB.

Rationalité : Contrairement aux autres canaux, le canal vert est autorisé à effectuer des étapes de transformation supplémentaires dans la spécification, ce qui peut améliorer la compression.

Bitstream (VP8/VP8L)

Ce bloc contient des données de flux de bits compressées pour un seul frame.

Un bloc de flux de bits peut être (i) un bloc "VP8", utilisant "VP8" (notez l'espace significatif du quatrième caractère) comme code FourCC, ou (ii) un bloc "VP8L", utilisant "VP8L" comme code FourCC.

Les formats des blocs "VP8" et "VP8L" sont décrits respectivement dans les sections Simple File Format (Lossy) (Format de fichier simple (avec perte)) et Simple File Format (Lossless) (Format de fichier simple (sans perte)).

Profil de couleur

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('ICCP')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                       Color Profile                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Profil de couleur : taille de bloc en octets: Profil ICC.

Ce fragment DOIT apparaître avant les données d'image.

Il DOIT y avoir au maximum un fragment. S'il y a plus de fragments de ce type, les lecteurs PEUT ignorer la première. Pour en savoir plus, consultez les spécifications de l'ICC.

Si ce fragment n'est pas présent, le format sRVB DOIT être utilisé.

Métadonnées

Les métadonnées peuvent être stockées dans des blocs EXIF ou XMP.

Il devrait y avoir au maximum un bloc de chaque type ('EXIF' et 'XMP'). S'il y a d'autres blocs de ce type, les lecteurs peuvent tous les ignorer, sauf le premier.

Les fragments sont définis comme suit:

'EXIF' Fragment:

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('EXIF')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        Exif Metadata                          :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Métadonnées Exif: Taille des fragments: Métadonnées d'image au format Exif.

Chunk "XMP" :

 0                   1                   2                   3
 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|                      ChunkHeader('XMP ')                      |
|                                                               |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
:                        XMP Metadata                           :
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Métadonnées XMP: Taille des fragments: Métadonnées d'image au format XMP.

Notez que le quatrième caractère de "XMP" FourCC est un espace ASCII (0x20).

Pour obtenir des conseils supplémentaires sur la gestion des métadonnées, consultez les Consignes de gestion des métadonnées du groupe de travail sur les métadonnées.

Blocs inconnus

Bloc RIFF (décrit dans la section Format de fichier RIFF) dont FourCC est différent de l'un des fragments décrits dans ce document, est considéré comme un morceau inconnu.

Logique: Le fait d'autoriser les fragments inconnus permet de prévoir une extension ultérieure. du format et permet également de stocker des données spécifiques à l'application.

Un fichier PEUT contenir des fragments inconnus:

à la fin du fichier, comme décrit dans la section En-tête de fichier WebP étendu, ou
à la fin des segments "ANMF", comme décrit dans la section Animation.

Les lecteurs DOIVENT ignorer ces fragments. Les rédacteurs DOIVENT les conserver dans leur ordre d'origine (sauf s'ils ont spécifiquement l'intention de modifier ces fragments).

Assemblage de la toile à partir des cadres

Voici un aperçu de la façon dont un lecteur DOIT assembler un canevas dans le cas où d'une image animée.

Le processus commence par la création d'un canevas à l'aide des dimensions indiquées dans le segment "VP8X", soit Canvas Width Minus One + 1 pixels de large sur Canvas Height Minus One + 1 pixels de haut. Le champ Loop Count de "ANIM" La façon dont les fragments sont contrôlés plusieurs fois que le processus d'animation est répété. Il s'agit de Loop Count - 1 pour les valeurs Loop Count non nulles ou d'infini si Loop Count est nul.

Au début de chaque itération de boucle, le canevas est rempli à l'aide de la couleur d'arrière-plan du segment "ANIM" ou d'une couleur définie par l'application.

"ANMF" Les fragments contiennent des images individuelles présentées dans l'ordre d'affichage. Avant l'affichage de chaque frame, le Disposal method du frame précédent est appliqué.

Le rendu du cadre décodé commence aux coordonnées cartésiennes (2 * Frame X, 2 * Frame Y), en utilisant le coin supérieur gauche du canevas comme origine. Frame Width Minus One + 1 pixels de large par Frame Height Minus One + 1 pixels hauts sont affichés sur le canevas à l'aide de Blending method.

Le canevas s'affiche pendant Frame Duration millisecondes. Cette opération se poursuit jusqu'à toutes les images fournies par "ANMF" Les fragments ont été affichés. Une nouvelle itération de boucle est a commencé, ou le canevas reste dans son état final si toutes les itérations ont été terminé.

Le pseudo-code suivant illustre le processus d'affichage. La notation VP8X.field désigne le champ contenu dans "VP8X". Fragment avec la même description.

VP8X.flags.hasAnimation MUST be TRUE
canvas ← new image of size VP8X.canvasWidth x VP8X.canvasHeight with
         background color ANIM.background_color or
         application-defined color.
loop_count ← ANIM.loopCount
dispose_method ← Dispose to background color
if loop_count == 0:
  loop_count = ∞
frame_params ← nil
next chunk in image_data is ANMF MUST be TRUE
for loop = 0..loop_count - 1
  clear canvas to ANIM.background_color or application-defined color
  until eof or non-ANMF chunk
    frame_params.frameX = Frame X
    frame_params.frameY = Frame Y
    frame_params.frameWidth = Frame Width Minus One + 1
    frame_params.frameHeight = Frame Height Minus One + 1
    frame_params.frameDuration = Frame Duration
    frame_right = frame_params.frameX + frame_params.frameWidth
    frame_bottom = frame_params.frameY + frame_params.frameHeight
    VP8X.canvasWidth >= frame_right MUST be TRUE
    VP8X.canvasHeight >= frame_bottom MUST be TRUE
    for subchunk in 'Frame Data':
      if subchunk.tag == "ALPH":
        alpha subchunks not found in 'Frame Data' earlier MUST be
          TRUE
        frame_params.alpha = alpha_data
      else if subchunk.tag == "VP8 " OR subchunk.tag == "VP8L":
        bitstream subchunks not found in 'Frame Data' earlier MUST
          be TRUE
        frame_params.bitstream = bitstream_data
    apply dispose_method.
    render frame with frame_params.alpha and frame_params.bitstream
      on canvas with top-left corner at (frame_params.frameX,
      frame_params.frameY), using Blending method
      frame_params.blendingMethod.
    canvas contains the decoded image.
    Show the contents of the canvas for
    frame_params.frameDuration * 1 ms.
    dispose_method = frame_params.disposeMethod

Exemples de mises en page de fichiers

Une image encodée avec perte avec alpha peut se présenter comme suit :

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ALPH (alpha bitstream)
+- VP8 (bitstream)

Une image encodée sans perte peut se présenter comme suit:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- VP8L (lossless bitstream)
+- XYZW (unknown chunk)

Une image sans perte avec un profil ICC et des métadonnées XMP peut se présenter comme suit :

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ICCP (color profile)
+- VP8L (lossless bitstream)
+- XMP  (metadata)

Une image animée avec des métadonnées Exif peut se présenter comme suit:

RIFF/WEBP
+- VP8X (descriptions of features used)
+- ANIM (global animation parameters)
+- ANMF (frame1 parameters + data)
+- ANMF (frame2 parameters + data)
+- ANMF (frame3 parameters + data)
+- ANMF (frame4 parameters + data)
+- EXIF (metadata)

Spécification du conteneur WebP Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.