Les techniques numériques ont toujours cherché à réduire le volume de données transportées, en particulier celles qui servent à la représentation d’images. Les raisons qui militent en faveur de nouveaux progrès dans ce domaine sont liées à l’utilisation de canaux de transport différents et aux applications variées qui sont résumées ci-dessous.
1
- Objectifs de la compression d’image
La
compression de débit conduit à
une économie de transmission des signaux
numériques, ce qui permet d’augmenter
les ressources d’un canal utilisé et
de multiplier le nombre de programmes diffusés
dans une même bande de fréquences.
La technique numérique se prête
volontiers à la compression d’image et
les évolutions des composants le permettent
de mieux en mieux.
La
compression d’images vise en effet à
:
- L’amélioration
de la qualité de l’image restituée,
sa résistance à la dégradation,
le synchronisme de l’image et du son pendant
la transmission, etc.
- L’aptitude à subir les cascades
de traitements numériques pendant son
transport sur les réseaux
- Un enrichissement par des fonctions ajoutées
au service de base (sons multi-canaux, données
associées, embrouillage, adressage, compatibilité
de formats, etc.)
- Améliorer les aspects économiques
ou contraintes de complexité et de coûts
induits.
2
- Compression de l’image télévisuelle
numérique
Certaines
de ces particularités techniques peuvent
être sélectionnées dans
les terminaux par les utilisateurs ou les offreurs
de services. Les niveaux de qualité de
télévision numérique sont
définis actuellement par le sigle LDTV,
pour niveau de qualité "limitée",
par SDTV, pour la qualité dite "standard",
par EDTV, ou enhanced TV pour la télévision
de qualité améliorée et
par HDTV, pour la télévision de
haute définition. A titre d’exemple,
selon la nature des terminaux et les solutions
techniques retenues, la LDTV peut offrir de
4 à 20 programmes télévisuels
sur un canal de 30 Mbit/s. En TVHD, le débit
utile serait de 885 Mbit/s pour un débit
total de 1,152 Gbit/s. En télévision
numérique compressée, le débit
utile serait de 166 Mbit/s pour un débit
total de 216 Mbit/s.
3
- Normalisation de la compression d’image
Les
normes de compression des signaux multimédias
(JPEG, MPEG) sont définies par des groupes
communs entre l’ISO, Organisation mondiale de
la normalisation et la CEI, Commission électrotechnique
internationale. Sont impliqués dans ces
travaux de normalisation un assez grand nombre
d’industriels réunis dans près
de 220 comités techniques représentant
80 pays membres liés à ces organisations
internationales.
[voir : www.mpegla.com/news]
3.1
- JPEG
Le
Joint Photographic Expert Group (JPEG) a défini
une norme de compression d’images couleur fixes
(ou de courte durée) qui peut atteindre
un rapport de 20. Cette norme utilise des algorithmes
de compression basés sur la transformation
en cosinus discrète (DCT, pour Discrete
Cosine Transform). La DCT considère des
carrés de 64 pixels (8 ×8) dont
la quantification est effectuée en groupe
en limitant la palette à 16 couleurs
au lieu de 256. La norme JPEG est un outil générique
de compression utilisé par plusieurs
applications (vidéotex, architecture
de document, télécopie, téléconférence).
La norme définit les correspondances
de format : compression mosaïque pyramidale
(JTIP, pour JPEG Tiled Image Pyramid),
qui couvre tous les formats, depuis la vignette
jusqu’à l’image de très haute
définition.
3.2
- JPEG 2000
La
norme élaborée par le groupe mixte
ISO/CEI (15444-1) pour le codage d’image
référencée JPEG2000 définit
une compression de l’ordre de 50 à 100
fois plus élevée qu’en JPEG, par
transformation en ondelettes, et non en DCT.
Elle s’applique aux images fixes, à la
télécopie, aux textes, aux images
de synthèse, aux photos numériques,
aux clichés médicaux, aux vues
en provenance de capteur, etc. Le codage est
robuste et convient à la transmission
radio, surtout pour les supports bruyants (réseaux
radioélectriques pour mobile). L’affichage
de l’image s’effectue de façon graduelle,
en améliorant la résolution transmise
en première transmission.
Des améliorations à cette norme
sont en cours de préparation entre les
groupes de l’ISO/CEI et l’IETF, en vue de permettre
la reconnaissance et l’exploitation des formats
de documents par des visualisateurs de réseau.
Pour cette raison, des suffixes (.jp2, .jpx,
jpm, .mj2) seraient ajoutés aux références
d’images et de documents. Des industriels français
sont impliqués dans les extensions de
cette norme (NetImage, pour la sécurité,
Pictures Elements, pour les extensions de la
norme aux applications en GEIDE, etc.).
4
- La compression en diffusion télévisuelle
Les
signaux vidéo (image et son) exigent
un débit de transmission important. La
télévision analogique en PAL 625
lignes exige un canal de 27 MHz de largeur de
bande. En numérisant le signal à
environ 90 ou 110 Mbit/s et en le compressant
à 3 ou à 6,6 Mbit/s, la largeur
de bande nécessaire est réduite,
entre 3 à 5 MHz, ce qui permet à
un répéteur de satellite de porter
entre à 5 à 8 fois plus de programmes
de télévision simultanés.
Cette compression peut être obtenue avec
des procédés différents,
codifiés par des normes qui reposent
sur des algorithmes mathématiques spécifiques
utilisant la redondance des éléments
d’image (pixels) au rythme de 25 images par
seconde, et celle de leur codage en 16 niveaux
de luminance et 16 niveaux de chrominance. On
peut ainsi ne transmettre que les modifications
de l’image, avec le son numérisé,
et joindre, sur un canal adjacent, des informations
additionnelles pour l’exploitation du support
de transmission, et pour l’information du téléspectateur.
Ces procédés permettent d’augmenter
le nombre de programmes de télévision
sur un canal de transmission sur satellite,
sur faisceau hertzien ou sur câble. Une
autre utilisation a trait à la création
de nouveaux services enrichissant le service
de distribution d’images fixes ou animées.
Plusieurs normes ont été successivement
adoptées par le groupe MPEG (Motion Picture
Experts Group), groupe de travail mixte entre
l’ISO et la CEI, qui portent cette référence.
4.1
- MPEG-1 (1993)
Le
premier but visé par le groupe MPEG était
de définir l’enregistrement et les moyens
de consultation d’images animées et des
sons associés sur supports numériques
de façon à les rendre compatibles
sur le plan mondial et en correspondance avec
le débit utile sur CD-Rom.
MPEG-1
reprend une partie des principes des normes
JPEG et lui adjoint des traitements propres
à l’image animée, en travaillant
sur les changements apparus entre images successives.
Les modes de compression définis par
MPEG-1 et 2 sont basés sur la décomposition
de l’image en blocs qui sont tous traités
de façon identique, quel que soit leur
contenu. La compression sonore, normalisée
sous le sigle MP3, appartient aux normes MPEG-1
et 2. Elle n’est plus jugée aujourd’hui
comme la norme la plus performante dans le domaine,
mais elle demeure encore la plus intégrable
sur le plan mondial.
La
norme de compression numérique MPEG-1
concerne une définition d’image de 352
×288 pixels en PAL et de 352 ×240
pixels en NTSC, qui fournit une qualité
similaire au VHS, avec un débit de 1,5
ou 2 Mbit/s. Elle ne permet de coder que des
images de format inférieur à ceux
utilisés pour la télévision,
l’extension de format se faisant par ajouts
d’informations. L’algorithme spécifié
pour la vidéo repose sur un codage à
base de DCT. La norme présente l’avantage
d’effectuer la découpe en séquences
de groupes d’images totalement indépendants
pour la compression (rapport pouvant atteindre
200) et de permettre un accès aléatoire
rapide aux images et l’usage de prédictions
interpolatives (recherche dans les images précédentes
et suivantes). Les applications MPEG-1 concernent
le stockage et l’enregistrement, sur cédérom,
sur cassette audio digitale (DAT, pour Digital
Audio Tape), sur compact-disque interactif (CD-I)
et sur micro-ordinateur, de produits multimédias,
ainsi que la transmission d’images animées
à bas débit sur le réseau
local ou sur large bande RNIS à large
bande, ATM et LAN en qualité de type
VHS (1,5 à 2 Mbit/s). L’affichage de
l’image comporte 352 ×288 points.
Les
points faibles de MPEG-1 relatifs à la
qualité des images fortes en contraste
(lettres blanches sur fond noir, zébrures
marquées) et des mouvements multiples
et rapides (spots publicitaires), ont ouvert
la voie à MPEG-2.
4.2
- MPEG-2 (1995)
Cette
norme traite de l’ensemble des applications
audio, vidéo et images animées
(consultation de banques d’images, communications
interpersonnelles et diffusion de programmes
télévisés). Elle définit
la compression d’images, la compression audio
et vidéo en un débit unique et
le transport des données correspondantes.
Après traitement des carrés de
pixels, MPEG-2 ne conserve d’une image à
l’autre que les éléments changeant,
les éléments intermédiaires
étant calculés par interpolation
à partir d’images de référence.
Elle permet la compression entre 2 et 8 Mbit/s
d’un signal télévisuel de 216
Mbit/s et décrit l’ensemble des fonctions
autorisant la multiplication des services en
rapport avec les capacités des réseaux
de distribution utilisés.
Elle contient trois parties principales :
- la
couche système et la représentation
du multiplexage de flux voix, données,
- images, y compris le télétexte
de sous-titrage, le guide de programmes,
- la messagerie d’accès, la signalisation,
les jeux, etc. ;
- la compression vidéo ;
- la compression audio.
Le
flux de données obtenu en MPEG-2 est
sensible à la gigue (cas de l’ATM) et
à la latence introduite par la correction
d’erreur de type Reed Solomon mise en oeuvre
sur supports ADSL. La vidéo doit donc
inclure des mécanismes de correction
d’erreur protégeant la couche MPEG-2.
La norme MPEG-2 est utilisée dans les
systèmes DVB et DVD.
4.3
- MPEG-4 (1994-2004)
La
norme MPEG-4 (ISO/CEI 14496) permet d’offrir
des services interactifs et d’optimiser les
codages et décodages d’images animées
2D et 3D en fonction des applications. Elle
fournit une architecture ouverte, basée
sur la notion de flux de données, permettant
l’intégration cohérente de différents
médias. La scène audiovisuelle
est composée à partir d’une collection
d’objets qui sont compressés séparément,
stockés, acheminés, superposés,
puis assemblés et qui demeurent manipulables.
La compression est adaptée à chaque
élément de l’image et du son (parole
ou musique), avec un algorithme propre, ce qui
sollicite moins de ressources et facilite l’interactivité
et la transmission sur supports à flux
partagés (réseau HFC, streaming
en CDN ou en emploi sur DVD). MPEG-4 utilise
un langage spécifique décrivant
la génération de sons. La norme
comprend 16 sections, appelées "part".
Les profils ainsi définis correspondent
aux domaines d’applications.
La
structure streaming vidéo de MPEG-4 comprend
trois domaines, la zone de création de
contenu, appelée AEP (Authoring Encoding
Publishing), la composante serveur qui met en
paquets les données codées et
compressées et les envoie sur le réseau,
et la composante Player qui exécute la
décompression sur l’ordinateur. L’utilisateur
peut définir un objet et ajouter d’autres
éléments selon son gré.
On peut ainsi créer des scènes
complexes et les manipuler.
MPEG-4
utilise un débit variable, moins élevé
que celui de MPEG-2 (de 20 kbit/s à 6
Mbit/s pour un flux télévisuel
images et sons) et permet une meilleure qualité.
Son taux de compression peut être quatre
fois plus élevé que celui de MPEG-2,
car il tire partie de l’occurrence des mouvements
des images. Il répond aux besoins de
la production et de la diffusion télévisuelle,
et à la représentation du contenu
audiovisuel des applications multimédia.
MPEG-4 ne convient pas à la transmission
radioélectrique, car la dégradation
du support ne permettrait pas les fonctions
nécessaires. Realtime Transport Protocol
(RTP), qui est plus adapté à la
transmission temps réel que TCP, devrait
permettre le transport de MPEG-4 sur les réseaux
fixes et mobiles en IP, dans de meilleures conditions
qu’avec TCP.
"MPEG-4 simple visual" comprend
le codage vidéo des objets rectangulaires
en H.263 pour le codage de scènes et
le codage CELP pour la parole, ce qui n’exige
que 60à 80 % du débit à
64 kbit/s. Des décodeurs MPEG-4 pour
des débits à 15 images par seconde
en QCIF (quart d’écran), associés
à des mémoires 4 Mbit/s de Dram
sont en cours de développement pour des
liaisons Internet par radio. PacketVideo réalise
des flux audio et vidéo en MPEG-4 (profil
Visual Simple Scalable) pour l’équipement
du GPRS à 8 images par seconde à
30 kbit/s.
MPEG-4 High Efficiency AAC (advanced audio
coding) existe dans MPEG-2 et MPEG-4 depuis
1997 (Part 10 de la norme MPEG-4). Elle améliore
la compression de MPEG-4 tout en demeurant compatible
avec les normes de codage vidéo H.263
et H.26L. AAC est combinée avec SBR (Spectral
Band Replication), de sorte que n’importe
quel codec audio puisse restituer le son à
un débit deux fois plus faible. Le son
DVD canal 5.1 stéréo est ainsi
possible à 48 kbit/s.
MPEG-4 ou AVC (pour advanced video coding
ou H.264), défini en 2002 par un
groupe d’experts de l’ISO, la CEI et de l’UIT-T,
permet de compresser un signal vidéo
à 944 kbit/s en gardant la même
qualité que celle d’un DVD. Un signal
télévisuel en TVHD diffusé
en MPEG-2 à 20 Mbit/s ne demande que
8 Mbit/s en MPEG-4 H.264. La norme permet le
codage d’images vidéo en balayage progressif
ou entrelacé (même si elles sont
combinées). Elle utilise un ensemble
de codage de prédictions spatiale et
temporelle. L’image est divisée en blocs
qui subissent un premier codage. Les images
suivantes sont déduites par une prédiction
liée à la compensation de mouvement
sur les quatre images codées précédemment.
H.264 est connue aussi sous la référence
MPEG-4 Part 10 et AVC (pour Advanced Video
Coding). H.264 s’applique à la télévision
sur ADSL, au streaming vidéo, aux lecteurs
de DVD, aux diffuseurs TV vers les terminaux
mobiles et la diffusion TV et TVHD par satellite.
Il concerne le balayage progressif ou entrelacé,
quel que soit le nombre de lignes.
La norme MPEG-4 Part 10 (Advanced Video Coding
ou Joint Video Team) liée è
H.264 s’accommode d’une diffusion en modulation
en 8 ou 16-PSK, associée à un
procédé de codage et de décodage
simple et très souple. Les codeurs/décodeurs
en MPEG-4/H.264 (profils Main ou High) selon
la norme ISO/CEI 14 496-10 sont disponibles,
et certains d’entre eux offrent des perspectives
d’adaptation à MPEG-2.
H.264/MPEG-4/AVC permet de placer deux à
trois programmes télévisuels dans
une bande fréquences du MPEG-2. Un satellite
de 36 MHz de largeur de bande peut transporter
au choix, soit 8 à 10 programmes télévisuels
en MPEG-2, soit une trentaine de programmes
en H.264/DVB/S2, soit cinq à six chaînes
en HDTV.
Le codage de compression de l’image vidéo,
référencé H.264/AVC, a
été amélioré par
le développement d’un ensemble qui porte
le nom de FRExt (pour Fidelity Range Extensions).
Ainsi, la norme est adaptée aussi bien
pour des applications de basses résolutions
utilisables pour les loisirs, mais aussi pour
les images de haute définition et les
applications de qualité pour le travail
en studio. L’extension FRExt est utilisable
pour la TVHD, la vidéo DVD améliorée,
la distribution et la contribution de contenus,
le traitement de post production et l’édition
vidéo de studio.
4.4
- MPEG-5
Cette
norme est liée à T.171 et à
T.172 et permet la navigation entre scènes
ainsi que le contrôle de l’information
par l’utilisateur.
4.5
- MPEG-7 (2001)
MPEG-7
(Multimedia Content Description Interface)
est une norme qui a pour objectif l’indexation,
la description et la recherche des images et
des données multimédia par leur
contenu. Un langage de requête avec indexation
du contenu est défini de façon
à ce que la recherche des images se fasse
rapidement MPEG-7 effectue une description des
informations multimédias (images fixes,
graphiques, audio, vidéo et leurs combinaisons)
et constitue un moteur de sélection et
un navigateur de recherche efficace des informations.
La description utilise le contenu et les informations
scéniques (type de compression, taille
du fichier, copyright, gestion des droits numériques
avec MPEG-4 et MPEG-21, prix, etc.).
[Voir www.mpeg-7.com]
4.6
- MPEG-21
MPEG-21
(Multimedia Framework) définit un cadre
général pour l’accès au
contenu multimédia, avec interaction
et échanges avec les utilisateurs, combinant
l’audio, la vidéo, les graphiques, l’image
de synthèse, textes, la gestion des droits,
etc.
5
- Positionnements relatifs des normes
5.1
- H.264, MPEG-4 et la concurrence
Une concurrence entre
MPEG-4/H.264 et Windows Media 9 (WM9) de Microsoft
est ouverte. Microsoft a fait valider son logiciel
de compression d’images par l’association SMPTE
(Society of Motion Picture and Television Engineers).
WM9 est très prisé des producteurs
de films et de vidéos à cause
de la souplesse apportée par les logiciels
de gestion et de création d’images. WM9
pourrait être intégré dans
les normes DVB.
Les concurrents de MPEG-4
(les Media Player de Microsoft Window et de
Real Networks) contiennent des parties de la
norme MPEG-4 d’origine ainsi que des enrichissements
d’origine propriétaires. Ces produits
concurrents sont apparus parce que les codeurs
de MPEG-4 sont restés longtemps coûteux.
Le succès commercial de MPEG-2 appartient
au passé et MPEG-4 entre maintenant sur
le marché industriel.
5.2 - MHP
Il existe deux spécifications
de MHP (Multimedia Home Plateform) qui traitent
de la diffusion vidéo numérique
(DVB, Digital Video Broadcasting). La version
DVB 1.0 traite de la partie transport dans des
flux MPEG et MPEG-4 en constitue l’évolution
logique et donc plus performante. DVB 2.0 s’intéresse
aux plateformes MHP et aux applications en IP.
La combinaison de MPEG-4 et de MHP permet de
façon harmonieuse le transport et l’exploitation
d’applications sous IP de façon flexible
dans le domaine de la diffusion interactive.
MHP présente l’intérêt
d’utiliser le langage de la Toile avec XHTML,
ce qui réduit les coûts, en particulier
pour les applications interactives, puisque
l’adaptateur (le Set Top Box) a moins besoin
de moins de circuits mémoires.
5 - Conclusions
Le codage et la compression
d’image ont franchi des étapes importantes
au cours des quinze dernières années.
La pression des besoins (limitation des accès
aux canaux satellitaires, naissance des systèmes
accès numériques dans le réseau
de distribution, apparition des flux en streaming
pour les réseaux à distribution
de contenu (CDN), création d’applications
voix et données simultanées à
bas débit, besoins estimées du
marché de la mobilité, etc.) et
les performances successives effectuées
en matière de composants expliquent la
pluralité de ces normes successives.
L’ensemble H.264/MPEG-4
AVC constitue pour le moment la clé de
voûte de ce travail d’agrégation
de normes en vue de leur utilisation dans les
diverses applications créées et
diffusées sur les différentes
parties des réseaux existants. L’intérêt
majeur des choix des normes retenues pour le
codage d’images et la modulation concerne les
fréquences disponibles sur les supports
utilisés (câble, DSL, voie radioélectrique)
et la possibilité, en radio, de pouvoir
diffuser des images vidéo, soit sur les
terminaux téléphoniques portables,
soit vers des écrans incorporés
à l’habitacle des véhicules en
mouvement.
Sources : MPEG-4
Industry Forum, EIH, IEEE ComSoc, Via Satellite,
etc.
CIEN 2012 – RF & Hyper, Du 24 au 26 Octobre 2012 à Paris Expo Porte de Versailles., Le prochain CIEN, carrefour ... [suite]
Premier congrès francophone des applications des fibres optiques, Les 23, 24 et 25 Octobre 2012, à Paris, Porte de Versailles Hall 1, Le Premier congrès francophone ... [suite]