Stratégies Télécoms & Multimédia

English
  • Accueil
  • Newsletter
  • Plan du site
  • Contact
  • Accueil
  • Services
  • Evénements
  • Webzine
  • Editorial
  • Actualités
  • Magazine
  • Dossiers
  • Agenda
  • Encyclopédie des Télécoms
  • Abonnement à la Newsletter
DT 09 - Compression du débit d’image
Augmenter la taille de la police Diminuer la taille de la police Imprimer Envoyer à un ami Flux RSS

Pour envoyer cette page,
remplissez les champs ci-dessous et cliquez sur le bouton "OK"...

Nom : Votre message :
Votre adresse email* :
Adresse email du destinataire* :
Annuler   Envoyer
(*) Champs obligatoires Fermer
3 septembre 2007 - Dossiers - Télévision
Les techniques numériques ont toujours cherché à réduire le volume de données transportées, en particulier celles qui servent à la représentation d’images. Les raisons qui militent en faveur de nouveaux progrès dans ce domaine sont liées à l’utilisation de canaux de transport différents et aux applications variées qui sont résumées ci-dessous.

1 - Objectifs de la compression d’image


La compression de débit conduit à une économie de transmission des signaux numériques, ce qui permet d’augmenter les ressources d’un canal utilisé et de multiplier le nombre de programmes diffusés dans une même bande de fréquences. La technique numérique se prête volontiers à la compression d’image et les évolutions des composants le permettent de mieux en mieux.

La compression d’images vise en effet à  :

- L’amélioration de la qualité de l’image restituée, sa résistance à la dégradation, le synchronisme de l’image et du son pendant la transmission, etc.
- L’aptitude à subir les cascades de traitements numériques pendant son transport sur les réseaux
- Un enrichissement par des fonctions ajoutées au service de base (sons multi-canaux, données associées, embrouillage, adressage, compatibilité de formats, etc.)
- Améliorer les aspects économiques ou contraintes de complexité et de coûts induits.


2 - Compression de l’image télévisuelle numérique


Certaines de ces particularités techniques peuvent être sélectionnées dans les terminaux par les utilisateurs ou les offreurs de services. Les niveaux de qualité de télévision numérique sont définis actuellement par le sigle LDTV, pour niveau de qualité "limitée", par SDTV, pour la qualité dite "standard", par EDTV, ou enhanced TV pour la télévision de qualité améliorée et par HDTV, pour la télévision de haute définition. A titre d’exemple, selon la nature des terminaux et les solutions techniques retenues, la LDTV peut offrir de 4 à 20 programmes télévisuels sur un canal de 30 Mbit/s. En TVHD, le débit utile serait de 885 Mbit/s pour un débit total de 1,152 Gbit/s. En télévision numérique compressée, le débit utile serait de 166 Mbit/s pour un débit total de 216 Mbit/s.

3 - Normalisation de la compression d’image


Les normes de compression des signaux multimédias (JPEG, MPEG) sont définies par des groupes communs entre l’ISO, Organisation mondiale de la normalisation et la CEI, Commission électrotechnique internationale. Sont impliqués dans ces travaux de normalisation un assez grand nombre d’industriels réunis dans près de 220 comités techniques représentant 80 pays membres liés à ces organisations internationales.
[voir : www.mpegla.com/news]


3.1 - JPEG


Le Joint Photographic Expert Group (JPEG) a défini une norme de compression d’images couleur fixes (ou de courte durée) qui peut atteindre un rapport de 20. Cette norme utilise des algorithmes de compression basés sur la transformation en cosinus discrète (DCT, pour Discrete Cosine Transform). La DCT considère des carrés de 64 pixels (8 ×8) dont la quantification est effectuée en groupe en limitant la palette à 16 couleurs au lieu de 256. La norme JPEG est un outil générique de compression utilisé par plusieurs applications (vidéotex, architecture de document, télécopie, téléconférence). La norme définit les correspondances de format : compression mosaïque pyramidale (JTIP, pour JPEG Tiled Image Pyramid), qui couvre tous les formats, depuis la vignette jusqu’à l’image de très haute définition.

3.2 - JPEG 2000


La norme élaborée par le groupe mixte ISO/CEI (15444-1) pour le codage d’image référencée JPEG2000 définit une compression de l’ordre de 50 à 100 fois plus élevée qu’en JPEG, par transformation en ondelettes, et non en DCT. Elle s’applique aux images fixes, à la télécopie, aux textes, aux images de synthèse, aux photos numériques, aux clichés médicaux, aux vues en provenance de capteur, etc. Le codage est robuste et convient à la transmission radio, surtout pour les supports bruyants (réseaux radioélectriques pour mobile). L’affichage de l’image s’effectue de façon graduelle, en améliorant la résolution transmise en première transmission.

Des améliorations à cette norme sont en cours de préparation entre les groupes de l’ISO/CEI et l’IETF, en vue de permettre la reconnaissance et l’exploitation des formats de documents par des visualisateurs de réseau. Pour cette raison, des suffixes (.jp2, .jpx, jpm, .mj2) seraient ajoutés aux références d’images et de documents. Des industriels français sont impliqués dans les extensions de cette norme (NetImage, pour la sécurité, Pictures Elements, pour les extensions de la norme aux applications en GEIDE, etc.).

4 - La compression en diffusion télévisuelle


Les signaux vidéo (image et son) exigent un débit de transmission important. La télévision analogique en PAL 625 lignes exige un canal de 27 MHz de largeur de bande. En numérisant le signal à environ 90 ou 110 Mbit/s et en le compressant à 3 ou à 6,6 Mbit/s, la largeur de bande nécessaire est réduite, entre 3 à 5 MHz, ce qui permet à un répéteur de satellite de porter entre à 5 à 8 fois plus de programmes de télévision simultanés.

Cette compression peut être obtenue avec des procédés différents, codifiés par des normes qui reposent sur des algorithmes mathématiques spécifiques utilisant la redondance des éléments d’image (pixels) au rythme de 25 images par seconde, et celle de leur codage en 16 niveaux de luminance et 16 niveaux de chrominance. On peut ainsi ne transmettre que les modifications de l’image, avec le son numérisé, et joindre, sur un canal adjacent, des informations additionnelles pour l’exploitation du support de transmission, et pour l’information du téléspectateur.

Ces procédés permettent d’augmenter le nombre de programmes de télévision sur un canal de transmission sur satellite, sur faisceau hertzien ou sur câble. Une autre utilisation a trait à la création de nouveaux services enrichissant le service de distribution d’images fixes ou animées. Plusieurs normes ont été successivement adoptées par le groupe MPEG (Motion Picture Experts Group), groupe de travail mixte entre l’ISO et la CEI, qui portent cette référence.

4.1 - MPEG-1 (1993)


Le premier but visé par le groupe MPEG était de définir l’enregistrement et les moyens de consultation d’images animées et des sons associés sur supports numériques de façon à les rendre compatibles sur le plan mondial et en correspondance avec le débit utile sur CD-Rom.

MPEG-1 reprend une partie des principes des normes JPEG et lui adjoint des traitements propres à l’image animée, en travaillant sur les changements apparus entre images successives. Les modes de compression définis par MPEG-1 et 2 sont basés sur la décomposition de l’image en blocs qui sont tous traités de façon identique, quel que soit leur contenu. La compression sonore, normalisée sous le sigle MP3, appartient aux normes MPEG-1 et 2. Elle n’est plus jugée aujourd’hui comme la norme la plus performante dans le domaine, mais elle demeure encore la plus intégrable sur le plan mondial.

La norme de compression numérique MPEG-1 concerne une définition d’image de 352 ×288 pixels en PAL et de 352 ×240 pixels en NTSC, qui fournit une qualité similaire au VHS, avec un débit de 1,5 ou 2 Mbit/s. Elle ne permet de coder que des images de format inférieur à ceux utilisés pour la télévision, l’extension de format se faisant par ajouts d’informations. L’algorithme spécifié pour la vidéo repose sur un codage à base de DCT. La norme présente l’avantage d’effectuer la découpe en séquences de groupes d’images totalement indépendants pour la compression (rapport pouvant atteindre 200) et de permettre un accès aléatoire rapide aux images et l’usage de prédictions interpolatives (recherche dans les images précédentes et suivantes). Les applications MPEG-1 concernent le stockage et l’enregistrement, sur cédérom, sur cassette audio digitale (DAT, pour Digital Audio Tape), sur compact-disque interactif (CD-I) et sur micro-ordinateur, de produits multimédias, ainsi que la transmission d’images animées à bas débit sur le réseau local ou sur large bande RNIS à large bande, ATM et LAN en qualité de type VHS (1,5 à 2 Mbit/s). L’affichage de l’image comporte 352 ×288 points.

Les points faibles de MPEG-1 relatifs à la qualité des images fortes en contraste (lettres blanches sur fond noir, zébrures marquées) et des mouvements multiples et rapides (spots publicitaires), ont ouvert la voie à MPEG-2.

4.2 - MPEG-2 (1995)


Cette norme traite de l’ensemble des applications audio, vidéo et images animées (consultation de banques d’images, communications interpersonnelles et diffusion de programmes télévisés). Elle définit la compression d’images, la compression audio et vidéo en un débit unique et le transport des données correspondantes. Après traitement des carrés de pixels, MPEG-2 ne conserve d’une image à l’autre que les éléments changeant, les éléments intermédiaires étant calculés par interpolation à partir d’images de référence. Elle permet la compression entre 2 et 8 Mbit/s d’un signal télévisuel de 216 Mbit/s et décrit l’ensemble des fonctions autorisant la multiplication des services en rapport avec les capacités des réseaux de distribution utilisés.

Elle contient trois parties principales :


- la couche système et la représentation du multiplexage de flux voix, données,
- images, y compris le télétexte de sous-titrage, le guide de programmes,
- la messagerie d’accès, la signalisation, les jeux, etc. ;
- la compression vidéo ;
- la compression audio.


Le flux de données obtenu en MPEG-2 est sensible à la gigue (cas de l’ATM) et à la latence introduite par la correction d’erreur de type Reed Solomon mise en oeuvre sur supports ADSL. La vidéo doit donc inclure des mécanismes de correction d’erreur protégeant la couche MPEG-2. La norme MPEG-2 est utilisée dans les systèmes DVB et DVD.

4.3 - MPEG-4 (1994-2004)


La norme MPEG-4 (ISO/CEI 14496) permet d’offrir des services interactifs et d’optimiser les codages et décodages d’images animées 2D et 3D en fonction des applications. Elle fournit une architecture ouverte, basée sur la notion de flux de données, permettant l’intégration cohérente de différents médias. La scène audiovisuelle est composée à partir d’une collection d’objets qui sont compressés séparément, stockés, acheminés, superposés, puis assemblés et qui demeurent manipulables. La compression est adaptée à chaque élément de l’image et du son (parole ou musique), avec un algorithme propre, ce qui sollicite moins de ressources et facilite l’interactivité et la transmission sur supports à flux partagés (réseau HFC, streaming en CDN ou en emploi sur DVD). MPEG-4 utilise un langage spécifique décrivant la génération de sons. La norme comprend 16 sections, appelées "part". Les profils ainsi définis correspondent aux domaines d’applications.

La structure streaming vidéo de MPEG-4 comprend trois domaines, la zone de création de contenu, appelée AEP (Authoring Encoding Publishing), la composante serveur qui met en paquets les données codées et compressées et les envoie sur le réseau, et la composante Player qui exécute la décompression sur l’ordinateur. L’utilisateur peut définir un objet et ajouter d’autres éléments selon son gré. On peut ainsi créer des scènes complexes et les manipuler.

MPEG-4 utilise un débit variable, moins élevé que celui de MPEG-2 (de 20 kbit/s à 6 Mbit/s pour un flux télévisuel images et sons) et permet une meilleure qualité. Son taux de compression peut être quatre fois plus élevé que celui de MPEG-2, car il tire partie de l’occurrence des mouvements des images. Il répond aux besoins de la production et de la diffusion télévisuelle, et à la représentation du contenu audiovisuel des applications multimédia. MPEG-4 ne convient pas à la transmission radioélectrique, car la dégradation du support ne permettrait pas les fonctions nécessaires. Realtime Transport Protocol (RTP), qui est plus adapté à la transmission temps réel que TCP, devrait permettre le transport de MPEG-4 sur les réseaux fixes et mobiles en IP, dans de meilleures conditions qu’avec TCP.

"MPEG-4 simple visual" comprend le codage vidéo des objets rectangulaires en H.263 pour le codage de scènes et le codage CELP pour la parole, ce qui n’exige que 60à 80 % du débit à 64 kbit/s. Des décodeurs MPEG-4 pour des débits à 15 images par seconde en QCIF (quart d’écran), associés à des mémoires 4 Mbit/s de Dram sont en cours de développement pour des liaisons Internet par radio. PacketVideo réalise des flux audio et vidéo en MPEG-4 (profil Visual Simple Scalable) pour l’équipement du GPRS à 8 images par seconde à 30 kbit/s.

MPEG-4 High Efficiency AAC (advanced audio coding) existe dans MPEG-2 et MPEG-4 depuis 1997 (Part 10 de la norme MPEG-4). Elle améliore la compression de MPEG-4 tout en demeurant compatible avec les normes de codage vidéo H.263 et H.26L. AAC est combinée avec SBR (Spectral Band Replication), de sorte que n’importe quel codec audio puisse restituer le son à un débit deux fois plus faible. Le son DVD canal 5.1 stéréo est ainsi possible à 48 kbit/s.

MPEG-4 ou AVC (pour advanced video coding ou H.264), défini en 2002 par un groupe d’experts de l’ISO, la CEI et de l’UIT-T, permet de compresser un signal vidéo à 944 kbit/s en gardant la même qualité que celle d’un DVD. Un signal télévisuel en TVHD diffusé en MPEG-2 à 20 Mbit/s ne demande que 8 Mbit/s en MPEG-4 H.264. La norme permet le codage d’images vidéo en balayage progressif ou entrelacé (même si elles sont combinées). Elle utilise un ensemble de codage de prédictions spatiale et temporelle. L’image est divisée en blocs qui subissent un premier codage. Les images suivantes sont déduites par une prédiction liée à la compensation de mouvement sur les quatre images codées précédemment. H.264 est connue aussi sous la référence MPEG-4 Part 10 et AVC (pour Advanced Video Coding). H.264 s’applique à la télévision sur ADSL, au streaming vidéo, aux lecteurs de DVD, aux diffuseurs TV vers les terminaux mobiles et la diffusion TV et TVHD par satellite. Il concerne le balayage progressif ou entrelacé, quel que soit le nombre de lignes.

La norme MPEG-4 Part 10 (Advanced Video Coding ou Joint Video Team) liée è H.264 s’accommode d’une diffusion en modulation en 8 ou 16-PSK, associée à un procédé de codage et de décodage simple et très souple. Les codeurs/décodeurs en MPEG-4/H.264 (profils Main ou High) selon la norme ISO/CEI 14 496-10 sont disponibles, et certains d’entre eux offrent des perspectives d’adaptation à MPEG-2.

H.264/MPEG-4/AVC permet de placer deux à trois programmes télévisuels dans une bande fréquences du MPEG-2. Un satellite de 36 MHz de largeur de bande peut transporter au choix, soit 8 à 10 programmes télévisuels en MPEG-2, soit une trentaine de programmes en H.264/DVB/S2, soit cinq à six chaînes en HDTV.

Le codage de compression de l’image vidéo, référencé H.264/AVC, a été amélioré par le développement d’un ensemble qui porte le nom de FRExt (pour Fidelity Range Extensions). Ainsi, la norme est adaptée aussi bien pour des applications de basses résolutions utilisables pour les loisirs, mais aussi pour les images de haute définition et les applications de qualité pour le travail en studio. L’extension FRExt est utilisable pour la TVHD, la vidéo DVD améliorée, la distribution et la contribution de contenus, le traitement de post production et l’édition vidéo de studio.

4.4 - MPEG-5


Cette norme est liée à T.171 et à T.172 et permet la navigation entre scènes ainsi que le contrôle de l’information par l’utilisateur.

4.5 - MPEG-7 (2001)


MPEG-7 (Multimedia Content Description Interface) est une norme qui a pour objectif l’indexation, la description et la recherche des images et des données multimédia par leur contenu. Un langage de requête avec indexation du contenu est défini de façon à ce que la recherche des images se fasse rapidement MPEG-7 effectue une description des informations multimédias (images fixes, graphiques, audio, vidéo et leurs combinaisons) et constitue un moteur de sélection et un navigateur de recherche efficace des informations. La description utilise le contenu et les informations scéniques (type de compression, taille du fichier, copyright, gestion des droits numériques avec MPEG-4 et MPEG-21, prix, etc.).
[Voir www.mpeg-7.com]


4.6 - MPEG-21


MPEG-21 (Multimedia Framework) définit un cadre général pour l’accès au contenu multimédia, avec interaction et échanges avec les utilisateurs, combinant l’audio, la vidéo, les graphiques, l’image de synthèse, textes, la gestion des droits, etc.

5 - Positionnements relatifs des normes


5.1 - H.264, MPEG-4 et la concurrence


Une concurrence entre MPEG-4/H.264 et Windows Media 9 (WM9) de Microsoft est ouverte. Microsoft a fait valider son logiciel de compression d’images par l’association SMPTE (Society of Motion Picture and Television Engineers). WM9 est très prisé des producteurs de films et de vidéos à cause de la souplesse apportée par les logiciels de gestion et de création d’images. WM9 pourrait être intégré dans les normes DVB.

Les concurrents de MPEG-4 (les Media Player de Microsoft Window et de Real Networks) contiennent des parties de la norme MPEG-4 d’origine ainsi que des enrichissements d’origine propriétaires. Ces produits concurrents sont apparus parce que les codeurs de MPEG-4 sont restés longtemps coûteux. Le succès commercial de MPEG-2 appartient au passé et MPEG-4 entre maintenant sur le marché industriel.

5.2 - MHP


Il existe deux spécifications de MHP (Multimedia Home Plateform) qui traitent de la diffusion vidéo numérique (DVB, Digital Video Broadcasting). La version DVB 1.0 traite de la partie transport dans des flux MPEG et MPEG-4 en constitue l’évolution logique et donc plus performante. DVB 2.0 s’intéresse aux plateformes MHP et aux applications en IP. La combinaison de MPEG-4 et de MHP permet de façon harmonieuse le transport et l’exploitation d’applications sous IP de façon flexible dans le domaine de la diffusion interactive.

MHP présente l’intérêt d’utiliser le langage de la Toile avec XHTML, ce qui réduit les coûts, en particulier pour les applications interactives, puisque l’adaptateur (le Set Top Box) a moins besoin de moins de circuits mémoires.

5 - Conclusions


Le codage et la compression d’image ont franchi des étapes importantes au cours des quinze dernières années. La pression des besoins (limitation des accès aux canaux satellitaires, naissance des systèmes accès numériques dans le réseau de distribution, apparition des flux en streaming pour les réseaux à distribution de contenu (CDN), création d’applications voix et données simultanées à bas débit, besoins estimées du marché de la mobilité, etc.) et les performances successives effectuées en matière de composants expliquent la pluralité de ces normes successives.

L’ensemble H.264/MPEG-4 AVC constitue pour le moment la clé de voûte de ce travail d’agrégation de normes en vue de leur utilisation dans les diverses applications créées et diffusées sur les différentes parties des réseaux existants. L’intérêt majeur des choix des normes retenues pour le codage d’images et la modulation concerne les fréquences disponibles sur les supports utilisés (câble, DSL, voie radioélectrique) et la possibilité, en radio, de pouvoir diffuser des images vidéo, soit sur les terminaux téléphoniques portables, soit vers des écrans incorporés à l’habitacle des véhicules en mouvement.

Sources : MPEG-4 Industry Forum, EIH, IEEE ComSoc, Via Satellite, etc.


Abonnement à la Newsletter      Haut de page

 Votre adresse e-Mail : 
S'inscrire Se désinscrire
Inscription libre et sans engagement
Derniers titres - Flux RSS
• Développement des paiements en technologie NFC
(10 février 2012 - Magazine)
Le succès d’une application dépend du degré de confiance et d’intérêt dont lui témoignent ses utilisateurs. La technologie NFC a lancé ses premières (...)
• Partage de voitures grâce au SMS
(9 février 2012 - Actualités)
Netsize, fournisseur de solutions pour le commerce par téléphone mobile et filiale de Gemalto, commercialise l’application "CityzenCar", (...)
• L’insécurité grandissante mobilise les acteurs de la sécurité
(5 février 2012 - Magazine)
Chacun constate l’augmentation de l’insécurité sur la Toile et ceci laisse planer des doutes sur la confiance du public dans le bon fonctionnement (...)
Agenda

Consultez la liste des prochains événements :

CIEN 2012 – RF & Hyper, Du 24 au 26 Octobre 2012 à Paris Expo Porte de Versailles., Le prochain CIEN, carrefour ... [suite] Premier congrès francophone des applications des fibres optiques, Les 23, 24 et 25 Octobre 2012, à Paris, Porte de Versailles Hall 1, Le Premier congrès francophone ... [suite]


Recherche par thème


  • Accueil
  • Services
  • Evénements
  • Webzine
  • Newsletter
  • Plan du site
  • Mentions Légales
  • Contact