Questo formato di compressione video promette una grande efficienza, l’utilizzo con ogni tipo di media e una forte interazione fra l’utente e la scena, comosta da testo, grafica, video, audio e animazione
ottobre 2003 MPEG significa Moving Picture Experts Group, il comitato
dell’ISO (International Organization for Standardization, www.iso.org) che
ha sviluppato gli omonimi standard, tra cui MPEG-1, MPEG-2 e MPEG-4, MPEG-7 e
MPEG-21.
I primi tre di questi standard definiscono il formato della compressione audio/video
e implicitamente il decompressore, mentre ogni produttore è libero di
sviluppare i propri compressori, utilizzando implementazioni sia hardware sia
software.
MPEG-1, approvato nel 1991, con i suoi 352×240 pixel tipici,
offre una qualità di poco inferiore rispetto al VHS (Video Home System,
il comune formato di registrazione su videocassetta); fanno parte dell’MPEG-1
il diffusissimo MP3 (MPEG-1 Audio Layer III) e il VideoCD,
che nei primi anni ’90 ha permesso di condensare 74 minuti di audio-video
su un CD.
MPEG-2, approvato nel 1994, è il formato che tra l’altro
ha reso possibile registrare i film su DVD. Per far fronte a diversi campi di
applicazione, lo standard è suddiviso in Profili e Livelli.
Un profilo descrive il grado di complessità, mentre ogni livello di un
profilo definisce la risoluzione (le dimensioni dell’immagine).
Il livello Main (principale) del profilo Main prevede un quadro di 720×576 pixel
con uno streaming (flusso di bit) di 15 Mb/s. Il profilo Main,
livello Low prevede 352×288 a 4 Mb/s, mentre il profilo High/High per TV ad
alta risoluzione prevede 1920×1152 a 100 Mb/s. Un tipico DVD a doppio strato
contiene circa due ore di film MPEG-2 più audio e sottotitoli in varie
lingue, commenti, servizi speciali, trailer e altro.
Perché MPEG-4?
Nonostante il successo determinante di MPEG-1 e MPEG-2 nel diffondere audio
e video digitali, questi formati non offrono l’efficienza di compressione,
la qualità e la flessibilità necessarie per coprire tutte le esigenze
multimediali, in particolare l’invio di stream audio-video di qualità
attraverso Internet a dispositivi mobili, come cellulari e palmari, e con banda
passante medio-bassa.
MPEG-4, standardizzato nel 1988 e periodicamente soggetto
a evoluzione ed estensioni, ingloba le funzionalità di MPEG-1 e MPEG-2
(non esiste un MPEG-3) ed è strutturato come “toolbox aperto”,
ovvero un ricco assortimento di strumenti che coprono l’intera gamma di
media e applicazioni, dallo streaming a bassissima banda passante fino alle
applicazioni interattive di alta qualità con mix di audio-video, grafica
2D/3D, oggetti sintetici, animazione di volti e corpi, testi, applicazioni interattive
e altro. Gli autori e i produttori di contenuti MPEG-4 scelgono quali strumenti
del toolbox utilizzare secondo il tipo di applicazione e di utenza, sfruttando
l’adattabilità dell’MPEG-4 alla banda passante e ai tipi
di reti disponibili.
I vantaggi
MPEG-4 fornisce le tecnologie necessarie a soddisfare le esigenze degli utenti,
dei provider e degli autori. Agli utenti fornisce contenuti interattivi
secondo quanto programmato dagli autori. Per esempio, un clic sul titolo
di un film potrebbe far apparire una finestra di informazioni e magari un’altra
finestra con il trailer e un’interfaccia di e-commerce per l’acquisto,
il tutto portando le applicazioni multimediali a nuovi tipi di rete, incluse
quelle wireless e a bassa velocità.
Gli autori beneficiano della grande riutilizzabilità dei contenuti
e della flessibilità dell’MPEG-4, che somma le potenzialità
di TV, grafica animata, pagine Web e protezione della proprietà intellettuale.
A beneficio dei provider, MPEG-4 fornisce informazioni che in modo trasparente
vengono interpretate e tradotte nello standard di segnalazione dei vari tipi
di rete. Così lo stesso contenuto può essere instradato indifferentemente
su Internet o su un cellulare.
Come funziona
Per raggiungere questi obiettivi lo standard MPEG-4 specifica come si realizzano
le funzioni necessarie:
1) la rappresentazione di ogni elemento di contenuto (audio,
foto, video, audio-video) tramite “media object”, cioè oggetti
che possono avere origine naturale (per esempio ripresi con microfono e telecamera)
o sintetica (es. testi, audio sintetico, teste e corpi animati e grafica 2D/3D
computerizzata);
2) la descrizione di come comporre questi oggetti per creare
oggetti composti che formano le scene audio-video;
3) la multiplazione (la condivisione del canale di trasmissione
da parte di più stream e dati simultanei) e la sincronizzazione tra i
dati associati con gli oggetti, in modo da consentire il trasporto su vari tipi
di reti con la necessaria qualità di servizio;
4) l’interazione tra l’utente e la scena audio-video
generata sul terminale di destinazione.
MPEG-4 è dinamico
MPEG-2 è statico, nel senso che dopo la composizione
dell’immagine (video, grafica e testo) in una finestra di pixel, restano
solo i pixel, senza la possibilità di recuperare gli elementi originari
dell’immagine (per esempio una scritta o un logo), che non potranno essere
né riutilizzati né rimossi.
In MPEG-4, invece, i diversi oggetti della scena possono essere codificati
e trasmessi separatamente al decodificatore sotto forma di stream elementari.
La composizione della scena avviene dopo la decodifica degli stream, che possono
rappresentare oggetti audio, video o di altro genere. Per eseguire la composizione,
MPEG-4 utilizza un apposito linguaggio di descrizione della scena chiamato BiFS
(Binary Format for Scenes). In questo modo il logo di un programma
televisivo può essere un oggetto separato e sostituibile.
Un esempio
Per esempio, per comporre in MPEG-4 la sequenza di una persona che illustra
una presentazione audio-video accanto a un tavolo sormontato da un mappamondo,
avremmo una serie di oggetti base: la sequenza audio-video visualizzata sullo
schermo, l’immagine (sprite, un’immagine indipendente nell’immagine
più grande) del presentatore più l’audio della sua voce,
gli oggetti sintetici 3D del tavolo e del mappamondo, più i criteri di
composizione audio e video della scena e dell’interazione consentita all’utente.
MPEG-4 permette di collocare gli oggetti all’interno di un sistema di
coordinate, applicare trasformazioni per modificare l’aspetto geometrico
e acustico di un media object, raggruppare oggetti primitivi per formare oggetti
composti, applicare stream di dati a oggetti per modificarne gli attributi (per
esempio un suono, una texture in movimento, i parametri di animazione di un
volto sintetico) e modificare in modo interattivo il punto di vista e di ascolto
dell’utente all’interno della stanza. Il linguaggio BiFS permette
anche di descrivere il comportamento condizionale degli oggetti, in base ad
eventi e agli input interattivi dell’utente.
Profili e livelli
MPEG-4 è costituito da un gran numero di tool non tutti contemporaneamente
necessari per ogni applicazione. Per consentire diversi utilizzi ai diversi
segmenti di mercato, MPEG-4 è strutturato in profili, che non sono altro
che gruppi di tool.
I profili esistono a vari livelli, per limitare la complessità di elaborazione
(per esempio il bit rate, il numero massimo di oggetti, il tipo di audio) secondo
le particolari necessità.
L’architettura
La complessità dell’MPEG-4 è descritta negli standard, nei
libri e in numerosi documenti reperibili on line.
Per un breve assaggio, citiamo le parti principali in cui è suddiviso
lo standard: Systems (parte 1); Visual (parte
2); Audio (parte 3); Conformance (parte 4,
descrive come verificare un’implementazione MPEG-4); Reference
Software (parte 5, una base per iniziare l’implementazione dello
standard); DMIF – Delivery Multimedia Integration Framework
– (parte 6, descrive l’interfaccia tra l’applicazione e la
rete o storage); la descrizione di un codificatore video ottimizzato
(parte 7); Transport (parte 8); la descrizione dell’hardware
di riferimento (parte 9); il recente AVC File Format (parte
10) che descrive l’Advanced Video Coding, un codec video che raggiunge
un’efficienza di compressione anche doppia rispetto all’MPEG-2;
la descrizione della scena (parte 11); ISO Media File
Format (parte 12); IPMP Extensions (parte 13, permetteranno
ai produttori di installare le proprie soluzioni di DRM per la protezione dei
contenuti); MP4 File Format (parte 14); AVC File Format
(parte 15) e Animation Framework Extensions e Multi-user Worlds
(parte 16).
I vantaggi sui concorrenti
MPEG-4 arriva sul mercato quando hanno già messo radici diversi agguerriti
concorrenti come Windows Media, Real e Flash.
Tuttavia MPEG-4 offre diversi vantaggi:
• i codec audio-video sono basati su standard, non su tecnologie proprietarie
come gli altri tre;
• è altamente interattivo, a differenza di WM; include il controllo
in tempo reale dello stream (assente in Flash);
• include un completo sincronismo di precisione tra tutti gli oggetti
trasmessi, non solo quelli audio/video (WM e Real offrono solo sincronismo audio/video,
Flash neppure quello);
• è l’unico attrezzato per il broadcast;
• è l’unico basato su oggetti (non solo A/V ma anche testo,
grafica, animazione e via dicendo) con streaming complessivo che include il
DRM (Digital Rights Management, la gestione dei diritti d’autore e protezione
dei contenuti);
• supporta oggetti grafici (supportati da Flash ma non da WM e Real);
• offre la scelta più vasta di protocolli di trasporto in rete
(Flash quella più ristretta, solo Http);
• si applica a PC, set top box (i box sopra il televisore) e dispositivi
mobili e wireless (Flash non offre questo supporto).