L’ascesa di MPEG-4 fra royalties, veti e tecnologia

Questo formato di compressione video promette una grande efficienza, l’utilizzo con ogni tipo di media e una forte interazione fra l’utente e la scena, comosta da testo, grafica, video, audio e animazione

ottobre 2003 MPEG significa Moving Picture Experts Group, il comitato
dell'ISO (International Organization for Standardization, www.iso.org) che
ha sviluppato gli omonimi standard, tra cui MPEG-1, MPEG-2 e MPEG-4, MPEG-7 e
MPEG-21.

I primi tre di questi standard definiscono il formato della compressione audio/video
e implicitamente il decompressore, mentre ogni produttore è libero di
sviluppare i propri compressori, utilizzando implementazioni sia hardware sia
software.

MPEG-1, approvato nel 1991, con i suoi 352x240 pixel tipici,
offre una qualità di poco inferiore rispetto al VHS (Video Home System,
il comune formato di registrazione su videocassetta); fanno parte dell'MPEG-1
il diffusissimo MP3 (MPEG-1 Audio Layer III) e il VideoCD,
che nei primi anni '90 ha permesso di condensare 74 minuti di audio-video
su un CD.

MPEG-2, approvato nel 1994, è il formato che tra l'altro
ha reso possibile registrare i film su DVD. Per far fronte a diversi campi di
applicazione, lo standard è suddiviso in Profili e Livelli.
Un profilo descrive il grado di complessità, mentre ogni livello di un
profilo definisce la risoluzione (le dimensioni dell'immagine).
Il livello Main (principale) del profilo Main prevede un quadro di 720x576 pixel
con uno streaming (flusso di bit) di 15 Mb/s. Il profilo Main,
livello Low prevede 352x288 a 4 Mb/s, mentre il profilo High/High per TV ad
alta risoluzione prevede 1920x1152 a 100 Mb/s. Un tipico DVD a doppio strato
contiene circa due ore di film MPEG-2 più audio e sottotitoli in varie
lingue, commenti, servizi speciali, trailer e altro.

Perché MPEG-4?
Nonostante il successo determinante di MPEG-1 e MPEG-2 nel diffondere audio
e video digitali, questi formati non offrono l'efficienza di compressione,
la qualità e la flessibilità necessarie per coprire tutte le esigenze
multimediali, in particolare l'invio di stream audio-video di qualità
attraverso Internet a dispositivi mobili, come cellulari e palmari, e con banda
passante medio-bassa.

MPEG-4, standardizzato nel 1988 e periodicamente soggetto
a evoluzione ed estensioni, ingloba le funzionalità di MPEG-1 e MPEG-2
(non esiste un MPEG-3) ed è strutturato come “toolbox aperto”,
ovvero un ricco assortimento di strumenti che coprono l'intera gamma di
media e applicazioni, dallo streaming a bassissima banda passante fino alle
applicazioni interattive di alta qualità con mix di audio-video, grafica
2D/3D, oggetti sintetici, animazione di volti e corpi, testi, applicazioni interattive
e altro. Gli autori e i produttori di contenuti MPEG-4 scelgono quali strumenti
del toolbox utilizzare secondo il tipo di applicazione e di utenza, sfruttando
l'adattabilità dell'MPEG-4 alla banda passante e ai tipi
di reti disponibili.

I vantaggi
MPEG-4 fornisce le tecnologie necessarie a soddisfare le esigenze degli utenti,
dei provider e degli autori. Agli utenti fornisce contenuti interattivi
secondo quanto programmato dagli autori. Per esempio, un clic sul titolo
di un film potrebbe far apparire una finestra di informazioni e magari un'altra
finestra con il trailer e un'interfaccia di e-commerce per l'acquisto,
il tutto portando le applicazioni multimediali a nuovi tipi di rete, incluse
quelle wireless e a bassa velocità.

Gli autori beneficiano della grande riutilizzabilità dei contenuti
e della flessibilità dell'MPEG-4, che somma le potenzialità
di TV, grafica animata, pagine Web e protezione della proprietà intellettuale.

A beneficio dei provider, MPEG-4 fornisce informazioni che in modo trasparente
vengono interpretate e tradotte nello standard di segnalazione dei vari tipi
di rete. Così lo stesso contenuto può essere instradato indifferentemente
su Internet o su un cellulare.

Come funziona
Per raggiungere questi obiettivi lo standard MPEG-4 specifica come si realizzano
le funzioni necessarie:

1) la rappresentazione di ogni elemento di contenuto (audio,
foto, video, audio-video) tramite “media object”, cioè oggetti
che possono avere origine naturale (per esempio ripresi con microfono e telecamera)
o sintetica (es. testi, audio sintetico, teste e corpi animati e grafica 2D/3D
computerizzata);

2) la descrizione di come comporre questi oggetti per creare
oggetti composti che formano le scene audio-video;

3) la multiplazione (la condivisione del canale di trasmissione
da parte di più stream e dati simultanei) e la sincronizzazione tra i
dati associati con gli oggetti, in modo da consentire il trasporto su vari tipi
di reti con la necessaria qualità di servizio;

4) l'interazione tra l'utente e la scena audio-video
generata sul terminale di destinazione.

MPEG-4 è dinamico
MPEG-2 è statico, nel senso che dopo la composizione
dell'immagine (video, grafica e testo) in una finestra di pixel, restano
solo i pixel, senza la possibilità di recuperare gli elementi originari
dell'immagine (per esempio una scritta o un logo), che non potranno essere
né riutilizzati né rimossi.

In MPEG-4, invece, i diversi oggetti della scena possono essere codificati
e trasmessi separatamente al decodificatore sotto forma di stream elementari.
La composizione della scena avviene dopo la decodifica degli stream, che possono
rappresentare oggetti audio, video o di altro genere. Per eseguire la composizione,
MPEG-4 utilizza un apposito linguaggio di descrizione della scena chiamato BiFS
(Binary Format for Scenes)
. In questo modo il logo di un programma
televisivo può essere un oggetto separato e sostituibile.

Un esempio
Per esempio, per comporre in MPEG-4 la sequenza di una persona che illustra
una presentazione audio-video accanto a un tavolo sormontato da un mappamondo,
avremmo una serie di oggetti base: la sequenza audio-video visualizzata sullo
schermo, l'immagine (sprite, un'immagine indipendente nell'immagine
più grande) del presentatore più l'audio della sua voce,
gli oggetti sintetici 3D del tavolo e del mappamondo, più i criteri di
composizione audio e video della scena e dell'interazione consentita all'utente.

MPEG-4 permette di collocare gli oggetti all'interno di un sistema di
coordinate, applicare trasformazioni per modificare l'aspetto geometrico
e acustico di un media object, raggruppare oggetti primitivi per formare oggetti
composti, applicare stream di dati a oggetti per modificarne gli attributi (per
esempio un suono, una texture in movimento, i parametri di animazione di un
volto sintetico) e modificare in modo interattivo il punto di vista e di ascolto
dell'utente all'interno della stanza. Il linguaggio BiFS permette
anche di descrivere il comportamento condizionale degli oggetti, in base ad
eventi e agli input interattivi dell'utente.

Profili e livelli
MPEG-4 è costituito da un gran numero di tool non tutti contemporaneamente
necessari per ogni applicazione. Per consentire diversi utilizzi ai diversi
segmenti di mercato, MPEG-4 è strutturato in profili, che non sono altro
che gruppi di tool.
I profili esistono a vari livelli, per limitare la complessità di elaborazione
(per esempio il bit rate, il numero massimo di oggetti, il tipo di audio) secondo
le particolari necessità.

L'architettura
La complessità dell'MPEG-4 è descritta negli standard, nei
libri e in numerosi documenti reperibili on line.
Per un breve assaggio, citiamo le parti principali in cui è suddiviso
lo standard: Systems (parte 1); Visual (parte
2); Audio (parte 3); Conformance (parte 4,
descrive come verificare un'implementazione MPEG-4); Reference
Software
(parte 5, una base per iniziare l'implementazione dello
standard); DMIF - Delivery Multimedia Integration Framework
- (parte 6, descrive l'interfaccia tra l'applicazione e la
rete o storage); la descrizione di un codificatore video ottimizzato
(parte 7); Transport (parte 8); la descrizione dell'hardware
di riferimento
(parte 9); il recente AVC File Format (parte
10) che descrive l'Advanced Video Coding, un codec video che raggiunge
un'efficienza di compressione anche doppia rispetto all'MPEG-2;
la descrizione della scena (parte 11); ISO Media File
Format
(parte 12); IPMP Extensions (parte 13, permetteranno
ai produttori di installare le proprie soluzioni di DRM per la protezione dei
contenuti); MP4 File Format (parte 14); AVC File Format
(parte 15) e Animation Framework Extensions e Multi-user Worlds
(parte 16).

I vantaggi sui concorrenti
MPEG-4 arriva sul mercato quando hanno già messo radici diversi agguerriti
concorrenti come Windows Media, Real e Flash.

Tuttavia MPEG-4 offre diversi vantaggi:
• i codec audio-video sono basati su standard, non su tecnologie proprietarie
come gli altri tre;

• è altamente interattivo, a differenza di WM; include il controllo
in tempo reale dello stream (assente in Flash);

• include un completo sincronismo di precisione tra tutti gli oggetti
trasmessi, non solo quelli audio/video (WM e Real offrono solo sincronismo audio/video,
Flash neppure quello);

• è l'unico attrezzato per il broadcast;

• è l'unico basato su oggetti (non solo A/V ma anche testo,
grafica, animazione e via dicendo) con streaming complessivo che include il
DRM (Digital Rights Management, la gestione dei diritti d'autore e protezione
dei contenuti);

• supporta oggetti grafici (supportati da Flash ma non da WM e Real);

• offre la scelta più vasta di protocolli di trasporto in rete
(Flash quella più ristretta, solo Http);

• si applica a PC, set top box (i box sopra il televisore) e dispositivi
mobili e wireless (Flash non offre questo supporto).

continua...

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome