Cine & Video Digital
 
Aspect Ratio (relación de aspecto) en DVD y medios digitales

En este asunto del video digital, un tema importante y que induce confusiones además, porque no está bien explicado es el del AR (aspect ratio) ó relación de aspecto por su traducción castellana.
Con AR queremos significar la relación entre el ancho y el alto de una imagen.

fig AR= anchura/altura

En general en el mundo de las imágenes digitales la menor unidad de medida es el pixel, que vendría a ser como un "punto" cuya característica principal será el color. Así, una imagen dada tendrá tantos pixels de ancho por tantos píxels de alto.

La pantalla de la TV tuvo en sus comienzos un AR convencional de 4:3 (AR=1.3333) dado que aparentemente resultaba cómodo para el ojo que la imagen fuese ligeramente más ancha que alta. Entonces los primeros monitores incorporaron esta característica, el AR de 4:3. Ahora bien, como el TV y el CRT (el tubo de rayos catódicos del monitor) funcionan diferente; mientras que en el TV las imágenes se forman en líneas en el CRT se las construye como una colección de píxels. El CRT es una gran tablero de píxels cuadrados (puntos en realidad) que se encienden con diferentes valores de RGB (esto define cuanto de rojo, verde y azul tendrá dicho píxel y con ellos tres construímos todos los otros colores) para representar una imagen.
La distribución de estos puntos es uniforme en la pantalla y por lo tanto su densidad también: 72 puntos por pulgada (72 dpi=dots per inch). Es decir que en un CRT de 14" (medida que da la diagonal) tenemos aproximadamente 488000 pixels.\endnote{La cuenta sale fácil teniendo en cuenta que tenemos dos ecuaciones con dos incógnitas: a^2 + b^2 = d^2 y a/b=4/3}
Luego, las imágenes digitales (en realidad, hablando con más propiedad, las que son del tipo mapa de bits (raster)) también están conformadas por una parrilla de píxeles cada uno de los cuales tiene cierta cantidad de bits para almacenar la información de color.

fig imagen digital en zoom mostrando los pixels

El siguiente cuadro presenta los colores disponibles para un píxel de acuerdo a la cantidad de bits utilizados para almacenar la información de color de dicho píxel.

1 bit 2^0=2 colores
4 bits 2^4=16 colores
8 bits 2^8=256 colores
16 bits 2^16=65.536 colores (miles de colores)
24 bits 2^24=16.777.216 colores (millones de colores)
32 bits 2^32=4.294.967.296 colores (color real)

Con un bit de color solo tenemos dos opciones posibles: por ejemplo B&N, que es la usada para los trabajos tipo "art line", si estamos escaneando una firma por ejemplo en general no necesitaremos miles de colores sino solo dos para representar trazo de bolígrafo o ausencia de trazo de bolígrafo. Por supuesto entre menos bits utilicemos para la imagen, menos pesará el archivo gráfico.

Un bit es el componente mínimo de información que puede almacenarse. Como las computadoras trabajan en sistema binario, el bit tendrá dos valores posibles que serán equivalentes al 0 y al 1, que son los dos únicos valores con los cuales trabaja un ordenador. La correspondencia es:

ON - encendido - 1
OFF - apagado - 0

Entonces ahora vemos fácilmente que con un bit para un píxel tenemos dos posibilidades (y las asignamos al blanco y al negro); con cuatro bits por píxel tendremos como posibilidades las combinaciones de cuatro píxels cada uno de los cuales puede hallarse en el estado 1 ó el 0. Entonces podemos contar a mano los casos diferentes: 0000, 1000, 1100, 1110, 1111, 1001, 1101, 1110, etc. y veremos que llegamos a 16. Pero es más fácil pensarlo como en general: si tengo n elementos cada uno de los cuales puede hallarse en dos estados (0 ó 1) al tomar el primero tengo dos posibilidades, el segundo tiene otras dos que son independientes del primero, y el tercero a su vez tiene también dos que resultan independientes del primero y del segundo y así siguiendo esta idea resulta

2.2.2...2 n veces

con lo cual el # total será 2^n.

Volviendo al tema de las imágenes supongamos que tenemos una imagen de XxY pixels en el CRT, por ejemplo de 200x200. Entonces, ¿cómo se ubican?
Aquí entra en juego el parámetro que se llama "resolución de pantalla". Es decir que, dados los puntos fijos del monitor podemos configurar nuestro sistema operativo para que presente los elementos gráficos y el escritorio\endnote{Aunque pueda parecer poco general note que todos los sistemas operativos gráficos utilizan el concepto de ESCRITORIO (Windows, Mac OS, todos lo Linux y muchos UNIX) para presentar el acceso a los datos y funcionalidades que sobre la máquina provee el sistema operativo} de cierto tamaño, es decir para que entren en la pantalla tantos puntos de imagen. El tamaño del área visible de la interfaz gráfica de un sistema operativo se conoce como resolución de pantalla y se mide en puntos que aquí se llamarán también píxels.
Resoluciones típicas son:

320*240
640*480
800*600
1024*768

Debe notarse que todas estas tiene el AR 4:3. La segunda de la lista fue la resolución típìca de los primeros equipos con Windows; es el estándard conocido como VGA. En realidad a éstos números deberíamos agregarle los colores posibles en forma de bits, es decir dar una resolución completa de pantalla sería decir algo como

1024*768*16 bits

lo cual sabemos que equivale a miles de colores.
Ahora bien, dado que una imagen, por ejemplo una foto digital, tiene un tamaño fijo (200x200), lucirá de diferente tamaño de acuerdo a la resolución configurada en la pantalla. En 320x240 ocupará un zona amplia de la pantalla, mientras que en 1024*768 apenas será algo mayor que el tamaño de un ícono..

fig una foto de 200x200 en dos resoluciones diferentes.

 

Nótes que dados los puntos físicos del CRT, entre más alta la resolución de pantalla un punto fijo del CRT tiene que agrupar mayor cantidad de píxels. Pero como no podemos darle diferente color a un mismo punto del CRT, por más que agrupe a varios pixels se sigue que un CRT pequeño no es conveniente para altas resoluciones porque se falsea información: pixels adyacentes tendrán la información del pixel de pantalla que les toque; así si cuatro píxels de imagen entran en un píxel de pantalla y dos son verdes y dos violáceos (en la descripción de estos píxels en la foto) en el CRT se verán o bien verdes o bien violáceos o bien de otro color pero no será posible asignar medio pixel de CRT a un color y medio píxel al otro.
Los monitores más grandes tienen consecuentemente más puntos (una "parrilla" mayor) y permitirán acomodar resoluciones de pantalla mayores. Asimismo el incremento en la calidad y en la capacidad tecnológica ha originado que el espacio entre puntos sea menor. Hay monitores que tienen el punto más pequeño: esto aumenta la nitidez de la imagen. Esta caracterísitica se suele hallar en las descripciones técnicas referida como el "dot pitch" del monitor.

Volviendo un poco a lo que nos ocupa, digamos que el video, imágenes digitales en movimiento, se comporta de forma similar a las imágenes fijas en lo que refiere a resolución.

La digitalización, dependiendo de la norma de video, toma la señal analógica de video y la transforma en una sucesión de imágenes digitales de cierto tamaó estandard.

PAL 768*576 (25 fps)
NTSC 640*480 (~30 fps)

Nótese otra vez la relación 4:3. La diferencia de tamaños es una cuestión simplemente de normas de vídeo. En un principio podríamos decir que el sistema PAL tiene una mayor calidad por el mayor tamaño de frame, aunque el NTSC usa una mayor cantidad de cuadros por segundo. Sin embargo, dirimir eso sería meternos en una acalorada discusión proque hay aún otros elementos de juicio que deben ser considerados como son la representación del color y la fluidez.

Estos valores de calidad corresponden a lo que se llama Full Resolution y que corresponde a las siguientes modalidades:

FULL WIDTH + TWO FIELDS
(ancho completo) + (dos campos)

Claro, también podemos digitalizar la pantalla en menor resolución, conservando el AR, pero utilizando menos píxels. Así tenemos las siguientes combinaciones:

Half Width / Two Fields
Half Width / One Field

Los DVD, como se sabe pueden reproducirse en TV o en una pantalla de computadora (con software apropiado). El vídeo estandard en un DVD es el formato MPEG-2, el cual contiene características universales para permitir la compatibilidad.

La TV, al menos la analógica, funciona de forma diferente: dibujando líneas horizontales. La cantidad de las mismas depende, otra vez, de la norma:

PAL 625 líneas
NTSC 525 líneas

De acá surge parte de la diferencia en la resolución de captura; las 100 líneas de diferencia entre ambas normas se transforman en 96 píxels al digitalizar.
Dado que, como dijéramos, los DVD´s deben poder verse en TV´s y en CRT´s se utilizan resoluciones estandard para DVD´s. Estas son:


PAL

720x576 FR 2F
704x576 FR 2F
352x576 HR 2F
352x288 HR 1F

NTSC

720x480 FR 2F
704x480 FR 2F
352x480 HR 2F
352x240 HR 1F

Entonces el tamaño de los videos almacenados en el DVD (según la norma de TV) debería tener estas dimensiones. Varias cosas deben ser notadas aquí:

El AR de estas resoluciones es incorrecto; es decir no es 4:3. Por ejemplo para 720x576 es 5:4 (1.25). Un video de esta índole sería visto de forma incorrecta en un CRT



Lo que sucede es que los píxels equivalentes para un TV no son cuadrados; en realidad el TV no usa píxels sino líneas horizontales.
Entonces existe una libertad en cuanto al tamaño horizontal que podemos utilizar: incluso podemos utilizar pixels que no sean cuadrados: esto es marcadamente diferente a lo que sucedía en un CRT donde los píxels son cuadrados y el AR viene dado sencillamente por el cociente ancho/alto.
En el mismo video MPEG-2 se guarda la información del AR correcto del video que contiene. Este es en principio independiente de la resolucion del mismo. Los reproductores de DVD por hardware y los buenos reproductores de DVD por software (power DVD, winDVD, etc.) tienen la capacidad de "formatear" el video al AR correcto para la pantalla. Así por ejemplo, un DVD PAL de 720x576 reproducido en una pantalla configurada a 800x600 sufre una conversión estirando su altura en 1.041 veces y su anchura en 1.111, donde vemos que los incrementos no son iguales.


La TV y el monitor tienen espacios de color y resoluciones diferentes.

Por el lado de los monitores la resolución es el tamaño de la pantalla en píxels. Los píxels son cuadrados (square pixels).
En los CRT la relación de aspecto (AR de 'aspect ratio') de la pantalla era siempre 4:3, entonces teníamos varias resoluciones que podíamos emplear:
640x480
800x600
1024x768

Los monitores LCD tienen una única resolución en la cual la imagen resulta perfecta (es la llamada resolución nativa). Esto no significa que no podamos utilizarlos en otras resoluciones, pero la calidad es inferior, lo cual se nota sobre todo en la lectura de textos o en imágenes con mucho detalle. Se tiene un aspecto "dentado". Por ejemplo para ciertos tamaños las resoluciones nativas son:

17'' 1024x960
19'' 1280x1024 (AR de 1.25)
19'' Wide 1440x990

La TV trabaja con líneas, cuyo número varía según la norma de televisión de que se trate. El equivalente de estas líneas de TV en píxels (que es el máximo tamaño de captura) resulta ser, para las diferentes normas,:

PAL 625 líneas 768x576 (AR 4:3)
NTSC 525 líneas 640x480 (AR 4:3)

Si una película no tiene el AR adecuado sin dudas fue cropeadam sin embargo pudo haber sido cropeada y conservar el AR, aunque obviamente falta una parte en cada fotograma.

Las resoluciones de DVD's estándard son:

720x480
720x576


Siempre lo que se digitaliza es el área completa del TV. Por el momento, y para facilitar las explicaciones nos referiremos a señales de TV que llenan la pantalla, conocidas como Full Screen; como sabemos hay material que se presenta en un formato más ancho originalmente desarrollado por el cine que se conoce en términos generales como WideScreen. Luego, tenemos la misma pantalla digitalizada en
Half Width 2 Fields
que mostrará la imagen compresa horizontalmente (nótese que se halla la imagen completa) y half width 1 field que tiene el AR ligeramente diferente; en PAL menor (1.222) y en NTSC mayor (1.4666).


Ultima actualización: 27-Ago-2009