El archivo de video digital: codificación, calidad y compresión de imágenes

Documento de la Universidad Carlos III de Madrid sobre el archivo de video digital. El Pdf explora conceptos clave como la resolución espacial, la profundidad de color, la resolución temporal y la compresión, ofreciendo una visión técnica detallada sobre cómo se almacenan y procesan las imágenes digitales en el ámbito de la informática universitaria.

19 páginas

El archivo de vídeo digital

Francisco Utray,

Profesor de Comunicación Audiovisual

Grupo de investigación TECMERIN.

El archivo informático de imagen ............................................................................................. 2

Resolución espacial ................................................................................................................... 3

Profundidad de color ................................................................................................................. 7

Resolución temporal ............................................................................................................... 10

Exploración entrelazada y progresiva ..................................................................................... 13

Submuestreo de color ............................................................................................................. 15

Compresión ............................................................................................................................. 18

El archivo informático de imagen

Un archivo o fichero informático, es un conjunto de bits almacenados en un dispositivo. El

archivo informático de una imagen contiene la codificación binaria (en bits) de la información

de brillo y el color que componen dicha imagen. El peso de una imagen digital, es decir el tamaño

del archivo informático de imagen, se mide en Bytes (B), kilobytes (KB), megabytes (MB) o

gigabytes (GB). Un Byte (B) es una unidad de medida informática que corresponde a 8 bits. Los

prefijos kilo, mega y giga corresponden respectivamente a miles, millones, y miles de millones.

La unidad mínima de la imagen digital es un píxel. Este término, ya castellanizado, proviene de

la contracción de picture element. Cuantos más píxeles compongan una imagen, mayor

posibilidad de representar los detalles. El número de píxeles que componen una imagen se

denomina ‘resolución espacial’ y es un indicador técnico de la calidad fotográfica.

La resolución espacial es uno de los factores que afectan al proceso de codificación digital ya

que el archivo informático de imagen tiene que registrar la información sobre brillo y color de

cada uno de los píxeles de esa imagen. Por lo tanto, cuanto mayor sea la resolución espacial de

la imagen, mayor será también el tamaño de archivo, es decir, el ‘peso’. Expresado con otros

términos, el número de bits necesarios para la codificación binaria de toda la imagen.

Pero la cantidad de píxeles que forman la imagen digital no es el único factor que determina el

peso del archivo y su calidad técnica. También se tiene que considerar la cantidad de bits que se

utilizan para describir el brillo y el color de cada uno de esos píxeles. Es lo que se denomina

‘cuantificación’ o en términos fotográficos, ‘profundidad de color’.

En las imágenes en movimiento hay que considerar también la frecuencia de fotogramas por

segundo. Es lo que se de denomina ‘resolución temporal’. Así en vídeo aparece como concepto

técnico fundamental el ‘flujo de transferencia’ (bitrate) que es la medida de bits por segundo

que el ordenador tiene leer para reproducir un vídeo a velocidad normal.

Otro factor determinante para el tamaño de una imagen o para el flujo de transferencia que

demanda, es el sistema de compresión que se utiliza en la codificación. Es decir, los algoritmos

que se han utilizado para optimizar su tamaño en el disco duro o el ancho de banda necesario

para su transmisión.

Estos conceptos técnicos afectan a la codificación digital de las imágenes y son válidos tanto

para el ámbito de la fotografía como para el vídeo o el cine digital. Quienes nos dedicamos a la

Vista previa

El archivo de vídeo digital

Francisco Utray, Profesor de Comunicación Audiovisual Grupo de investigación TECMERIN.

El archivo informático de imagen

2 .... Resolución espacial 3 Profundidad de color 7 Resolución temporal 10 Exploración entrelazada y progresiva 13 Submuestreo de color 15 Compresión 18 1uc3m |Universidad Carlos III de Madrid El archivo informático de imagen

Un archivo o fichero informático, es un conjunto de bits almacenados en un dispositivo. El archivo informático de una imagen contiene la codificación binaria (en bits) de la información de brillo y el color que componen dicha imagen. El peso de una imagen digital, es decir el tamaño del archivo informático de imagen, se mide en Bytes (B), kilobytes (KB), megabytes (MB) o gigabytes (GB). Un Byte (B) es una unidad de medida informática que corresponde a 8 bits. Los prefijos kilo, mega y giga corresponden respectivamente a miles, millones, y miles de millones.

La unidad mínima de la imagen digital es un pixel. Este término, ya castellanizado, proviene de la contracción de picture element. Cuantos más pixeles compongan una imagen, mayor posibilidad de representar los detalles. El número de píxeles que componen una imagen se denomina 'resolución espacial' y es un indicador técnico de la calidad fotográfica.

La resolución espacial es uno de los factores que afectan al proceso de codificación digital ya que el archivo informático de imagen tiene que registrar la información sobre brillo y color de cada uno de los píxeles de esa imagen. Por lo tanto, cuanto mayor sea la resolución espacial de la imagen, mayor será también el tamaño de archivo, es decir, el 'peso'. Expresado con otros términos, el número de bits necesarios para la codificación binaria de toda la imagen.

Pero la cantidad de píxeles que forman la imagen digital no es el único factor que determina el peso del archivo y su calidad técnica. También se tiene que considerar la cantidad de bits que se utilizan para describir el brillo y el color de cada uno de esos píxeles. Es lo que se denomina 'cuantificación' o en términos fotográficos, 'profundidad de color'.

En las imágenes en movimiento hay que considerar también la frecuencia de fotogramas por segundo. Es lo que se de denomina 'resolución temporal'. Así en vídeo aparece como concepto técnico fundamental el 'flujo de transferencia' (bitrate) que es la medida de bits por segundo que el ordenador tiene leer para reproducir un vídeo a velocidad normal.

Otro factor determinante para el tamaño de una imagen o para el flujo de transferencia que demanda, es el sistema de compresión que se utiliza en la codificación. Es decir, los algoritmos que se han utilizado para optimizar su tamaño en el disco duro o el ancho de banda necesario para su transmisión.

Estos conceptos técnicos afectan a la codificación digital de las imágenes y son válidos tanto para el ámbito de la fotografía como para el vídeo o el cine digital. Quienes nos dedicamos a la 2Uc3m Universidad Carlos III de Madrid edición y a la postproducción de vídeo necesitamos conocer bien estas cuestiones para asegurar la calidad técnica de nuestro flujo de trabajo.

Resolución espacial

La resolución espacial indica las dimensiones en píxeles de una imagen, es decir, el número de píxeles que constituyen su altura y anchura.

4 1920 pixels 3840 pixels 1080 pixels -> 2160 pixels -> HD 4K Resolución espacial 4K y HD. El 4K incrementa el número de píxeles que componen las imágenes. Fuente: Redwireinnovation.

En una cámara fotográfica digital, la resolución espacial indica la cantidad de información escaneada por el sensor y determina la capacidad de la imagen para reproducir el detalle y las texturas del objeto fotografiado. Este valor se puede expresar como el número total de píxeles que forman la imagen o mediante dos cifras: el número de píxeles en sentido horizontal y vertical. Así, cuanto nos referimos a una imagen de 1.920 píxeles horizontales por 1.080 verticales estamos ante una imagen de 2.073.600 píxeles de resolución espacial. Este dato también se expresa como 'una resolución de 2 megapíxeles', es decir, aproximadamente dos millones de píxeles. Pero en entornos profesionales de producción de vídeo se emplea generalmente la forma más precisa 1920x1080.

También es habitual referirse a la resolución espacial indicando únicamente el valor aproximado de píxeles en sentido horizontal. Los valores normalizados de resolución espacial para la exhibición de cine digital son 2K y 4K, indicando así que la imagen está compuesta por un valor aproximado de 2.000 o 4.000 columnas de píxeles.

Utilizando terminología informática, la resolución espacial indica el número de muestras (samples) que hay que codificar para generar un archivo digital. De ahí surge el término 3uc3m | Universidad Carlos III de Madrid 'frecuencia de muestreo' (sampling rate) que indica el número de muestras (píxeles) que se toman por segundo en un flujo de imágenes en movimiento. Este concepto también se indica como 'flujo de transferencia' (bitrate): la cantidad de bits por segundo necesaria para la reproducción del vídeo.

La resolución espacial de la imagen televisiva ha evolucionado en tres etapas históricas que significan un cambio sustancial de calidad: la resolución estándar (SD: Standard Definition), la alta definición (HD: High Definition) y la tecnología de la ultra alta resolución (UHD 4K: Ultra High Definition).

En la siguiente imagen puede verse una representación a escala de la evolución en resolución espacial de la televisión, desde la resolución estándar (SD), a la alta definición (HD) hasta la ultra alta definición (UHD 4K).

UHD 4K (3840×2160) HDTV (1920x1080) SD Evolución de la resolución espacial en televisión.

En la siguiente tabla se pueden ver los valores de resolución espacial y relación de aspecto de las normas de televisión digital.

Relación de aspecto y resolución espacial

Relación de aspecto	Resolución espacial
Resolución estándar (Standard Definition, SD)
4:3	720 x 576
Alta definición (High Definition, HD)
16:9	1280 × 720
	1920 x 1080
Ultra alta definición (Ultra High Definition, UHD, 4K)
16:9	3840×2160

La relación de aspecto expresa la proporción entre el alto y el ancho de la imagen. La televisión adoptó en sus inicios una relación de aspecto de 4:3 (1,33:1) siguiendo la tradición del formato 4uc3m | Universidad Carlos III de Madrid de la película de cine de 35 milímetros. Pero en los años 50, para la producción y exhibición cinematográfica, se empezó a utilizar la imagen de proporciones panorámicas consiguiendo así un elemento diferenciador y aumentando la espectacularidad. En los años 2000, aprovechando la migración digital, se implanto mundialmente en televisión la proporción de pantalla ancha 16:9 (1,77:1).

Otro aspecto importante vinculado a la resolución espacial es la proporción del pixel. Como norma general los píxeles son cuadrados (square pixel). Sin embargo, en algunos estándares de vídeo digital se utiliza un pixel rectangular (non square pixel). Es lo que se conoce como proporción el pixel (PAR: Pixel Aspect Ratio).

El origen histórico de este fenómeno se encuentra en los acuerdos para la interoperabilidad de las normas de vídeo norteamericanos y europeos en los inicios del proceso de digitalización de la televisión. El pixel rectangular también se usa para conseguir relaciones de aspecto de pantalla ancha (16:9) a partir de una resolución espacial de resolución estándar (4:3).

En la actualidad, todas las nuevas normas de vídeo utilizan el pixel cuadrado. Sin embargo, en producciones dirigidas a la televisión es aún muy frecuente trabajar con píxeles rectangulares. En los sistemas de edición y postproducción se puede configurar sin dificultad este parámetro en las preferencias del proyecto.

Cuando hay que mezclar en un mismo proyecto planos con pixel cuadrado y pixel rectangular una opción es transcodificar una parte del material para que todo el proyecto tenga el mismo formato.

5Uc3m Universidad Carlos III de Madrid

Recomendaciones sobre resolución espacial

El estándar de vídeo más utilizado en la actualidad es el de alta definición. La difusión, por televisión o por internet, sigue esta norma que se conoce como BT-709. La exhibición de cine en salas se hace mayoritariamente con un tamaño de fotograma muy similar que se denomina 2K. Por lo tanto, la recomendación es configurar la cámara y el sistema de edición en resolución HD-1920x1080.
En algunas ocasiones es una buena idea grabar en UHD-4K y montar en HD. En estos casos configuramos la cámara en UHD-3840x2160 y el sistema de edición en HD- 1920x1080. La calidad resultante es buena y nos ofrece la oportunidad de reencuadrar la imagen en postproducción sin perder calidad. Pero el equipo de edición tiene que ser muy potente para soportar este flujo de trabajo.
Para editar todo el proyecto en UHD-4K es necesario hacer copias del material en baja calidad (Optimized Media) y configurar el programa para bajar la calidad de visionado (Proxy Mode).
Las resoluciones inferiores a la alta definición, como por ejemplo [SD-720x576], no ofrecen suficiente calidad de imagen. Una opción intermedia como [HD-1280x720] es recomendable si trabajamos con equipos antiguos con poco rendimiento informático.
Conviene evitar las normas que utilizan pixel rectangular para conseguir una imagen de pantalla ancha a partir de un fotograma 4:3 (ej. HDV-1440x1080).

6Uc3m Universidad Carlos III de Madrid

Profundidad de color

Otro indicador fundamental de la calidad de una imagen digital es la profundidad de color (color depth o bit depth). Con este dato se expresa cuánta información de brillo y color se utiliza para describir cada pixel de una imagen.

Cada píxel puede ser codificado con un número variable de bits. El bit es la unidad mínima de la codificación binaria que solo puede tener dos estados: uno o cero; encendido o apagado. Por lo tanto, si solo disponemos de un bit para describir un pixel podremos usarlo para indicar si es blanco (1) o negro (0). Con dos bits se pueden generar cuatro combinaciones (00, 01, 11 y 10) que se pueden utilizar para designar el negro, el gris oscuro, el gris claro y el blanco. Si disponemos de más bits para describir el brillo de un pixel podremos utilizarlos para expresar toda una gama de niveles de gris.

En la siguiente tabla se puede observar el número de valores de brillo que se pueden expresar aumentando el número de bits de la codificación.

Número de variables para la codificación

1 bit	2
2 bits	4
3 bits	8
4 bits	16
5 bits	32
6 bits	64
7 bits	128
8 bits	256
9 bits	512
10 bits	1.024
11 bits	2.048
12 bits	4.096
13 bits	8.192
14 bits	16.384
15 bits	32.768
16 bits	65.536
17 bits	131.072
18 bits	262.144
19 bits	524.288
20 bits	1.048.576
21 bits	2.097.152
22 bits	4.194.304
23 bits	8.388.608
24 bits	16.777.216

Número de variables disponibles para la codificación en función de los bits utilizados. 7

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.

El archivo de video digital: codificación, calidad y compresión de imágenes

Generar con IA

Vista previa

El archivo de vídeo digital

El archivo informático de imagen

Resolución espacial

Relación de aspecto y resolución espacial

Recomendaciones sobre resolución espacial

Profundidad de color

Número de variables para la codificación

Contenidos relacionados