Une vidéo est une succession d'images à une certaine cadence. L'oeil humain a
comme caractéristique d'être capable de distinguer environ 20 images par seconde.
Ainsi, en affichant plus de 20 images par seconde, il est possible de tromper l'oeil et de lui faire croire
à une image animée. On caractèrise la fluidité d'une vidéo par le
nombre d'images par secondes (en anglais frame rate), exprimé en FPS (Frames per second,
en français trames par seconde).
D'autre part la vidéo au sens multimédia du terme est généralement accompagnée
de son, c'est-à-dire de données audio.
La vidéo numérique, consistant à coder la vidéo
en une succession d'images numériques.
Le format PAL/SECAM (Phase Alternating Line/Séquentiel Couleur avec Mémoire), utilisé en Europe pour la télévision hertzienne,
permet de coder les vidéos sur 625 lignes (576 seulement sont affichées car 8% des lignes servent à la synchronisation).
à raison de 25 images par seconde à un format 4:3 (c'est-à-dire que le rapport largeur sur hauteur vaut 4/3).
Or à 25 images par seconde, de nombreuses personnes perçoivent un battement dans l'image. Ainsi,
étant donné qu'il n'était pas possible d'envoyer plus d'informations en raison de la limitation de bande passante, il a été
décidé d'entrelacer les images, c'est-à-dire d'envoyer en premier lieu les lignes paires, puis les lignes impaires.
Le terme "champ" désigne ainsi la "demi-image" formée soit par les lignes paires, soit par les
lignes impaires. L'ensemble constitué par deux champs est appelé trame entrelacé. Lorsqu'il n'y a pas d'entrelacement
le terme de trame progressive est utilisé.
Grâce à ce procédé appelé "entrelacement", le téléviseur PAL/SECAM
affiche 50 champs par seconde (à une fréquence de 50 Hz), soit 2x25 images en deux secondes.
La norme NTSC (National Television Standards Committee), utilisée aux Etats-Unis et au Japon, utilise
un système de 525 lignes entrelacées à 30 images/sec (donc à
une fréquence de 60Hz). Comme dans le cas du PAL/SECAM, 8% des lignes servent
à synchroniser le récepteur. Ainsi, étant donné que le NTSC
affiche un format d'image 4:3, la résolution réellement affichée est
de 640x480.
La vidéo numérique consiste à afficher une succession d'images numériques.
Puisqu'il s'agit d'images numériques affichées à une certaine cadence, il est possible
de connaître le débit nécessaire pour l'affichage d'une vidéo, c'est-à-dire le nombre d'octets
affichés (ou transférés) par unité de temps.
Ainsi le débit nécessaire pour afficher une vidéo (en octets par seconde) est
égal à la taille d'une image que multiplie
le nombre d'images par seconde.
Soit une image true color (24 bits) ayant une définition
de 640 pixels par 480. Pour afficher correctement une vidéo possédant cette définition
il est nécessaire d'afficher au moins 30 images par seconde, c'est-à-dire un débit égal à :
900 Ko * 30 = 27 Mo/s
Etant donné que l'oeil est peu sensible aux variations de chrominance, la technique
dite de sous-échantillonnage en chrominance (en anglais chroma subsampling),
appelée également décimation, consiste à supprimer des
informations de chrominance dans un groupe de 4x4 pixels.