XML (entendez eXtensible Markup Language et traduisez Langage à balises étendu, ou Langage à balises extensible)
est en quelque sorte un langage HTML amélioré permettant
de définir de nouvelles balises. Il s'agit effectivement d'un langage permettant de mettre en forme
des documents grâce à des balises (markup).
Contrairement à HTML, qui est à considérer comme un langage défini et figé (avec
un nombre de balises limité), XML peut être considéré comme un métalangage permettant de définir d'autres langages,
c'est-à-dire définir de nouvelles balises permettant de décrire la présentation d'un texte
(Qui n'a jamais désiré une balise qui n'existait pas ?).
La force de XML réside dans sa capacité à pouvoir décrire n'importe quel domaine de données grâce à son extensibilité.
Il va permettre de structurer, poser le vocabulaire et la syntaxe des données qu'il va contenir.
En réalité les balises XML décrivent le contenu plutôt que la présentation (contrairement À HTML).
Ainsi, XML permet de séparer le contenu de la présentation .. ce qui permet par exemple d'afficher un même
document sur des applications ou des périphériques différents sans pour autant nécessiter de créer
autant de versions du document que l'on nécessite de représentations !
XML a été mis au point par le XML Working Group sous l'égide du World Wide Web Consortium (W3C) dès 1996.
Depuis le 10 février 1998, les spécifications XML 1.0 ont été reconnues comme recommandations par le W3C, ce qui en fait un langage reconnu.
(Tous les documents liés à la norme XML sont consultables et téléchargeables sur le site web du W3C, http://www.w3c.org/XML/)
XML est un sous ensemble de SGML (Standard Generalized Markup Language), défini par le standard ISO8879 en 1986, utilisé dans le milieu de la Gestion Electronique Documentaire (GED).
XML reprend la majeure partie des fonctionnalités de SGML, il s'agit donc d'une simplification de SGML afin de le rendre utilisable sur le web !
XML est un format de description des données et non de leur représentation,
comme c'est le cas avec HTML. La mise en page des données est assurée par
un langage de mise en page tiers. A l'heure actuelle (fin de l'année 2000) il existe
trois solutions pour mettre en forme un document XML :
- CSS (Cascading StyleSheet), la solution la plus utilisée actuellement, étant donné qu'il
s'agit d'un standard qui a déjà fait ses preuves avec HTML
- XSL (eXtensible StyleSheet Language), un langage de feuilles de style extensible
développé spécialement pour XML. Toutefois, ce nouveau langage n'est pas reconnu
pour l'instant comme un standard officiel
- XSLT (eXtensible StyleSheet Language Transformation). Il s'agit d'une recommandation W3C du 16 novembre 1999, permettant
de transformer un document XML en document HTML accompagné de feuilles de style
XML fournit un moyen de vérifier la syntaxe d'un document grâce aux DTD
(Document Type Definition). Il s'agit d'un fichier décrivant la structure
des documents y faisant référence grâce à un langage adapté.
Ainsi un document XML doit suivre scrupuleusement les conventions de notation XML et peut éventuellement
faire référence à une DTD décrivant l'imbrication des éléments
possibles. Un document suivant les règles de XML est appelé document bien formé.
Un document XML possédant une DTD et étant conforme à celle-ci est appelé
document valide.
XML permet donc de définir un format d'échange selon les besoins de
l'utilisateur et offre des mécanismes pour vérifier la validité
du document produit. Il est donc essentiel pour le receveur d'un document XML de
pouvoir extraire les données du document. Cette opération est possible
à l'aide d'un outil appelé analyseur (en anglais parser,
parfois francisé en parseur).
Le parseur permet d'une part d'extraire les données d'un document XML (on
parle d'analyse du document ou de parsing) ainsi que de vérifier
éventuellement la validité du document.
Voici les principaux atouts de XML:
- La lisibilité : aucune connaissance ne doit théoriquement être nécessaire pour comprendre un contenu d'un document XML
- Autodescriptif et extensible
- Une structure arborescente : permettant de modéliser la majorité des problèmes informatiques
- Universalité et portabilité : les différents jeux de caractères sont pris en compte
- Déployable : il peut être facilement distribué par n'importe quels protocoles à même de transporter du texte, comme HTTP
- Intégrabilité : un document XML est utilisable par toute application pourvue d'un parser (c'est-à-dire un logiciel permettant d'analyser un code XML)
- Extensibilité : un document XML doit pouvoir être utilisable dans tous les domaines d'applications
Ainsi, XML est particulièrement adapté à l'échange de données et de documents.
L'intérêt de disposer d'un format commun d'échange d'information dépend du contexte professionnel dans lequel les utilisateurs interviennent.
C'est pourquoi, de nombreux formats de données issus de XML apparaissent (il en existe plus d'une centaine) :
- OFX : Open Financial eXchange pour les échanges d'informations dans le monde financier
- MathML : Mathematical Markup Language permet de représenter des formules mathématique
- CML : Chemical Markup Language permet de décrire des composés chimiques
- SMIL : Synchronized Multimedia Integration Language permet de créer des présentations multimédia en synchronisant diverses sources : audio, vidéo, texte,...
|