Reglas básicas de XML: XML bien formado y válido

XML bien formado frente a válido

Los documentos XML son, esencialmente, documentos de texto que contienen información y marcas. La información puede ser tanto textual como numérica, mientras que el marcado se refiere a las etiquetas utilizadas en el documento para añadir estructura y semántica. Los programas de procesamiento XML exigen que se sigan reglas básicas a la hora de distinguir entre los dos tipos de información. Si estás familiarizado con el lenguaje HTML podrás encontrar muchas similitudes con XML, pues el sistema de marcado que utiliza es muy parecido.

Todos los documentos XML están obligados a seguir una serie de reglas que desarrolló en su momento el World Wide Web Consortium (W3C), una comunidad de organizaciones dedicada al desarrollo de estándares web para lenguajes de la WWW (incluidos HTML, CSS y XML). Podemos encontrar las reglas para la correcta estructura de documentos XML descritas en las especificaciones XML (https://www.w3.org/XML/); estas reglas son las que esperan los programas de procesamiento XML. Cualquier divergencia entre las reglas y el documento procesado causa lo que se conoce como error de parsing o sintáctico.

W3Schools propone cinco reglas básicas para la sintaxis XML. El hecho de cumplirlas todas da lugar a lo que se conoce como documentos XML bien formados:

    1. Los documentos XML deben tener un elemento raíz.
    2. Los elementos XML deben tener una etiqueta de cierre.
    3. Las etiquetas XML distinguen entre mayúsculas y minúsculas.
    4. Los elementos XML deben estar correctamente anidados.
    5. Los valores de los atributos XML deben introducirse entre comillas.

    Un XML válido, por otra parte, es un documento que tiene alguna restricción adicional a estas cinco reglas generales. Además de estar bien formado, para ser válido debe seguir una serie de reglas definidas en una Definición de Tipo de Documento (Document Type Definition, DTD) o un Esquema ( Schema). El editor sintáctico (software que entiende la sintaxis XML) será el encargado de comprobar que tus documentos son conformes a las reglas definidas para los documentos bien formados. Además, si tu documento incluye referencias a una DTD o a un Schema, también comprobará que tu documento cumple con las restricciones adicionales, que pueden incluir nombres de elementos y atributos, dónde pueden aparecer y con qué frecuencia se pueden utilizar.