Skip to content

Como converter um arquivo XML para ser bem formado

9 de maio de 2021

Este artigo explica como escrever XML bem formado, mostrando um exemplo. O boletim informativo do Web Writer é escrito usando uma forma de XML; nós o chamamos de AML ou About Markup Language. Embora este seja um documento de trabalho, não é um documento XML bem formado ou válido.

Bem formado

Existem algumas regras específicas para criar um documento XML bem formado:

  • A declaração XML deve vir primeiro em todos os documentos.
  • Os comentários não são válidos dentro de uma tag. Os comentários não podem conter dois hifens consecutivos, exceto o início e o final do comentário.
  • As tags devem ter uma tag final ou ser fechadas dentro da própria tag singleton, por exemplo.
  • Todos os atributos das tags devem estar entre aspas, de preferência aspas duplas, a menos que o próprio atributo contenha aspas duplas.
  • Cada documento XML deve conter um elemento que contém completamente todos os outros elementos.

Existem apenas dois problemas com o documento que o tornam mal formado:

  • A primeira coisa que o documento AML precisa é uma declaração de declaração XML.
  • O outro problema é que nenhum elemento engloba completamente todos os outros elementos. Para corrigir isso, adicionaremos um elemento de contêiner externo:

Fazer essas duas alterações simples (e garantir que todos os elementos contenham apenas CDATA) transformará o documento malformado em um documento bem formado. Um documento XML válido é validado em relação a uma definição de tipo de documento (DTD) ou esquema XML. São um conjunto de regras criadas pelo desenvolvedor ou por uma organização de padrões que definem a semântica do documento XML. Eles informam ao computador o que fazer com a marcação. No caso da About Markup Language, por não ser uma linguagem XML padrão, como XHTML ou SMIL, o DTD seria criado pelo desenvolvedor. Esse DTD provavelmente estaria no mesmo servidor que o documento XML e referenciado na parte superior do documento. Antes de começar a desenvolver um DTD ou esquema para seus documentos, você deve perceber que, simplesmente por ser bem formado, um documento XML é autodescritivo e, portanto, não precisa de um DTD. Por exemplo, com nosso documento AML bem formado, existem as seguintes tags:

    Se você está familiarizado com o boletim informativo do Web Writer, pode reconhecer as diferentes seções do boletim. Isso torna muito fácil criar novos documentos XML usando o mesmo formato padrão. Sempre colocaríamos o título completo na tag e o URL da primeira seção na tag.

    DTDs

    Se você for obrigado a escrever um documento XML válido, seja para usar os dados ou para processá-lo, você deve incluí-lo em seu documento com a tag. Nesta tag, você define a tag XML de base no documento e a localização do DTD (geralmente um URI da Web). Por exemplo: Uma coisa boa sobre as declarações de DTD é que você pode declarar que um DTD é local para o sistema onde o documento XML está com o “SISTEMA”. Você também pode apontar para um DTD público, como com um documento HTML 4.0: Ao usar ambos, você está informando ao documento para usar um DTD específico (o identificador público) e onde encontrá-lo (o identificador do sistema). Finalmente, você pode incluir um DTD interno diretamente no documento, dentro da tag DOCTYPE. Por exemplo (este não é um DTD completo para o documento AML):

    Esquema XML

    Para criar um documento XML válido, você também pode usar um documento de esquema XML para definir seu XML. Esquema XML é um documento XML que descreve documentos XML. Aprenda a escrever um esquema.

    Observação

    Apenas apontar para um DTD ou Esquema XML não é suficiente. O XML que está no documento deve seguir as regras do DTD ou Schema. Usar um analisador de validação é uma maneira simples de verificar se seu XML está seguindo as regras de DTD. Você pode encontrar muitos desses analisadores online.