Usa un validatore che verifica sintassi e opzionalmente lo schema XSD.

Web Services Description Language, descrive interfacce di web service SOAP.

Formattare XML: Guida e Best Practices

Perché Formattare XML

XML (eXtensible Markup Language) rimane fondamentale per configurazioni, scambio dati enterprise, SOAP APIs, e formati legacy. Un XML ben formattato è più leggibile, debuggabile e manutenibile. Questa guida copre le best practices per formattazione, validazione e manipolazione XML, con esempi pratici per sviluppatori moderni.

Struttura XML Base

Anatomia di un Documento

<?xml version="1.0" encoding="UTF-8"?>
<!-- Dichiarazione XML - sempre in testa -->

<!-- Commenti così -->

<root xmlns="http://example.com/ns"
      xmlns:custom="http://example.com/custom">

  <!-- Elemento con attributi -->
  <element id="1" type="example">
    Contenuto testuale
  </element>

  <!-- Elemento vuoto -->
  <empty-element />

  <!-- Namespace prefissato -->
  <custom:item>Valore</custom:item>

  <!-- CDATA per contenuto speciale -->
  <code><![CDATA[
    if (a < b && c > d) {
      console.log("<special>");
    }
  ]]></code>

</root>

Caratteri Speciali

Carattere	Entity	Descrizione
<	<	Less than
>	>	Greater than
&	&	Ampersand
'	'	Apostrophe
"	"	Quotation

Formattazione

Prima (non formattato)

<users><user id="1"><name>Mario</name><email>mario@example.com</email></user><user id="2"><name>Luigi</name><email>luigi@example.com</email></user></users>

Dopo (formattato)

<?xml version="1.0" encoding="UTF-8"?>
<users>
  <user id="1">
    <name>Mario</name>
    <email>mario@example.com</email>
  </user>
  <user id="2">
    <name>Luigi</name>
    <email>luigi@example.com</email>
  </user>
</users>

CLI Tools

# xmllint (libxml2)
xmllint --format input.xml > formatted.xml
xmllint --format --encode UTF-8 input.xml

# Con validazione
xmllint --schema schema.xsd --format input.xml

# xmlstarlet
xmlstarlet fo input.xml > formatted.xml

# Indentazione custom (2 spazi)
xmlstarlet fo -s 2 input.xml

# Python one-liner
python -c "import xml.dom.minidom; print(xml.dom.minidom.parse('input.xml').toprettyxml())"

# Node.js con xml-formatter
npx xml-formatter input.xml

Validazione

Well-Formed vs Valid

# Well-formed: sintassi XML corretta
# - Tag aperti e chiusi correttamente
# - Attributi con virgolette
# - Un solo elemento root
# - Case-sensitive

# Valid: conforme a uno schema (XSD, DTD)
# - Struttura definita
# - Tipi di dati corretti
# - Elementi richiesti presenti

XSD (XML Schema Definition)

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">

  <xs:element name="users">
    <xs:complexType>
      <xs:sequence>
        <xs:element name="user" maxOccurs="unbounded">
          <xs:complexType>
            <xs:sequence>
              <xs:element name="name" type="xs:string"/>
              <xs:element name="email" type="xs:string"/>
              <xs:element name="age" type="xs:integer" minOccurs="0"/>
            </xs:sequence>
            <xs:attribute name="id" type="xs:integer" use="required"/>
          </xs:complexType>
        </xs:element>
      </xs:sequence>
    </xs:complexType>
  </xs:element>

</xs:schema>

Validazione con CLI

# xmllint con XSD
xmllint --schema users.xsd --noout users.xml
# users.xml validates

# Con DTD
xmllint --dtdvalid users.dtd --noout users.xml

# Python
python -c "
from lxml import etree
schema = etree.XMLSchema(etree.parse('users.xsd'))
doc = etree.parse('users.xml')
print('Valid' if schema.validate(doc) else schema.error_log)
"

Parsing XML

JavaScript (Browser e Node.js)

// Browser - DOMParser
const parser = new DOMParser();
const xml = parser.parseFromString(xmlString, 'text/xml');

// Check errori
const parseError = xml.querySelector('parsererror');
if (parseError) {
  console.error('Parse error:', parseError.textContent);
}

// Query elementi
const users = xml.querySelectorAll('user');
users.forEach(user => {
  const id = user.getAttribute('id');
  const name = user.querySelector('name').textContent;
  console.log(id, name);
});

// Node.js - xml2js
const xml2js = require('xml2js');
const parser = new xml2js.Parser({ explicitArray: false });

parser.parseString(xmlString, (err, result) => {
  console.log(result.users.user);
});

// Fast-xml-parser (più veloce)
const { XMLParser, XMLBuilder } = require('fast-xml-parser');
const parser = new XMLParser({ ignoreAttributes: false });
const result = parser.parse(xmlString);

Python

import xml.etree.ElementTree as ET
from lxml import etree

# ElementTree (standard library)
tree = ET.parse('users.xml')
root = tree.getroot()

for user in root.findall('user'):
    user_id = user.get('id')
    name = user.find('name').text
    print(f"{user_id}: {name}")

# lxml (più potente)
tree = etree.parse('users.xml')
root = tree.getroot()

# XPath
names = root.xpath('//user/name/text()')
print(names)  # ['Mario', 'Luigi']

# Con namespace
ns = {'ns': 'http://example.com/ns'}
items = root.xpath('//ns:item', namespaces=ns)

XPath

Sintassi Base

# Selezione elementi
/root/child         # Path assoluto
//element           # Qualsiasi livello
.                   # Nodo corrente
..                  # Nodo parent

# Attributi
//@id               # Tutti gli attributi id
//user[@id]         # User con attributo id
//user[@id='1']     # User con id='1'

# Predicati
//user[1]           # Primo user
//user[last()]      # Ultimo user
//user[position()<3] # Primi 2 user
//user[name='Mario'] # User con name Mario

# Funzioni
//name[contains(text(),'Mar')]
//user[starts-with(@id,'user_')]
//item[string-length(name) > 5]
count(//user)       # Conta elementi

Esempi Pratici

<catalog>
  <book id="1" category="fiction">
    <title>Il nome della rosa</title>
    <author>Umberto Eco</author>
    <price currency="EUR">15.99</price>
  </book>
  <book id="2" category="tech">
    <title>Clean Code</title>
    <author>Robert Martin</author>
    <price currency="USD">35.00</price>
  </book>
</catalog>

# XPath queries
//book[@category='fiction']       # Libri fiction
//book[price > 20]                # Prezzo > 20
//book/title/text()               # Tutti i titoli
//book[@id='1']/author            # Autore del libro 1
//price[@currency='EUR']/../title # Titoli con prezzo in EUR

XSLT Trasformazioni

<!-- Trasforma XML in HTML -->
<xsl:stylesheet version="1.0"
    xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

  <xsl:template match="/users">
    <html>
      <body>
        <h1>Lista Utenti</h1>
        <ul>
          <xsl:for-each select="user">
            <li>
              <xsl:value-of select="name"/>
              (<xsl:value-of select="email"/>)
            </li>
          </xsl:for-each>
        </ul>
      </body>
    </html>
  </xsl:template>

</xsl:stylesheet>

# Applica trasformazione
xsltproc transform.xsl input.xml > output.html

XML vs JSON

Aspetto	XML	JSON
Verbosità	Alta	Bassa
Leggibilità	Media	Alta
Schema	XSD, DTD	JSON Schema
Namespace	Sì	No
Attributi	Sì	No (solo key-value)
Commenti	Sì	No
Mixed content	Sì	No
Uso moderno	Config, SOAP, legacy	API REST, web

Best Practices

Sempre UTF-8: Specifica encoding nella dichiarazione
Usa namespace: Evita conflitti in documenti complessi
Valida con XSD: Documenta e verifica la struttura
Evita mixed content: Testo e elementi insieme complica parsing
Preferisci elementi: Attributi per metadati, elementi per dati
Indentazione consistente: 2 o 4 spazi, mai tab

Strumenti Online

Per lavorare con XML:

XML Formatter - Formatta e valida XML
JSON Formatter - Confronta con JSON
Diff Checker - Confronta versioni XML

Conclusione

XML rimane importante per:

Configurazioni: Maven, Spring, Android
Enterprise: SOAP, WSDL, legacy systems
Documenti: DOCX, ODT, SVG sono XML
Data exchange: Settori con standard XML

Per nuovi progetti, preferisci JSON. Per sistemi esistenti, padroneggia XML con gli strumenti giusti.

Debugging XML

Quando debugghi XML, gli errori più comuni sono tag non chiusi, mismatch di case sensitivity, e caratteri non escapati. Usa sempre un validatore prima di processare XML. Gli strumenti CLI come xmllint forniscono messaggi di errore dettagliati con numero di riga e posizione. Per XML complessi con namespace, verifica che i prefissi siano dichiarati correttamente nell'elemento root. La validazione contro XSD cattura errori semantici che un parser base non rileva. Ricorda che XML è case-sensitive quindi User e user sono elementi diversi. Usa un editor con syntax highlighting per individuare rapidamente errori di struttura.

Performance XML

Per file XML grandi, usa parser SAX invece di DOM. DOM carica tutto in memoria, SAX processa stream. Per trasformazioni XSLT complesse, considera di precompilare gli stylesheet. La cache dei risultati di parsing riduce l'overhead su file letti frequentemente. Per serializzazione, evita pretty-print in produzione per ridurre dimensioni e tempo di parsing.

Per altri strumenti utili, esplora i nostri tool online gratuiti. Per approfondimenti, consulta W3C XML.

Formattare XML: Guida Completa e Best Practices