Torna alla pagina di Tecnologie Web
:: Tecnologie Web ::
DTD
Validazione
Il DTD (Document Type Definition) è una specifica della struttura di documenti XML.
Descrive:
- quali elementi possono apparire all'interno del documento.
- la struttura degli elementi, cioè i contenuti di tali elementi, l'ordine, la quantità, se sono obbligatori od opzionali.
- gli attributi degli elementi XML, il loro tipo e i vincoli sul loro valore.
- le entità.
Ovviamente applicazioni XML differenti possono utilizzare DTD differenti.
La validazione è il procedimento di controllo della validità del documento tramite DTD. Quindi se il documento ha una DTD e la soddisfa, allora viene considerato valido. I parser che effettuano la validazione dei documenti ne confrontano il contenuto con il DTD relativo ed elencano i punti del documento che non rispettano i vincoli specificati nei DTD.
Bisogna ricordare che la validazione opera sul principio che tutto ciò che non è esplicitamente permesso, è considerato vietato.
Il DTD può essere:
- salvato in un file separato (solitamente con estensione .dtd) dal documento di cui descrive le regole. In questo modo più documenti XML potranno essere legati allo stesso DTD.
- incorporato all'interno di un documento XML.
- pubblico. Avviene nel caso di DTD molto utilizzati (ad es. il DTD per XHTML).
In tutti i casi il documento XML per il quale è richiesta la validazione deve includere un riferimento al DTD con il quale deve essere messo a confronto. Questo riferimento deve essere fornito nella dichiarazione del tipo di documento. Questa dichiarazione è compresa nel prologo del documento XML, cioè dopo la dichiarazione XML e prima dell'elemento radice.
Esempio:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE person SYSTEM "http://indirizzo.org/xml/dtds/person.dtd">
<person>
<name>
<first_name>Edgar Allan</first_name>
<last_name>Poe</last_name>
</name>
</person>
Dichiarazione di elementi
Per definire gli elementi leciti all'interno del documento si utilizza la seguente sintassi:
<! ELEMENT nomeElemento (modelloDiContenuto)>
Il modello di contenuto può essere di vari tipi:
- se l'elemento ne contiene altri annidati (elementi figli o sequenze):
<! ELEMENT nomeElemento (nomeElementoAnnidato1, nomeElementoAnnidato2, ...)>
- se l'elemento ha contenuto testuale:
<! ELEMENT nomeElemento (#PCDATA)>
- se l'elemento ha contenuto misto si utilizza il simbolo | come separatore:
<! ELEMENT nomeElemento (#PCDATA | nomeElementoAnnidato)>
- se l'elemento non è sicuramente vuoto, ma non se ne conosce il modello di contenuto:
<! ELEMENT nomeElemento ANY>
- se l'elemento è vuoto:
<! ELEMENT nomeElemento EMPTY>
Ogni elemento può avere diversi indicatori di occorrenza per i suoi sotto-elementi, quindi diversa cardinalità:
- se ho una sola occorrenza, non ho indicatori
<! ELEMENT nomeElemento (nomeElementoAnnidato)>
- se l'occorrenza è facoltativa (0 o 1 volta), si indica col simbolo ?
<! ELEMENT nomeElemento (nomeElementoAnnidato?)>
- se l'occorrenza è obbligatoria e ripetibile (1 o più volte), si indica col simbolo +
<! ELEMENT nomeElemento (nomeElementoAnnidato+)>
- se l'occorrenza è facoltativa e ripetibile (0 o più volte), si indica col simbolo *
<! ELEMENT nomeElemento (nomeElementoAnnidato*)>
Dichiarazione di attributi
Gli attributi forniscono informazioni aggiuntive sugli elementi, e per definire quelli leciti all'interno del documento si utilizza la seguente sintassi:
<!ATTLIST nomeElemento
nomeAttributo1 (tipo) valoriPredefiniti
nomeAttributo2 (tipo) valoriPredefiniti
... ... ...>
I tipi sono nove:
Per quanto riguarda i valori predefiniti degli attributi, su essi possono essere imposti alcuni vincoli:
- se l'attributo è obbligatorio, si indica col simbolo #REQUIRED
- se l'attributo è facoltativo, si indica col simbolo #IMPLIED
- se all'attributo deve essere associato un valore costante, si indica col simbolo #FIXED "valore"
- per dare un valore di default all'attributo, basta metterlo tra virgolette. Es: "valore1"
Esempio
Documento XML di partenza:
<elenco>
<prodotto codice="123">
<descrizione> libro </descrizione>
<prezzo> 50 </prezzo>
</prodotto>
<prodotto codice="456">
<descrizione> penna stilo </descrizione>
</prodotto>
</elenco>
DTD risultante:
(1) <!ELEMENT ELENCO (PRODOTTO+)>
(2) <!ELEMENT PRODOTTO (DESCRIZIONE, PREZZO?)>
(3) <!ATTLIST PRODOTTO codice ID #REQUIRED>
(4) <!ELEMENT DESCRIZIONE (#PCDATA)>
(5) <!ELEMENT PREZZO (#PCDATA)>
Commenti punto per punto:
- (1) l'elemento ELENCO contiene altri elementi di tipo PRODOTTO. In particolare ne deve avere obbligatoriamente almeno 1
- (2) l'elemento PRODOTTO contiene altri due elementi: DESCRIZIONE (che può avere un'unica occorrenza) e PREZZO, la cui presenza è facoltativa
- (3) l'elemento PRODOTTO deve avere come attributo il suo codice identificativo
- (4) e (5) gli elementi DESCRIZIONE e PREZZO sono stringhe di testo
Dichiarazioni di entità generali
Nei concetti generali abbiamo già visto che XML prevede cinque referenze ad entità predefinite, ma il DTD permette di definirne altre.
Un'entità è un modo per definire singoli blocchi di informazioni. Faccio riferimento ad entità esterne o interne per includerle in documenti.
Le entità vengono definite tramite la seguente sintassi:
<!ENTITY nomeEntità "testoDaSostituireAllEntità">
Una volta che l'entità viene definita è possibile utilizzarla in qualsiasi punto del documento tramite &nomeEntità;.
Esempio:
<!ENTITY super "supercalifragilistichespiralidoso">
NOTA: le entità possono contenere anche markup, quindi ad esempio un piè di pagina o un'intestazione standard di pagine web che si ripete più volte nelle pagine.
Limiti DTD
Il Document Type Definition è molto semplice da scrivere e questo ha un prezzo:
- gli unici tipi di dati ammessi sono quelli testuali (niente numeri interi o reali, booleani, ecc)
- possono esprimere un numero di vincoli sugli attributi molto limitato
- non sono estendibili
- non gestiscono namespace
Esempio Finale
Abbiamo il seguente documento XML:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE racconti SYSTEM "racconti.dtd">
<racconti>
<!-- Questo commento lo inserisco
perché mi serve provare il rilevamento dei commenti di XPath :P -->
<racconto autore="Howard Phillips Lovecraft">
<titoloItaliano>L'estraneo</titoloItaliano>
<titoloOriginale>The Outsider</titoloOriginale>
<notaIntroduttiva>
The Outsider è considerato uno degli esempi più palesi
dell'influsso che lo stile e le tematiche di Edgar Allan
Poe hanno esercitato su Lovecraft.
La storia ha una sottintesa nota autobiografica. Nel
protagonista, che cresce solo in una grande casa,
nutrendo la sua cultura di vecchi libri, è facile
riconoscere l'infanzia solitaria dello stesso Lovecraft.
L'invocazione finale all'oblio di fronte agli orrori
dell'esistenza da "estraneo" proiettato nel mondo comune
si ripeterà continuamente nella sua opera, soprattutto
quella poetica, nella quale si riflettono più chiaramente
le angosce dell'anima.
</notaIntroduttiva>
<frammento>
Infelice chi dell'infanzia ha soltanto memorie di paura
e tristezza. Sventurato chi, volgendosi indietro, non vede
che ore solitarie trascorse in sale vaste e malinconiche
tappezzate di lugubri tendaggi e file esasperanti di libri
antichi, o in desolate veglie in boschi crepuscolari fitti
di immensi alberi grotteschi coperti da erbe, che agitano
silenziosi in alto i rami contorti...
</frammento>
</racconto>
<racconto autore="Edgar Allan Poe">
<titoloItaliano>La mascherata della Morte Rossa</titoloItaliano>
<titoloOriginale>The Mask of the Red Death</titoloOriginale>
<frammento>
La settima stanza era pesantemente avvolta in panneggi
di velluto nero che pendevano ovunque dal soffitto e
dalle pareti, ricadendo in pesanti pieghe su un tappeto
della stessa stoffa e colore. In quest'unica stanza pero'
la tinta delle finestre non corrispondeva alle decorazioni.
Le vetrate erano di colore scarlatto, di un cupo color
sangue. Ora in nessuna di quele sette stanze vi era una
sola lampada o candelabro, pur tra la profusione di ornamenti
dorati sparsi qua e la' o pendenti dai soffitti.
</frammento>
</racconto>
<racconto autore="Howard Phillips Lovecraft">
<titoloItaliano>La musica di Erich Zann</titoloItaliano>
<titoloOriginale>The Music of Erich Zann</titoloOriginale>
<notaIntroduttiva>
Quando il saggista francese Jacques Bergier chiese a Lovecraft
se avesse mai visitato Parigi, per averne descritto così bene
l'atmosfera di certi quartieri, Lovecraft gli rispose:"certo
che l'ho visitata. Con Poe, in sogno".
Malgrado l'apparenza onirica non è tratta da un unico sogno;
tuttavia ho sognato spesso di strade tortuose come la
Rue d'Auseil.
</notaIntroduttiva>
<frammento>
Riuscii invece a sentire la musica del vecchio muto: prima
salendo in punta di piedi fino al quinto piano, poi trovando
il coraggio necessario per inerpicarmi su per l'ultima rampa
scricchiolante che conduceva alla mansarda di Zann. E lì,
nell'angusto pianerottolo davanti alla porta sprangata e col
buco della serratura tappato, più volte udii suoni che mi
colmarono di un terrore indefinibile, un terrore di occulti
prodigi e celati misteri.
</frammento>
</racconto>
</racconti>
Il DTD relativo sarà:
<!ELEMENT racconti (racconto+)>
<!ELEMENT racconto (titoloItaliano, titoloOriginale, notaIntroduttiva*, frammento)>
<!ATTLIST racconto autore CDATA #REQUIRED>
<!ELEMENT titoloItaliano (#PCDATA)>
<!ELEMENT titoloOriginale (#PCDATA)>
<!ELEMENT notaIntroduttiva (#PCDATA)>
<!ELEMENT frammento (#PCDATA)>
Torna alla pagina di Tecnologie Web