cerca
Tecnologie Web - DTD
modifica cronologia stampa login logout

Wiki

UniCrema


Materie per semestre

Materie per anno

Materie per laurea


Help

Tecnologie Web - DTD

Torna alla pagina di Tecnologie Web


:: Tecnologie Web ::

DTD

Validazione

Il DTD (Document Type Definition) è una specifica della struttura di documenti XML.
Descrive:

  • quali elementi possono apparire all'interno del documento.
  • la struttura degli elementi, cioè i contenuti di tali elementi, l'ordine, la quantità, se sono obbligatori od opzionali.
  • gli attributi degli elementi XML, il loro tipo e i vincoli sul loro valore.
  • le entità.

Ovviamente applicazioni XML differenti possono utilizzare DTD differenti.

La validazione è il procedimento di controllo della validità del documento tramite DTD. Quindi se il documento ha una DTD e la soddisfa, allora viene considerato valido. I parser che effettuano la validazione dei documenti ne confrontano il contenuto con il DTD relativo ed elencano i punti del documento che non rispettano i vincoli specificati nei DTD.
Bisogna ricordare che la validazione opera sul principio che tutto ciò che non è esplicitamente permesso, è considerato vietato.

Il DTD può essere:

  • salvato in un file separato (solitamente con estensione .dtd) dal documento di cui descrive le regole. In questo modo più documenti XML potranno essere legati allo stesso DTD.
  • incorporato all'interno di un documento XML.
  • pubblico. Avviene nel caso di DTD molto utilizzati (ad es. il DTD per XHTML).

In tutti i casi il documento XML per il quale è richiesta la validazione deve includere un riferimento al DTD con il quale deve essere messo a confronto. Questo riferimento deve essere fornito nella dichiarazione del tipo di documento. Questa dichiarazione è compresa nel prologo del documento XML, cioè dopo la dichiarazione XML e prima dell'elemento radice.

Esempio:

<?xml version="1.0" standalone="no"?>
<!DOCTYPE person SYSTEM "http://indirizzo.org/xml/dtds/person.dtd">
<person>
  <name>
    <first_name>Edgar Allan</first_name>
    <last_name>Poe</last_name>
  </name>
</person>

Dichiarazione di elementi

Per definire gli elementi leciti all'interno del documento si utilizza la seguente sintassi:

<! ELEMENT nomeElemento (modelloDiContenuto)>

Il modello di contenuto può essere di vari tipi:

  • se l'elemento ne contiene altri annidati (elementi figli o sequenze):
    <! ELEMENT nomeElemento (nomeElementoAnnidato1, nomeElementoAnnidato2, ...)>
  • se l'elemento ha contenuto testuale:
    <! ELEMENT nomeElemento (#PCDATA)>
  • se l'elemento ha contenuto misto si utilizza il simbolo | come separatore:
    <! ELEMENT nomeElemento (#PCDATA | nomeElementoAnnidato)>
  • se l'elemento non è sicuramente vuoto, ma non se ne conosce il modello di contenuto:
    <! ELEMENT nomeElemento ANY>
  • se l'elemento è vuoto:
    <! ELEMENT nomeElemento EMPTY>

Ogni elemento può avere diversi indicatori di occorrenza per i suoi sotto-elementi, quindi diversa cardinalità:

  • se ho una sola occorrenza, non ho indicatori
    <! ELEMENT nomeElemento (nomeElementoAnnidato)>
  • se l'occorrenza è facoltativa (0 o 1 volta), si indica col simbolo ?
    <! ELEMENT nomeElemento (nomeElementoAnnidato?)>
  • se l'occorrenza è obbligatoria e ripetibile (1 o più volte), si indica col simbolo +
    <! ELEMENT nomeElemento (nomeElementoAnnidato+)>
  • se l'occorrenza è facoltativa e ripetibile (0 o più volte), si indica col simbolo *
    <! ELEMENT nomeElemento (nomeElementoAnnidato*)>

Dichiarazione di attributi

Gli attributi forniscono informazioni aggiuntive sugli elementi, e per definire quelli leciti all'interno del documento si utilizza la seguente sintassi:

          <!ATTLIST nomeElemento
          nomeAttributo1 (tipo) valoriPredefiniti
          nomeAttributo2 (tipo) valoriPredefiniti
          ...             ...   ...>

I tipi sono nove:

  • CDATA, un attributo di tipo CDATA utilizza dati generici in formato carattere.
  • ENTITY, il valore dell'attributo fa riferimento ad un'entità dichiarata nel DTD.
  • ENTITIES, equivalente ad ENTITY, ma consente l'utilizzo di più valori separati da spazi.
  • ID, il valore dell'attributo deve essere un identificatore univoco. In un documento XML può essere definito un solo attributo di tipo ID. altrimenti il parser produce un errore.
  • IDREF, il valore deve essere un riferimento a un ID associato ad un altro elemento del documento XML.
  • IDREFS, equivalente a IDREF, ma consente l'utilizzo di più valori separati da spazi.
  • NMTOKEN, il valore dell'attributo può contenere alcuni caratteri alfanumerici (numeri e lettere) e i caratteri "."(punto), "-"(trattino), "_"(underscore), ":"(due punti).
  • NMTOKENS, equivalente a NMTOKEN, ma consente l'utilizzo di più valori separati da spazi.
  • ENUMERAZIONI, che specificano una serie di valori permessi indicati tra parentesi tonde e separate da |. Ad esempio:
    <!ATTLIST messaggio
      Avviso ( basso | normale | urgente) “basso”>
    Ho tre valori permessi (basso, normale, urgente) di cui basso è quello predefinito.

Per quanto riguarda i valori predefiniti degli attributi, su essi possono essere imposti alcuni vincoli:

  • se l'attributo è obbligatorio, si indica col simbolo #REQUIRED
  • se l'attributo è facoltativo, si indica col simbolo #IMPLIED
  • se all'attributo deve essere associato un valore costante, si indica col simbolo #FIXED "valore"
  • per dare un valore di default all'attributo, basta metterlo tra virgolette. Es: "valore1"

Esempio

Documento XML di partenza:

<elenco>
  <prodotto codice="123">
    <descrizione> libro </descrizione>
    <prezzo> 50 </prezzo>
  </prodotto>
  <prodotto codice="456">
    <descrizione> penna stilo </descrizione>
  </prodotto>
</elenco>

DTD risultante:

(1) <!ELEMENT ELENCO (PRODOTTO+)>
(2) <!ELEMENT PRODOTTO (DESCRIZIONE, PREZZO?)>
(3) <!ATTLIST PRODOTTO codice ID #REQUIRED>
(4) <!ELEMENT DESCRIZIONE (#PCDATA)>
(5) <!ELEMENT PREZZO (#PCDATA)>

Commenti punto per punto:

  • (1) l'elemento ELENCO contiene altri elementi di tipo PRODOTTO. In particolare ne deve avere obbligatoriamente almeno 1
  • (2) l'elemento PRODOTTO contiene altri due elementi: DESCRIZIONE (che può avere un'unica occorrenza) e PREZZO, la cui presenza è facoltativa
  • (3) l'elemento PRODOTTO deve avere come attributo il suo codice identificativo
  • (4) e (5) gli elementi DESCRIZIONE e PREZZO sono stringhe di testo

Dichiarazioni di entità generali

Nei concetti generali abbiamo già visto che XML prevede cinque referenze ad entità predefinite, ma il DTD permette di definirne altre.
Un'entità è un modo per definire singoli blocchi di informazioni. Faccio riferimento ad entità esterne o interne per includerle in documenti.
Le entità vengono definite tramite la seguente sintassi:

<!ENTITY nomeEntità "testoDaSostituireAllEntità">

Una volta che l'entità viene definita è possibile utilizzarla in qualsiasi punto del documento tramite &nomeEntità;.

Esempio:

<!ENTITY super "supercalifragilistichespiralidoso">

NOTA: le entità possono contenere anche markup, quindi ad esempio un piè di pagina o un'intestazione standard di pagine web che si ripete più volte nelle pagine.

Limiti DTD

Il Document Type Definition è molto semplice da scrivere e questo ha un prezzo:

  • gli unici tipi di dati ammessi sono quelli testuali (niente numeri interi o reali, booleani, ecc)
  • possono esprimere un numero di vincoli sugli attributi molto limitato
  • non sono estendibili
  • non gestiscono namespace

Esempio Finale

Abbiamo il seguente documento XML:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE racconti SYSTEM "racconti.dtd">

<racconti>
<!-- Questo commento lo inserisco
perché mi serve provare il rilevamento dei commenti di XPath :P -->

  <racconto autore="Howard Phillips Lovecraft">
    <titoloItaliano>L'estraneo</titoloItaliano>
    <titoloOriginale>The Outsider</titoloOriginale>
    <notaIntroduttiva>
     The Outsider è considerato uno degli esempi più palesi 
     dell'influsso che lo stile e le tematiche di Edgar Allan
     Poe hanno esercitato su Lovecraft.
     La storia ha una sottintesa nota autobiografica. Nel 
     protagonista, che cresce solo in una grande casa, 
     nutrendo la sua cultura di vecchi libri, è facile 
     riconoscere l'infanzia solitaria dello stesso Lovecraft.
     L'invocazione finale all'oblio di fronte agli orrori 
     dell'esistenza da "estraneo" proiettato nel mondo comune
     si ripeterà continuamente nella sua opera, soprattutto 
     quella poetica, nella quale si riflettono più chiaramente
     le angosce dell'anima.
    </notaIntroduttiva>
    <frammento>
     Infelice chi dell'infanzia ha soltanto memorie di paura
     e tristezza. Sventurato chi, volgendosi indietro, non vede
     che ore solitarie trascorse in sale vaste e malinconiche 
     tappezzate di lugubri tendaggi e file esasperanti di libri
     antichi, o in desolate veglie in boschi crepuscolari fitti
     di immensi alberi grotteschi coperti da erbe, che agitano
     silenziosi in alto i rami contorti...
    </frammento>
  </racconto>

  <racconto autore="Edgar Allan Poe">
    <titoloItaliano>La mascherata della Morte Rossa</titoloItaliano>
    <titoloOriginale>The Mask of the Red Death</titoloOriginale>
    <frammento>
     La settima stanza era pesantemente avvolta in panneggi
     di velluto nero che pendevano ovunque dal soffitto e 
     dalle pareti, ricadendo in pesanti pieghe su un tappeto
     della stessa stoffa e colore. In quest'unica stanza pero'
     la tinta delle finestre non corrispondeva alle decorazioni.
     Le vetrate erano di colore scarlatto, di un cupo color
     sangue. Ora in nessuna di quele sette stanze vi era una 
     sola lampada o candelabro, pur tra la profusione di ornamenti
     dorati sparsi qua e la' o pendenti dai soffitti.
    </frammento>
  </racconto>

  <racconto autore="Howard Phillips Lovecraft">
    <titoloItaliano>La musica di Erich Zann</titoloItaliano>
    <titoloOriginale>The Music of Erich Zann</titoloOriginale>
    <notaIntroduttiva>
     Quando il saggista francese Jacques Bergier chiese a Lovecraft
     se avesse mai visitato Parigi, per averne descritto così bene
     l'atmosfera di certi quartieri, Lovecraft gli rispose:"certo
     che l'ho visitata. Con Poe, in sogno".
     Malgrado l'apparenza onirica non è tratta da un unico sogno;
     tuttavia ho sognato spesso di strade tortuose come la
     Rue d'Auseil.
    </notaIntroduttiva>	
    <frammento>
     Riuscii invece a sentire la musica del vecchio muto: prima
     salendo in punta di piedi fino al quinto piano, poi trovando
     il coraggio necessario per inerpicarmi su per l'ultima rampa
     scricchiolante che conduceva alla mansarda di Zann. E lì,
     nell'angusto pianerottolo davanti alla porta sprangata e col 
     buco della serratura tappato, più volte udii suoni che mi
     colmarono di un terrore indefinibile, un terrore di occulti
     prodigi e celati misteri.
    </frammento>
    </racconto>

</racconti>

Il DTD relativo sarà:

<!ELEMENT racconti (racconto+)>
<!ELEMENT racconto (titoloItaliano, titoloOriginale, notaIntroduttiva*, frammento)>
<!ATTLIST racconto autore CDATA #REQUIRED>
<!ELEMENT titoloItaliano (#PCDATA)>
<!ELEMENT titoloOriginale (#PCDATA)>
<!ELEMENT notaIntroduttiva (#PCDATA)>
<!ELEMENT frammento (#PCDATA)>


Torna alla pagina di Tecnologie Web