DTD - XML bygningsmodul
- Forrige side DTD introduktion
- Næste side DTD elementer
De vigtigste byggestene i XML- og HTML-dokumenter er tags som <body>...</body>.
XML-dokument byggestene
Alle XML-dokumenter (og HTML-dokumenter) består af følgende enkle byggestene:
- Element
- Attribute
- Entity
- PCDATA
- CDATA
Her er en kort beskrivelse af hver byggesten.
Element
Elementer er hovedbyggestene i XML- og HTML-dokumenter.Hovedbyggestene.
Eksempler på HTML-elementer er "body" og "table". Eksempler på XML-elementer er "note" og "message". Elementer kan indeholde tekst, andre elementer eller være tomme. Eksempler på tomme HTML-elementer er "hr", "br" og "img".
Eksempel:
<body>tekst mellem</body> <message>en besked mellem</message>
Attribute
Attribute kan tilbydeYderligere oplysninger om elementet.
Attribute placeres altid i en elements begyndelseslabel. Attribute begynder altid medNavn/VærdiFormen er parvis. Følgende "img"-element har yderligere oplysninger om kildefilen:
<img src="computer.gif" />
Elementets navn er "img". Attributnavnet er "src". Attributværdien er "computer.gif". Da elementet selv er tomt, lukkes det med en "/".
Entity
Entityer bruges til at definere variable for almindelig tekst. Entity reference er en henvisning til en entity.
De fleste studerende kender denne HTML entity reference: " ". Denne "uafbrudt linjeskifts tom plads" entity bruges i HTML til at indsætte en ekstra mellemrum i et dokument.
Når dokumentet bliver fortolket af en XML-parser, vil entityerne blive udfoldet.
Følgende entityer er prædefineret i XML:
Entity reference | Tegn |
---|---|
< | < |
> | > |
& | & |
" | " |
' | \' |
PCDATA
PCDATA betyder fortolkede tegndata (parsed character data).
Man kan forestille sig tegndata som teksten mellem en XML-elements begyndelses- og afslutningstag.
PCDATA er tekst, der vil blive fortolket af parseren. Denne tekst vil blive kontrolleret for entiteter og tags af parseren.
Teksttags vil blive behandlet som mærker, mens det faktiske tekstindhold vil blive udfoldet.
Men de fortolkede karakterdata skal ikke indeholde nogen &、< eller > tegn; de skal erstattes med &、< og > entiteter henholdsvis.
CDATA
CDATA betyder karakterdata (character data).
CDATA vil ikke blive fortolket af parseren.Mærkerne i disse tekster vil ikke blive behandlet som mærker, og de entiteter, der er i dem, vil ikke blive udfoldet.
- Forrige side DTD introduktion
- Næste side DTD elementer