8.9XML-Schema-Validierung *
XML ist ein sehr freies Format, und Dokumente können leicht XML-Elemente enthalten, die so eigentlich vom Designer nicht vorgesehen waren. Um sicherzustellen, dass XML-Dokumente nicht zu »frei« sind, sondern sich an bestimmte Regeln halten, gibt es unterschiedliche Korrektheitsbeschreibungen. Die populärste ist XML Schema (siehe auch Abschnitt 8.2.3, »Schema – die moderne Alternative zu DTD«), die das ältere DTD ersetzt hat. Eine XML-Schema-Datei hat ebenfalls das XML-Format (anders als DTD) und wird einem Parser zusammen mit der XML-Datei gegeben. Der liest ein XML-Dokument ein und prüft, ob die Regeln eingehalten werden.
8.9.1SchemaFactory und Schema
Java unterstützt die Schema-Validierung, die jedoch standardmäßig ausgeschaltet ist. Ein Grund ist, dass die Validierung die Rechenzeit und den Speicherbedarf erhöht. Um die Validierung zu aktivieren, muss zunächst ein Schema-Objekt aufgebaut werden. Bei JAXB haben wir die Validierung schon genutzt und Folgendes geschrieben:
XMLConstants.W3C_XML_SCHEMA_NS_URI );
Schema schema = sf.newSchema(
ValidatingRoomUnmarshaller.class.getResource( "/schema1.xsd" ) );
Das Objekt vom Typ Schema repräsentiert die Schema-Beschreibung.
8.9.2Validator
Im Fall von JAXB wurde das Schema-Objekt direkt an JAXB festgemacht und zur Validierung genutzt. Unabhängig davon bietet das Schema-Objekt die zentrale Methode newValidator(), die einen Validator liefert, der letztlich die Validierung durchführt.
Validator validator = schema.newValidator();
final SchemaFactory newInstance(String schemaLanguage)
Liefert eine SchemaFactory, die die angegebene Schema-Sprache unterstützt. Bei der XML-Schema-Validierung wird der String immer XMLConstants.W3C_XML_SCHEMA_NS_URI sein, also "http://www.w3.org/2001/XMLSchema". Es gibt zwar auch die Konstante RELAXNG_NS_URI für RELAX NG Schema-Validierung, doch JAXP unterstützt dies nicht.Schema newSchema(File schema) throws SAXException
Parst die Datei und baut das Schema-Objekt aus. Gibt es beim Parsen Fehler, folgt die SAXException.Schema newSchema(URL schema) throws SAXException
Holt sich die Schema-Datei von der URL, parst sie und baut das Schema-Objekt auf. Gibt es beim Parsen Fehler, folgt die SAXException.
abstract Validator newValidator()
Liefert einen Validator für das Schema.
8.9.3Validierung unterschiedlicher Datenquellen durchführen
Dieser Validator bietet die Methode validate(…), und ihr wird entweder eine DOMSource, JAXBSource, SAXSource, StAXSource oder StreamSource – also ganz allgemein gesprochen ein Objekt vom Typ javax.xml.transform.Source – übergeben. An dem Paket lässt sich ablesen, dass Source ein Typ aus dem XSLT-Paket ist.
Wie ist nun der Weg, um etwa einen DOM-Baum zu validieren? Der DOM-Baum muss als Source-Objekt verpackt und dann der validate(…)-Methode übergeben werden. Etwa so:
validator.validate( new DOMSource(document) );
Gibt es Fehler, gibt es eine SAXException, die eine geprüfte Ausnahme ist, also behandelt werden muss. Es lässt sich mit setErrorHandler(…) ein spezieller ErrorHandler setzen, damit Fehler dort aufgefangen und dokumentiert werden können.
void validate(Source source) throws SAXException, IOException
Führt die Validierung der Eingabe durch.abstract void setErrorHandler(ErrorHandler errorHandler)
Setzt ein Objekt zum Auffangen der Fehler.