14.2Java Remote Method Invocation
RMI macht es möglich, auf hohem Abstraktionsniveau zu arbeiten und entfernte Methodenaufrufe zu realisieren. Automatisch generierte Stellvertreter nehmen die Daten entgegen und übertragen sie zum Server. Nach der Antwort präsentiert der Stellvertreter das Ergebnis.
14.2.1Zusammenspiel von Server, Registry und Client
Damit RMI funktioniert, sind drei Teile mit der Kommunikation beschäftigt:
Der Server stellt das entfernte Objekt mit der Methodenimplementierung bereit. Die Methode läuft im eigenen Adressraum, und der Server leitet eingehende Anfragen vom Netzwerk an diese Methode weiter.
Der Namensdienst (Registry) ist ein Anfragedienst, der Objekte und ihre Methoden mit einem eindeutigen Namen verbindet. Der Server meldet Objekte mit ihren Methoden bei diesem Namensdienst an.
Der Client ist der Nutzer des Dienstes und ruft die Methode auf einem entfernten Objekt auf. Auch er hat einen eigenen Adressraum. Möchte der Client eine Methode nutzen, so fragt er beim Namensdienst an, um Zugriff zu bekommen.
14.2.2Wie die Stellvertreter die Daten übertragen
Für RMI gibt es wie bei TCP/IP ein Schichtenmodell, das aus mehreren Ebenen besteht. Die oberste Ebene mit dem höchsten Abstraktionsgrad nutzt einen Transportdienst der darunterliegenden Ebene. Dessen Aufgabe ist es, die Daten wirklich zu übermitteln, und die Stellvertreter realisieren es, die Parameter irgendwie von einem Ort zum anderen zu bewegen. Sie setzen also die Transportschicht um.
Eine Implementierung über Sockets
Wir können uns vorstellen, dass die Stellvertreter eine Socket-Verbindung nutzen. Der Server horcht dann in accept() auf einkommende Anfragen, und der Stellvertreter vom Client baut anschließend die Verbindung auf. Sind die Argumente der Methode primitive Werte, können sie in unterschiedliche write(…)- und read(…)-Methoden umgesetzt werden. Doch auch bei komplexen Objekten wie Listen hat Java keine Probleme, da es ja eine Serialisierung gibt. Objekteigenschaften werden dann einfach plattgeklopft und Bit für Bit übertragen und auf der anderen Seite wieder ausgepackt. Bei entfernten Methodenaufrufen wird neben der Serialisierung auch der Begriff Marshalling verwendet. Somit ist das Verhalten, wie bei lokalen Methoden fast abgebildet, insbesondere der synchrone Charakter. Die lokale Methode blockiert so lange, bis das Ergebnis der entfernten Methoden ankommt.
RMI Wire Protocol
Das für die Übertragung zuständige Protokoll heißt RMI Wire Protocol. Die Übertragung mittels Sockets und TCP ist nur eine Möglichkeit. Neben den Sockets implementiert Java-RMI für Firewalls auch die Übermittlung über HTTP-Anfragen. Wir werden in einem späteren Abschnitt darauf zurückkommen. Über eine eigene RMI-Transportschicht könnten auch andere Protokolle genutzt werden, etwa über UDP oder gesicherte Verbindungen mit SSL. Verschlüsselte RMI-Verbindungen über SSL sind nicht schwer, wie es ein Beispiel unter http://tutego.de/go/jssesamples zeigt.
14.2.3Probleme mit entfernten Methoden
Das Konzept scheint entfernte Methoden so abzubilden wie lokale. Doch es gibt einige feine Unterschiede, sodass wir nicht anfangen müssen, alle lokal deklarierten Methoden verteilt zu nutzen, weil gerade mal ein entfernter Rechner schön schnell ist:
Zunächst müssen wir ein Kommunikationssystem voraussetzen. Damit fangen aber die bekannten Probleme bei Clients bzw. Servern an. Was geschieht, wenn das Kommunikationssystem zusammenbricht? Was passiert mit verstümmelten Daten?
Da beide Rechner eigene Lebenszyklen haben, ist nicht immer klar, ob beide Partner miteinander kommunizieren können. Wenn der Server nicht ansprechbar ist, muss der Client darauf reagieren. Hier bleibt nichts anderes übrig, als über einen Zeitablauf (Timeout) zu gehen.
Da Client und Server über das Kommunikationssystem miteinander sprechen, ist die Zeit für die Abarbeitung eines Auftrags um ein Vielfaches höher als bei lokalen Methodenaufrufen. Zu den Kommunikationskosten über das Rechennetzwerk kommen die Kosten für die zeitaufwändige Serialisierung hinzu, die besonders in den ersten Versionen des JDK hoch waren.
Parameterübergabe bei getrenntem Speicher
Der tatsächliche Unterschied zwischen lokalen und entfernten Methoden ist jedoch das Fehlen des gemeinsamen Kontextes. Die involvierten Rechner führen ihr eigenes Leben mit ihren eigenen Speicherbereichen. Stehen auf einer Maschine zum Beispiel statische Variablen jedem zur Verfügung, ist dies bei entfernten Maschinen nicht der Fall. Ebenso gilt dies für Objekte, die von mehreren Partnern geteilt werden. Die Daten auf einer Maschine müssen erst übertragen werden, also arbeitet der Server mit einer Kopie der Daten. Bei primitiven Daten ist das kein Thema, schwierig wird es erst bei Objektreferenzen. Mit der Referenz auf ein Objekt kann der andere Partner nichts anfangen. Mit der Übertragung der Objekte handeln wir uns jedoch zwei weitere Probleme ein:
Erstens muss der Zugriff exklusiv erfolgen, weil andere Teilnehmer den Objektzustand ja unter Umständen ändern können. Wenn wir also eine Referenz übergeben, und das Objekt wird serialisiert, könnte der lokale Teilnehmer Änderungen vornehmen, die beim Zurückspielen vom Server eventuell verloren gehen könnten.
Damit haben wir zweitens den Nachteil, dass »einfach eine Referenz« nicht ausreicht. Große Objekte müssen immer wieder vollständig serialisiert werden. Und mit dem Mechanismus des Serialisierens handeln wir uns ein Problem ein: Nicht alle Objekte sind per se serialisierbar. Gerade die Systemklassen lassen sich nicht so einfach übertragen. Bei einer Trennung von Datenbank und Applikation wird das deutlich. Eine hübsche Lösung wäre etwa, ein RMI-Programm für die Datenbankanbindung einzusetzen sowie eine Applikation, die mit dem RMI-Programm spricht, um unabhängig von der Datenbank zu sein; RMI nimmt hier die Stelle einer so genannten Middleware ein. Bedauerlicherweise implementiert keine der Klassen im Paket java.sql die Schnittstelle Serializable. Die Ergebnisse müssen in einem neuen Objekt verpackt und verschickt werden oder in einem RowSet, das es seit JDBC 2.0 gibt.
Wenn die Daten übertragen werden, müssen sich die Partner zudem über das Austauschformat geeinigt haben. Beide müssen die Daten verstehen. Traditionell bieten sich zwei Verfahren an:
Zunächst ein symmetrisches Verfahren. Alle Argumente werden in einem festen Format übertragen. Auch wenn Client und Server die Daten gleich darstellen, werden sie in ein neutrales Übertragungsformat konvertiert.
Dem gegenüber steht das asymmetrische Verfahren. Hier schickt jeder Client die Daten in einem eigenen Format, und der Server hat verschiedene Konvertierungsmethoden, um die Daten zu erkennen.
Da wir uns innerhalb von Java und den Konventionen bewegen, müssen wir uns über das Datenformat keine Gedanken machen. Java konvertiert die Daten unterschiedlichster Plattformen immer gleich. Daher handelt es sich um ein symmetrisches Übertragungsprotokoll.
14.2.4Nutzen von RMI bei Middleware-Lösungen
Der Begriff Middleware ist im vorangegangenem Abschnitt schon einmal gefallen. Ganz einfach gesagt, handelt es sich dabei um eine Schicht, die zwischen zwei Prozessen liegt. Die Middleware ist sozusagen der Server für den Client und der Client für einen Server, vergleichbar mit einem Proxy. Das Großartige an Middleware-Lösungen ist die Tatsache, dass sie eine starke Kopplung von Systemen entzerren und eine bessere Erweiterung ermöglichen. Sprach vorher etwa eine Applikation direkt mit dem Server, würde durch den Einsatz der Middleware die Applikation mit der Zwischenschicht reden und diese dann mit dem Server. Die Applikation weiß dann vom Server rein gar nichts.
Ein oft genanntes Einsatzgebiet für Middleware sind Applikationen, die mit Datenbanken arbeiten. Systeme der ersten Generation verbanden sich direkt mit der Datenbank, lasen Ergebnisse und modifizierten die Tabellen. Der Nachteil ist offensichtlich: Das Programm ist unflexibel bei Änderungen, und diese Änderungen müssten bei einer groß angelegten, verbreiteten Version allen Kunden zugänglich gemacht werden. Erschwerend kommt ein Sicherheitsproblem hinzu. Wenn das Programm mit der Datenbank direkt spricht, etwa in Form von JDBC, dann gelangen Informationen über die internen Tabellen durch die Abfragen leicht nach außen. Bei unsachgemäßer Programmierung kann auch ein Bösewicht das Programm decompilieren und die Tabellen vielleicht mit unsinnigen Werten füllen – denkbar schlecht für den kommerziellen Dauerbetrieb. Die Antwort auf das Problem ist der Einsatz einer Middleware. Dann verbindet sich die Applikation mit der Zwischenschicht, die dann die Daten besorgt, zum Beispiel von der Datenbank. Im Programm sind dann nur noch verteilte Anfragen, und JDBC ist nicht mehr zu entdecken. Als Applikationsentwickler können wir ruhigen Gewissens die Datenbank verändern, und wir müssen »nur« die Middleware anpassen. Der Kunde mit der Applikation sieht davon nichts. Das Sicherheitsproblem ist damit auch vom Tisch. Die Middleware kann zur Performance-Steigerung auch noch mehrgleisig fahren und die schnellste Datenbank nutzen. Lastenverteilung kann nachträglich implementiert werden, und die Software beim Client bleibt schlank.
14.2.5Zentrale Klassen und Schnittstellen
Für RMI-Aufrufe stehen folgende Klassen und Schnittstellen im Mittelpunkt:
java.rmi.Remote: eine Schnittstelle, die alle entfernten Objekte implementieren müssen
java.rmi.RemoteException: eine Unterklasse von IOException, deren Exemplare uns im Fall von Übertragungsproblemen begegnen
java.rmi.server.RemoteObject: Die Klasse implementiert Verhalten von java.lang.Object (also toString(), hashCode() und equals(Object)) für entfernte Objekte.
java.rmi.server.UnicastRemoteObject: Unterklasse von RemoteObject zum Aufbau und Exportieren (Anmelden) der Remote-Objekte
java.rmi.server.RMIClassLoader: Ermöglicht das Laden von Klassenbeschreibungen vom Server, wenn diese von einem Remote-Objekt benötigt werden.
java.rmi.RMISecurityManager: Der Sicherheitsmanager bestimmt die Möglichkeiten der von RMIClassLoader geladenen Klassen. Ohne Sicherheitsmanager lädt der RMIClassLoader keine Klassen.
Naming: eine Klasse für den Zugriff auf den Namensserver
java.io.Serializable: Parameter und Rückgaben implementieren die Schnittstelle, wenn sie per Kopie übergeben werden sollen.
java.rmi.server.RemoteServer: Oberklasse für Server-Implementierungen. Zum Setzen eines Loggers interessant.
Die Spezifikation zu RMI unter http://tutego.de/go/rmispec stellt alle Typen genauer vor.
14.2.6Entfernte und lokale Objekte im Vergleich
Vergleichen wir entfernte Objekte und ihre Methoden, fallen Gemeinsamkeiten ins Auge: Die Referenzen auf entfernte Objekte lassen sich wie gewohnt nutzen, etwa als Argumente einer Methode oder als Rückgabewert. Dabei ist es egal, ob die Methode mit den Argumenten oder Rückgabewerten lokal oder entfernt ist. Die Unterschiede zu lokalen Objekten sind aber deutlicher: Da ein Client immer über eine entfernte Schnittstelle das Objekt repräsentiert, hat es nichts mit der tatsächlichen Implementierung zu tun; daher ist auch eine Typumwandlung unmöglich. Die einzige Umwandlung von einer entfernten Schnittstelle wäre Remote. Damit ist auch deutlich, dass instanceof auch nur testen kann, ob das Objekt entfernt ist oder nicht; die echte Vererbung auf der Serverseite bleibt verborgen.