QuicksearchDisclaimerThe individual owning this blog works for Oracle in Germany. The opinions expressed here are his own, are not necessarily reviewed in advance by anyone but the individual author, and neither Oracle nor any other party necessarily agrees with them.
|
Cluster Filesystem in SunClusterWednesday, December 27. 2006Trackbacks
Trackback specific URI for this entry
No Trackbacks
Comments
Display comments as
(Linear | Threaded)
Danke Tatjana und Jörg. Ich bin leider noch nicht weitergekommen. Gibt es irgend eine man page die das naeher beschreibt?
Wie heisst der Corba Daemon der die File Access Zugriffe annimmt. Wie heisst die client lib die die Umleitung macht. Wo kann ich quotas konfigurieren. Gibts ein status befehl auf dem ich sehen kann wer fuer einen gegebeneen globalen mount point der master ist, etc? In der SC Doku steht dazu leider garnichts, ausser der -g option bei mount, und dass man ein DID device nehmen soll. Gruss Bernd Gruss Bernd
Die Frage ist nicht trivial zu benatworten.
Das Clusterfilesystem ist letztendlich ein Kernelmodul. Die Node, die den physikalischen Mount hat, registriert im Orb den Clusterfilestem-Serverdienst. Alle Clusternodes, die auf dieses Filesystem zugreifen wollen, registrieren sich ueber einen IDL stub als Filesystem Proxy und fragen im Request Broker den vorher registrierten Server an. Wenn nun dann deine Applikation so I/O empfindlich ist, gibt es im Primzip zwei Loesungen. Die eine heisst auf das Cluster Filesystem zu verzichten, und HAStorage+ zu verwenden. Wenn jedoch auf der anderen Seite das Cluster Filesystem genutzt werden soll, muss, wie Tatjana schon geschrieben hat, in mehr Leistung im Backbone investiert werden. Es sind bis zu 16 Interfaces, 8 je Netz bei zwei Netzen im private Network moeglich. Das Cluster fuehrt eine entsprechende Lastbalance ueber alle Interfaces durch. An dieser Stelle kann man dann sinnvollerweise auch Gigabit Interfaces einsetzen, was den Durchsatz deutlich erhoeht. Bitte denk daran, du musst die junctions, switches und switch types im private net neu definieren, falls die alte Konfiguration eine back-to-back Konfiguration war, aber das laesst sich alles im laufenden Betrieb umstellen. Wennn du mitlesen willst was im ORB passiert - dazu gibt es im Developer Package (Standard Bestandteil des Clusters) das Kommando orbadm. Mach Dich auf gute Unterhaltung gefasst, das Ding ist geschwaetzig Sorry, aber da nicht direkt ein Daemon fuer das Clusterfilesystem zustaendig ist, und ein traffic-shaping im Backbone deutliche Nebeneffekte fuer den regulaeren Clusterbetrieb bedeutet, ist eine einfache Antwort nicht moeglich. Aber wie Tatjana gesagt hat, Du kannst Die Debug Flags abschalten, das macht dann allerdings doch leider einen Reboot der Clusternodes notwendig, da Eintrag in die /etc/system. Um zu sagen ob das auch ueber einen einfachen Eingriff mit dem Kernel Debugger am lebenden System geht, bin ich nicht kompetent genug.
Danke Rolf, das hat mir schon mal weitergeholfen.
Ich habe aktuell kein konkretes Problem, ich wollte nur ein paar Messungen machen, um zu erkunden ob das global mount einen spührbar (negativen) Effekt hat. Dazu wollte ich halt verstehen wie es funktioniert, und vor allem halt auch Diagnosemöglichkeiten zu haben, zum Beispiel "welcher der Knoten macht die physikalische IO". Ich schau mich mal im ORB um. Wenn ich richtig gelesen habe so setzt das HAStorage+ das wir einsetzen die Affinity der Device Gruppe auf die aktive Node. Betrifft dies somit auch den Master Node der die IO für das globale Filesystem macht? Dann wären wir zumindest was den I/O Pfad angeht auf der sicheren Seite, und ich müsste nur noch die Delays durch den Cache/Orb betrachten (und die können nicht so gross sein, im Betrieb ist es ja ein read only filesystem). Gruss Bernd
BTW: rolf kannst du mir mal ne Mail schreiben, auf deinen Web Seiten habe ich keine Kontaktmöglichkeit gefunden (und der Admin-C deiner Domain bist du auch nicht).
Gruss Bernd
Seufz,
ich warte immer noch auf ein vernuenftiges Buch zum Thema Sun Cluster. Besonders wenn man sich auf die Zertifizierung vorbereiten will. Docs.sun.com ist ja wunderbar. Aber die Inhalte werden ungluecklicherweise so trocken vermittelt, das einem das Lesen der umfangreichen Literatur manchmal doch extrem schwer faellt. Ohne Signalstifte, Kaffe und Zigaretten kommt man da leider nicht weit.
Aber mit mdb, DTrace, apptrace find, grep, ls und vi kommt man ueberraschend weit.....
Kommt demnaechst... Letztes Finetuning, Tonnenweise Tests, alles um Version 3.2 erweitert, zwar immernoch auf historischer Hardware aber mit neuem Solaris und diesmal mit Lektoriat:) Ist aber nicht fuer Zertifizierungen geschreiben, eigentlich "nur" fuers Verstaendnis, also wenn man dann Samstag Abend schnell noch einen kleinen Update einfahren wollte und mit dem Ergebnis dessen was man da gebaut hat nicht wirklich "zufrieden" ist:( Gruesse, Rolf |
+1The LKSF bookThe book with the consolidated Less known Solaris Tutorials is available for download here
Web 2.0Contact
Networking xing.com My photos Comments about Nanosecond
Wed, 23.05.2012 00:11
I remember this being drummed
into us during Digital Design
at Uni. It's important to cons
ider it when laying out [...]
Mon, 21.05.2012 18:04
Hello Kevin, Im not surprised
with what you are seeing or ha
ve seen when attaching a SSD t
o a USB2.0. USB3.0 helps [...]
Mon, 21.05.2012 04:44
Hi Greg,
With regards to IO
PS I have seen terrible result
s using a 60GB SATA2 SSD with
USB2.0 - USB2 really cho [...]
about ZFS Dedup Internals
Sat, 19.05.2012 09:50
There is no impact to boot/imp
ort times, as the DDT is loade
d as needed ... so the pool is
imported as fast as wit [...]
Buttons![]() This work is licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 Germany License
![]() ![]() ![]() Blog Administration |