Modul Menü

Wer ist online?

Insgesamt sind 7 Besucher online: 1 registrierter, 0 unsichtbare und 6 Gäste
Der Besucherrekord liegt bei 226 Besuchern, die am 8. Jul 2012, 14:25 gleichzeitig online waren.

Mitglieder: Google [Bot]

basierend auf den aktiven Besuchern der letzten 5 Minuten

Statistik

15 Beiträge


Geburtstage

Heute hat kein Mitglied Geburtstag kein Mitglied hat in den nächsten 3 Tagen Geburtstag

Kalender

<< Juni 2013 >>
Mo Di Mi Do Fr Sa So
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30

Fest u. Feiertage Kalender-Ereignisse

Anstehende Termine:

mdadm resync legt rechner lahm [gelöst]

Hardware Fragen zum c't Server

Moderator: Moderatoren Team

mdadm resync legt rechner lahm [gelöst]

Beitragvon warhammer » 25. Dez 2008, 10:07

Hallo,

ich habe gerade feststellen müssen das ein resync eines großen RAID1 mein gesamtes System lahmlegt.

Bei kleineren RAID1 Größen kann ich während des resync weiterarbeiten, bei einem 700GB großem Raid1 funktioniert nicht mal mehr ein login oder irgend einen Befehl auf einer vorhandenen Konsole abzusetzen.

Ich bin es eigentlich gewöhnt bis auf geringen Performanceeinbussen nicht viel von einem resync zu merken. Allerdings auch auf anderen Systemen als Linux...

Ist das wirklich normal das mdadm das gesamte System lahmlegt? Oder kann ich das irgendwie beeinflussen?


Danke!
Zuletzt geändert von warhammer am 28. Dez 2008, 08:26, insgesamt 1-mal geändert.
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 25. Dez 2008, 16:52

Nö resync läuft bei mir auch im Hintergrund.

Platte online abziehen und wieder ranstecken geht sogar ohne was zu merken.

Platten richtig angebunden ?? bzw an was für einem Controller ??
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 25. Dez 2008, 21:22

Also abziehen geht bei mir auch ohne das ich was davon merke.
Allerdings dauert es sehr lange bis mir ein /proc/mdstat anzeigt das das Raid nicht mehr gespiegelt wird. Kann ich das irgendwie anders überwachen?

Beim wiederanstecken merke ich auch nichts. Allerdings wird das Raid auch nicht automatisch wieder hergestellt:

Every 2,0s: cat /proc/mdstat Thu Dec 25 20:16:22 2008

Personalities : [raid1]
md2 : active raid1 sdb2[1]
96320 blocks [2/1] [_U]

md6 : active (auto-read-only) raid1 sda6[0] sdb6[1]
97659008 blocks [2/2] [UU]

md7 : active raid1 sdb7[1]
837990464 blocks [2/1] [_U]

md5 : active (auto-read-only) raid1 sda5[0] sdb5[1]
1951744 blocks [2/2] [UU]

md3 : active raid1 sdb3[1]
14651200 blocks [2/1] [_U]


... was habe ich noch nicht gelesen/mitbekommen? Wie sag ich dem Raid das es mal bitte nachsehen soll ob alle Platten wieder da sind und ob ein sync nötig ist?


Danke!
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon warhammer » 26. Dez 2008, 08:06

Platten sind io. "Controller" ist der onboard von einem geforce 520 Chipsatz. Übertragungsraten sind ok, Fehlermeldungen gibts auch keine.
smartmon findet auch nichts.

Ich habe keine Möglichkeit gefunden das mdadm automatisch alle paar Minuten das Raid checkt und notfalls repariert. GIbt es sowas?

mdadm --re-add funktioniert soweit zum Raid wieder herstellen, aber die sync Probleme bleiben. Interessant finde ich die Aussagen aus /proc/mdstat:

md7 : active raid1 sdb7[2] sda7[0]
837990464 blocks [2/1] [U_]
[>....................] recovery = 0.2% (1926400/837990464) finish=180.8min speed=77056K/sec

... bei der angegebenen Geschwindigkeit sollte er doch eigentlich in WESENTLICH geringerer Zeit als 3h fertig sein...
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 26. Dez 2008, 18:27

Also automatisch wird bei mir auch nicht reagiert weil das nicht Sinn der Sache ist.

Bei nem Hardwareausfall läuft der Server weiter und die Netzwerküberwachungssoft schickt ne Mail raus.

Dann wird nachgeschaut was das Problem ist / war neue Platte rein ( oder alte ) ud über nen PHP Webinterface das Rebuild gestartet.

Während dessen läuft die Platte aber bzw das Rebuild im Hintergrund ohne Probleme.

Biste Live vorm System oder übers Netzwerk ??
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 26. Dez 2008, 23:21

Naja, über Sinn und Unsinn kann man da streiten.
Ein automatisches rebuild hat auch positive Seiten, aber das lässt sich ja notfalls per Script automatisieren.

Egal ob direkt vor der Konsole oder übers Netzwerk:
Ein arbeiten beim rebuild einer 800GB Partition ist einfach nicht möglich.

Ob in ein Logfile fehlermeldungen geschrieben werden muss ich morgen mal überprüfen wenn ich wieder Zugriff aufs System habe.

Auf der Konsole gibts Meldunge in der Form:
Info: Task <diverse Tasks: PID> blocked for more than 120 sec.
echo 0 > /proc/sys/kernel/hung_task_timeout_secs disables this message.
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 27. Dez 2008, 07:28

Das klingt mir aber doch sehr dass da nen Fehler ist .

Was sind dass den für Platten ??? Satat ??? Angebunden per AHCI ??
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 27. Dez 2008, 09:04

SATA, Bios Option "NO-RAID"

Alternativen: RAID, AHCI

Per AHCI werden die Platten gar nicht erkannt, RAID macht keinen Sinn.
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 27. Dez 2008, 09:53

Dann wirds per IDE Emulation eingebunden... Schlechteste Wahl.

AHCI nimmt er nicht... auch die aktuelle Debian Netinstall nicht ??

Weil ansonsten werden keine S-ATA Features unterstützt wie NCQ und HotSwap.

Edit: Schau mal ob er per AHCI die Platten findet wenn du mit nem Kerneloption pci=nomsi startest
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 27. Dez 2008, 12:33

Das das nicht gerade optimal ist, ist mir auch klar.
Aber besser suboptimale Festplatten als gar keine Platten...

Ich habe testweise mal schnell Lenny installiert:
Platten werden immer noch nicht im AHCI erkennt, ein resync dauert immer noch ewig, ABER es gibt keine Fehlermeldungen und ich kann weiterarbeiten...

Anderes spannendes Phänomen:
Mit vt-vdr+Backport Kernel werden die Raids sofort als inkonsistent eingetragen sobald ich die Platte abziehe. Unter Lenny erkennt er zwar auch, das die zweite Platte nicht mehr vorhanden ist, aber die Raids stehen weiter auf sync.
Ein mdadm -d sieht ungefähr so aus
[...]
sync /dev/sda7
sync
-> Also auch ganz ohne Platte steht dort sync. Wenn ich händisch mit mdadm --fail eingreife wird das ganze korrekt als defect angezeigt...
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 27. Dez 2008, 16:49

Ohne AHCI funzt Hot Swap nicht. Also benutze es bitte auch nicht :)

Wie gesagt pci=nomsi habe ich beim suchen nach Nforce und AHCI gefunden als Tip...

http://forums.debian.net/viewtopic.php? ... 0388b251fa

Also bei der Installation einmal nen Parameter hintendran hängen und schauen obs dann ggf mit AHCI läuft
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 28. Dez 2008, 08:24

... das ist wieder mal ein Punkt "ohne AHCI SOLLTE Hot Swap nicht funktionieren".
-> Spannend ist halt das es mit dem ct-server+Backport Kernel trotzdem funktioniert hat.

Anyway:
Auch mit pci=nomsi funktioniert(e) es nicht.
Erst ein Bios Update UND pci=nomsi führt dazu das jetzt das System mit AHCI läuft.

Das Problem mit dem nicht arbeiten können hatte sich ja mit Lenny schon erledigt.
Insofern ist das ursprüngliche Problem erstmal gelöst.
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 28. Dez 2008, 12:32

Das doch schön zu hören.

Dann kannste mitm AHCI Modus nun deine Platten ja ordentlich ansprechen.

Btw wwas heißt HotSwap hat funktioniert. Wenn die Teile als IDE Treiber geladen wurden hat der IDE Modus gar keinen HotSwapbefehl.

Aber schön zu hören dass es nun läuft.
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45

Beitragvon warhammer » 28. Dez 2008, 15:48

"Hotswap" funktioniert, heisst:

Platte ab:
sfdisk -d /dev/sdb bringt Fehlermeldungen da Platte nicht da
Platte dran:
sfdisk -d /dev/sdb zeigt Platte korrekt an
mdadm --re-add mit Devices auf /dev/sdb funktioniert.

-> Frag mich nicht warum. Bios stand definitiv NICHT auf AHCI
warhammer
Power User
Power User
 
Beiträge: 195
Registriert: 21. Dez 2008, 10:00

Beitragvon shadowrun » 29. Dez 2008, 10:23

Nee :)

Beim Hotswap wird die Platte ordentlich abgemeldet und ist nicht nur nicht da.

Wenn könntest du im Log schauen.

Bei mir kommen da nen paar Abmeldezeilen

Dein "HotSwap" lief schon mit nem uralten IDE Kontroller den ich hier rumflitzen habe. Nur die Stenkonsistenz ist nicht sehr gut :)
shadowrun
Golden User
Golden User
 
Beiträge: 920
Registriert: 23. Mai 2006, 21:45


Zurück zu Hardware

Wer ist online?

Mitglieder: Google [Bot]

cron