mantenimento di un raid 1 e sostituzione di hard disk degradato

2 risposte [Ultimo messaggio]
Ritratto di GioMBG
GioMBG
(Junior)
Offline
Junior
Iscritto: 05/08/2011
Messaggi: 9

Ciao a tutti,
mi presento come vero e proprio newbie in fatto di raid, disco, etc.

sono qua per chiedere supporto in proposito al mantenimento di un raid 1

La mia situazione attuale:
Macchina con 3 hard disk da 1.5 Tera identici in Hetzner.

il raid 1 si riesce ad impostare facilemente ma il difficile per me e mantenerlo!

quindi prima di spostare i miei circa 30 siti devo cercare di capire come:

- eseguire uno scambio di disco di test per eseguire un riallineamento (per non rimanere fregato quando eventualemnte un disco andasse degradato)
- smontare un disco attivo dal mio sistema di tre per evitare di rischiare di bruciarmi i backup nel caso in cui debba fare un'operazione di sostituzione

Posso postare qualsiasi schema e/o file e tranquillamente fare delle prove prima di installare la macchina definitiva,
se la pianto NESSUN PROBLEMA!
Ho anche la possibilita di entrare in rescue.

Ecco la mia situazione

[root@server etc]# cat /proc/mdstat
Personalities : [raid1] 
md2 : active raid1 sda3[0] sdb3[1]
      1462766336 blocks [2/2] [UU]
      [================>....]  resync = 84.3% (1233827072/1462766336) finish=76.9min speed=49602K/sec
 
md1 : active raid1 sda2[0] sdb2[1]
      264960 blocks [2/2] [UU]
 
md0 : active raid1 sda1[0] sdb1[1]
      2102464 blocks [2/2] [UU]
        resync=DELAYED
 
unused devices: <none>

[root@server etc]# mdadm --detail --scan
ARRAY /dev/md0 metadata=0.90 UUID=eb65f58c:84fb29d5:776c2c25:004bd7b2
ARRAY /dev/md1 metadata=0.90 UUID=6e201a4c:304a1d3f:776c2c25:004bd7b2
ARRAY /dev/md2 metadata=0.90 UUID=8c2757bb:64dc7f88:776c2c25:004bd7b2

[root@server etc]# mdadm -E /dev/sda1
/dev/sda1:
          Magic : a92b4efc
        Version : 0.90.00
           UUID : eb65f58c:84fb29d5:776c2c25:004bd7b2
  Creation Time : Fri Aug  5 17:09:26 2011
     Raid Level : raid1
  Used Dev Size : 2102464 (2.01 GiB 2.15 GB)
     Array Size : 2102464 (2.01 GiB 2.15 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
 
    Update Time : Sat Aug  6 00:03:53 2011
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0
       Checksum : 2ddcf855 - correct
         Events : 38
 
 
      Number   Major   Minor   RaidDevice State
this     0       8        1        0      active sync   /dev/sda1
 
   0     0       8        1        0      active sync   /dev/sda1
   1     1       8       17        1      active sync   /dev/sdb1

[root@server etc]# mdadm -E /dev/sdb1
/dev/sdb1:
          Magic : a92b4efc
        Version : 0.90.00
           UUID : eb65f58c:84fb29d5:776c2c25:004bd7b2
  Creation Time : Fri Aug  5 17:09:26 2011
     Raid Level : raid1
  Used Dev Size : 2102464 (2.01 GiB 2.15 GB)
     Array Size : 2102464 (2.01 GiB 2.15 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
 
    Update Time : Sat Aug  6 00:03:53 2011
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0
       Checksum : 2ddcf867 - correct
         Events : 38
 
 
      Number   Major   Minor   RaidDevice State
this     1       8       17        1      active sync   /dev/sdb1
 
   0     0       8        1        0      active sync   /dev/sda1
   1     1       8       17        1      active sync   /dev/sdb1

[root@server etc]# mdadm -E /dev/sdc1
/dev/sdc1:
          Magic : a92b4efc
        Version : 0.90.00
           UUID : 632c40cc:0a3e7d57:776c2c25:004bd7b2
  Creation Time : Sun Jul 31 01:45:17 2011
     Raid Level : raid0
   Raid Devices : 3
  Total Devices : 3
Preferred Minor : 0
 
    Update Time : Sun Jul 31 01:45:17 2011
          State : active
 Active Devices : 3
Working Devices : 3
 Failed Devices : 0
  Spare Devices : 0
       Checksum : 2ab8410f - correct
         Events : 1
 
     Chunk Size : 64K
 
      Number   Major   Minor   RaidDevice State
this     2       8       33        2      active sync   /dev/sdc1
 
   0     0       8        1        0      active sync   /dev/sda1
   1     1       8       17        1      active sync   /dev/sdb1
   2     2       8       33        2      active sync   /dev/sdc1

[root@server etc]# pvscan
  No matching physical volumes found
[root@server etc]# lvscan
  No volume groups found
[root@server etc]# 

Grazie
GioMBG

Ritratto di fdaluisio
fdaluisio
(Collaboratore)
Offline
Collaboratore
Iscritto: 04/01/2011
Messaggi: 506

GioMBG ha scritto:


La mia situazione attuale:
Macchina con 3 hard disk da 1.5 Tera identici in Hetzner.

Non conosco il provider ma un raid hardware no era forse meno impegnativo nel caso di problemi?

Per il resto mi pare di vedere da tutto quello che mi hai postato che a parte md2 che era in resync il resto è in stato di active.
In pratica i raid sono su e sono a posto. Puoi procedere con i test staccando ad esempio un disco. Vedrai che il sistema al riavvio
ti dirà che lo stato è degradato. Lo riattacchi e dovrebbe partire il rebuild che potrai seguire sempre tramite il cat di /proc/mdstat.

Il tool linux per il rebuild nel caso di corruzioni oppure rotture di disco è mdadm.
Puoi seguire il suo man (man mdadm) per avere una idea delle sue capacità.

Fedora offre un capitolo nella sua documentazione ufficiale nel caso di raid a questo indirizzo.

Webmin ha un modulo per la gestione RAID se vuoi qualcosa di visivo ma non ricordo se ha la possibilità di eseguire un rebuild

Ritratto di GioMBG
GioMBG
(Junior)
Offline
Junior
Iscritto: 05/08/2011
Messaggi: 9

GRAZIE fdaluisio,
vado subito a studiare il materiale nei tuoi link, nel frattempo Ti faccio alcune domande in merito a quel poco che sono riuscito a capire di mdadm.
PREMETTO: Non ho provato a staccare un disco perche' non sono riuscito a capire come farlo,
pensando che potesse essere utile a qualche cosa mi sono messo a studiare fdisk e qui qualche cosa ho capito perchè sono risucito a creare una tabella di partizioni e anche a scrivere un filesystem ma di come staccare un disco ho capito da solo che fdisk non serve a un tubo quindi:
domanda:
come si fa a staccare un disco? (dico a staccarlo virtualemnte il server si trova in Germania)

ho provato a simulare una rottura cosi:
mdadm --manage /dev/md0 --fail /dev/sda1
il comando aveva funzionato perche' ho visto che l'operazione era risucita (nessun errore e conferma stato fail) dopo ho provato a smotarlo e forse ci sono risucito ma sono un po' sconfortato perchè ancora non capisco da che punto partire per studiare ed operare con mdadm... il piu delle volte mi si diceva che la periferica era occupata e che non si poteva operare... a tal proposito sono anche entrato in rescue mode ma nada sempre lo stesso errore su quasi tutte le operazioni perche' periferiche occupate...
in fine Ti sono grato se potessi darmi una speiegazione piu' dettagliata possibile su come operare per effettuare uno smontaggio disco e rimontaggio di un'altro per simpulare la sostituzione completa e arrivare al riallineamento completo.
GRAZIE
GioMBG

ho guardato gli argomenti del raid del link che mi hai inviato e di massima queste cose le so abbastanza quindi vado a bomba e scusa la mia ignoranza nel campo:

[root@server /]# cat /proc/mdstat
Personalities : [raid1] [raid0] 
md125 : active (auto-read-only) raid1 sdc2[2]
      264960 blocks [3/1] [__U]
 
md126 : inactive sdc1[2]
      2102464 blocks
 
md127 : inactive sdc3[2]
      1462766336 blocks
 
md2 : active raid1 sdb3[1]
      1462766336 blocks [2/1] [_U]
 
md1 : active raid1 sdb2[1]
      264960 blocks [2/1] [_U]
 
md0 : active raid1 sdb1[1]
      2102464 blocks [2/1] [_U]
 
unused devices: <none>

come puoi ben vedere ho fatto le mie prove, azni direi casini, ma nessun problema la macchina e in fase di test proprio per imparare definitivamente come fare a sostituire un disco e quindi imparare a gestire sto benedetto raid1, qui vedo md125, md126, md127 che originariamente non vedevamo...
DOMANDA:
cosa sono?
come faccio a cancellarli?