Media Error sur un disque RAID5 qui reste vert

Serveurs PowerEdge - Matériel

Serveurs PowerEdge  - Matériel
Rejoignez les conversations sur les serveurs PowerEdge et les logiciels de management systèmes.

Media Error sur un disque RAID5 qui reste vert

Cette question a été répondue par Dell-Stephane T

Bonjour,

Un disque d'un volume RAID5, sur un PE équipé de perc H700, présente de nombreuses erreurs, mais sa led reste néanmoins verte et son status OK. Est ce normal d'après vous ? Faut il le changer ? :

RAID Level : Primary-5, Secondary-0, RAID Level Qualifier-3
Size : 1.907 TB
Sector Size : 512
Parity Size : 279.017 GB
State : Optimal
Strip Size : 64 KB
Number Of Drives : 8

./MegaCli -pdinfo -PhysDrv[32:0] -a0

Enclosure Device ID: 32
Slot Number: 0
Drive's position: DiskGroup: 0, Span: 0, Arm: 0
Enclosure position: N/A
Device Id: 0
WWN:
Sequence Number: 2
Media Error Count: 2513
Other Error Count: 603
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SAS

Raw Size: 558.911 GB [0x45dd2fb0 Sectors]
Non Coerced Size: 558.411 GB [0x45cd2fb0 Sectors]
Coerced Size: 558.375 GB [0x45cc0000 Sectors]
Sector Size: 0
Firmware state: Online, Spun Up
Device Firmware Level: DA07

10/11/16 17:10:07: DEV_REC:Medium Error DevId[0] Tgt 0 RDM=a05a0200 retires=0

10/11/16 17:10:07: prCallback: Medium Error on pd=00, StartLba=1427ea2e, ErrLba=1427ef59
10/11/16 17:10:08: EVT#55570-10/11/16 17:10:08: 110=Corrected medium error during recovery on PD 00(e0x20/s0) at 1427ef59
10/11/16 17:10:08: EVT#55571-10/11/16 17:10:08: 93=Patrol Read corrected medium error on PD 00(e0x20/s0) at 1427ef59
10/11/16 17:12:03: DEV_REC:Medium Error DevId[0] Tgt 0 RDM=a07ce400 retires=0
10/11/16 17:12:03: prCallback: Medium Error on pd=00, StartLba=1428bf5a, ErrLba=1428ce3b
10/11/16 17:12:04: EVT#55573-10/11/16 17:12:04: 110=Corrected medium error during recovery on PD 00(e0x20/s0) at 1428ce3b
10/11/16 17:12:04: EVT#55574-10/11/16 17:12:04: 93=Patrol Read corrected medium error on PD 00(e0x20/s0) at 1428ce3b
10/11/16 19:10:25: DEV_REC:Medium Error DevId[0] Tgt 0 RDM=a0860c00 retires=0
10/11/16 19:10:25: prCallback: Medium Error on pd=00, StartLba=146c4e3c, ErrLba=146c55a0
10/11/16 19:10:25: EVT#55576-10/11/16 19:10:25: 110=Corrected medium error during recovery on PD 00(e0x20/s0) at 146c55a0
10/11/16 19:10:25: EVT#55577-10/11/16 19:10:25: 93=Patrol Read corrected medium error on PD 00(e0x20/s0) at 146c55a0
10/11/16 20:26:34: DEV_REC:Medium Error DevId[0] Tgt 0 RDM=a06f6e00 retires=0
10/11/16 20:26:34: prCallback: Medium Error on pd=00, StartLba=14af85a1, ErrLba=14af86ae
10/11/16 20:26:34: EVT#55579-10/11/16 20:26:34: 110=Corrected medium error during recovery on PD 00(e0x20/s0) at 14af86ae
10/11/16 20:26:34: EVT#55580-10/11/16 20:26:34: 93=Patrol Read corrected medium error on PD 00(e0x20/s0) at 14af86ae
10/12/16 1:52:55: DEV_REC:Medium Error DevId[0] Tgt 0 RDM=a067c800 retires=0

Réponse vérifiée
  • Bonjour,

    D'après les logs le disque 0 à déjà rencontré des erreurs de lecture sur au moins 4 secteurs différents. Ces erreurs ont pu être corrigées car le disque SAS possède un stock de cluster qu'il peut ré-allouer.

    Vous pouvez dans un premier temps tenter de faire une mise à jour du firmware du disque pour stabiliser le problème mais je pense plus à un soucis de cluster défectueux. Si c'est le cas, le problème ne fera qu'empirer; il est alors souhaitable de remplacer le disque.

    Cordialement,
    Stéphane

Toutes les réponses
  • Bonjour,
    pourriez vous me communiquer en privé le service tag du serveur concerné par le problème de RAID? Cordialement, Stéphane

  • Bonjour,

    D'après les logs le disque 0 à déjà rencontré des erreurs de lecture sur au moins 4 secteurs différents. Ces erreurs ont pu être corrigées car le disque SAS possède un stock de cluster qu'il peut ré-allouer.

    Vous pouvez dans un premier temps tenter de faire une mise à jour du firmware du disque pour stabiliser le problème mais je pense plus à un soucis de cluster défectueux. Si c'est le cas, le problème ne fera qu'empirer; il est alors souhaitable de remplacer le disque.

    Cordialement,
    Stéphane

  • Merci,

    Pour éviter de faire plusieurs interruptions de services, je penses que l'on va planifier le changement du disque (faut que je trouve la ref), surtout au vu du nombre important d'erreur déjà trouvé (100 erreurs supplémentaires de plus par semaine).

  • Bonjour,

    Il s'agit de ce disque : 

    Inquiry Data: TOSHIBA MBF2600RC       DA07EA03PB602UKS

    600GB 10rpm SAS2, 2.5

    Pensez vous que je peux passer par Dell pour l'acquérir ? Comment doit je procéder ?

  • Bonjour,

    Pour tout achat de pièce détachée, je vous invite à consulter notre site de vente en ligne ou utiliser ce formulaire de demande

    Cordialement,
    Stéphane