Faible performance sur R430 avec Perc H730P et SSD

Serveurs PowerEdge - Matériel

Serveurs PowerEdge  - Matériel
Rejoignez les conversations sur les serveurs PowerEdge et les logiciels de management systèmes.

Faible performance sur R430 avec Perc H730P et SSD

Cette question a été répondue par Dell-Stephane T

Bonjour,

j'ai des performances de l'ordre de l'incroyable sur nos servers R620 qui ont des disques SSD de type Samsung 840 Pro: à savoir plus de 1GB/s en débit sur de gros volume.

Configuration des R620 :

Carte Raid : H710p 1GB NV

Disques durs : Samsung 840 Pro 512GB montés en Raid10

OS : Windows 2008 R2

Le même type de configuration sur les nouveaux servers R430 reçus dernièrement qui ont des cartes H730p avec des disques Samsung 850 pro me donne des débits étranges :

800MB/s environ pendant quelques secondes puis on décent à moins de 200MB/s et cela reste à ce niveau jusqu'à la fin des copies de fichiers.

Configuration : 

Carte Raid : H730p 2GB NV

Disques durs : Samsung 850 Pro 512GB montés en Raid1

OS : Windows 2012 R2

Les virtual disques sont tous les deux configurés de la même facon :

Pas de lecture anticipée

Ecriture différée

Règles du cache du disque activées

Si les débits étaient stable sur le R430, j'aurais cherchés ailleurs mais là il me semble que cela vient soit de la carte raid soit du driver des virtuals disques.

Est ce que bous auriez une idée sur le sujet ?

Réponse vérifiée
  • Bonjour,

    J'ai bien reçu le TAG et j'ai pu me mettre en relation avec la personne en charge de votre dossier au support. Après le DSET, un test de diag32 vous a été demandé pour écarter toute anomalie matérielle.

    Je vais suivre ce dossier de près et apporter ma contribution si nécessaire.

    Cordialement,
    Stéphane

Toutes les réponses
  • Bonjour,

    J'ai lu les détails de votre problématique de performance. Il est toujours délicat voir impossible de comparer des résultats quand les environnements sont différents. 

    Hormis le fait que les deux serveurs et cartes RAID en comparaison n'ont pas la même génération, j'ai surtout noté que la configuration RAID diffère car vous comparez un RAID10 avec un RAID1.

    Le RAID10 étant un RAID0 de RAID1 les performances s'en trouvent bien supérieures à un simple volume en RAID1.

    J'ai bien noté que les performances du VD en RAID1 sur le serveur 13eme génération avec la PERC H730p n'étaient pas constantes. Quel est votre méthode de test (taille de fichier, copie locale, copie réseau...) et utilisez vous la même source  et même accès physique pour ces tests? Un éléments extérieur comme le réseau pourraient influer sur ces résultats.

    Il faudrait également vérifier qu'il n'y ai pas de remontée d'erreur sur les composants de la PERC H730p (batterie/memoire cache) ce qui pourrait désactiver automatiquement le paramètre d'écriture différée (write back) et surveiller que l'un des disques n'est pas en panne prévue.

    Si ces vérifications ne donnent rien de sigificatif, je vous invite à effectuer les mises à jour bios ainsi que firmware et drivers pour le contrôleur RAID.
    Il est préférable avant toute opération de mise à jour de prévoir une période de maintenance ainsi que des backups si nécessaire.

    Voici les ressources :

    Dell Server BIOS PowerEdge R430/R530/T430 Version 1.0.2Afficher les détails
    Windows 2012 R2 Driver 6.602.07.00 for PERC H330/H730/H730P/H830 ControllersAfficher les détails
    PERC H730/H730P/H830 Mini/Adapter RAID Controllers firmware version 25.2.2-0004Afficher les détails

    Cordialement,
    Stéphane

  • Bonjour et merci pour ce retour rapide.

    Oui, ce sont bien deux raid différents (Raid10 sur l'ancien et Raid1 sur le nouveau).

    J'ai refait courant de la journée des tests en Raid1 sur l'ancien et les débits sont constants à 900MB/s avec les mêmes disques durs (Samsung 840 Pro).

    J'ai fait d'autres tests avec des Crucial MX100 et des Samsung 850 Pro, le constat reste le même.

    Pour les tests, je prend de large fichier de 4GB (des iso de SQL Server par exemple) que je duplique pour avoir un volume d'environ 40Go afin de commencer une duplication de ces dits fichiers et prendre les mesures en fonction du temps de copie. Les fichiers sont lus et écris sur la même partition et donc le même VD (le réseau n'est pas l'élément limitant).

    Concernant la configuration des Raid :

    - pas de lecture anticipée (fait plusieurs tests, ca n'apporte rien ou alors ce n'est pas visible avec les disques SSD)

    - Write Back

    - cache disque activé (cela apporte beaucoup car si ils ne sont pas activés, le débit descend au bout de quelques secondes à moins de 10MB/s, soit inutilisable pour le besoin)

    Cette configuration Raid est la même que sur la carte H710P prise pour test sur le R620.

    Les firmware sont à jour ainsi que les drivers pour le R430 et sa carte H730p. Je suis néanmoins descendu ce soir sur la version du firmware de la carte raid (passage de la version 25.2.2 à 25.2.1.0037) recommandé par l'outil SUU. Les résultats restent les mêmes.

    Tous les voyants sont corrects sur OpenManage (version 8.0.2), nous n'avons qu'un bloc d'alimentation branché sur les deux de la machine pour les besoins d'installation et lorsque la machine sera en place au datacenter, elle aura bien sûr les deux blocs d'alimentation branché (un sur chaque voie fournie par le datacenter).

    Aucun des disques n'est indiqué comme en panne prévue (ils sont tout neuf, ca m'aurait fait mal au coeur de devoir les envoyer en RMA mais la vérification est bonne à prendre)

    Aujourd'*** j'ai pris contact avec le support Dell directement pour leur exposer le problème et savoir si ils avaient des retours concernant cette nouvelle génération de serveurs et plus précisément des problèmes avec les cartes Raid.

    J'ai envoyé le rapport DSET à la personne en charge du dossier qui devrait me contacter demain avec ses premières conclusions.

    Nous avons une quinzaine de serveur que l'on ne peut mettre en production à cause de ce problème de performance. Un seul mis en production (besoin important) et bien sûr les utilisateurs se plaignent car c'était plus rapide sur l'ancien serveur (x4 pour le temps de traitement sur le nouveau). Les débits et les temps d'accès disques restent meilleurs que des disques à plateau dans le même type de configuration pour un prix qui est bien sûr plus faible.

    Toute idée ou vérification est bonne à prendre car j'ai épuisé les miennes et il ne semble pas que ce soit un problème avec les disques eux mêmes mais soit un problème avec l'OS (on ne sait jamais) soit un problème de driver, soit un problème de firmware de la carte raid, soit un problème de la carte raid (mauvaise alimentation !?)

    J'espère qu'à force de test et de vérifications de toute sorte nous arriverons à trouver la source du problème et que cela pourra aider d'autres tomber dans le même type de soucis que nous.

    PS: autre information, on a fait des tests en Raid10 sur la carte H730P, les débits sont à très peu de chose les mêmes qu'en Raid1. Le type de Raid n'influe pas sur le problème non plus.

  • Je vais réfléchir aux nouveaux élements que vous m'avez apportés pour voir si si je peux trouver une nouvelle piste.

    Pourriez vous m'envoyer en privé le tag du R430 pour que je puisse vérifier la configuration et que je me mette en relation avec le technicien du support qui gère actuellement votre dossier?

    Bonne soirée.

    Cordialement,
    Stéphane

  • Bonjour,

    J'ai bien reçu le TAG et j'ai pu me mettre en relation avec la personne en charge de votre dossier au support. Après le DSET, un test de diag32 vous a été demandé pour écarter toute anomalie matérielle.

    Je vais suivre ce dossier de près et apporter ma contribution si nécessaire.

    Cordialement,
    Stéphane

  • Merci beaucoup, plus il y a d'avis plus vite nous trouverons la solution.

    Pour ceux qui suivent, je viens de lancer il y a une demi heure les diagnostiques matérielles que l'on peut trouver au niveau du LifeCycle Controller.

    Pour l'instant j'ai déjà une erreur de type 2000-0251.

    Ce qui a été vu il y a quelques minutes avec le support consiste à lancer ces tests mais en mode étendu "Thorough Test Mode"

  • Bon le test vient juste de terminé, j'ai un fichier compressé de 98ko je vais l'envoyé au support.

  • Bonjour,

    Vous avez du recevoir un email de ma part pour que vous puissiez nous transférer le log en l'absence de Stéphane aujourd'***.

    Cordialement.

    Gregory.