Bulletin Technique 
Par Christophe Menard Field Marketing Manager Storage Dell France

Les systèmes numériques capables de capturer, stocker, analyser et présenter des données relatives à toutes les facettes de nos entreprises ont généré un véritable raz de marée de données. Les outils de prise de décision basés sur le Big Data ne sont plus nouveaux, mais ils deviennent une nécessité sur le plan de la compétitivité. De fait, il n’est pas surprenant que les besoins en termes de capacité de stockage du datacenter de toutes les entreprises, de p etite ou grande envergure, aient connu une croissance phénoménale au cours de la dernière décennie. Cette croissance devrait se poursuivre dans un avenir proche. Cependant, toutes les données ne sont pas identiques et ne doivent pas être traitées de la même manière par le système de stockage. Les cadres informatiques doivent déployer des solutions innovantes pour rendre les données les plus pertinentes accessibles aux applications et aux décideurs de la façon la plus opportune tout en maîtrisant les coûts globaux du stockage.

Les stratégies de hiérarchisation se sont imposées comme un outil indispensable pour maîtriser de manière économique la croissance massive des données. Sur le plan conceptuel, la hiérarchisation permet à une entreprise de déplacer automatiquement les données les moins utilisées (tièdes) vers les sections à haute capacité (donc les moins coûteuses) d’une solution de stockage tout en conservant les données les plus utilisées (chaudes) sur les sections hautes performances (donc les plus coûteuses) de la solution de stockage. La plupart des solutions de stockage hiérarchisé disponibles sur le marché aujourd’*** proposent une hiérarchisation basée sur l’âge des données qui permet de répartir les données sur plusieurs niveaux de stockage en fonction de la capacité et des performances des disques, notamment les disques Flash. Cependant, les solutions de stockage d’entreprise qui offrent un coût total de possession faible et un retour sur investissement élevé doivent être fournies avec un logiciel intelligent permettant d’optimiser le placement des données appropriées, au bon moment, sur le niveau de stockage adéquat.

 

Nécessité d’une solution de stockage hiérarchisé intelligente et automatisée

Dernièrement, les solutions de stockage hiérarchisé ont pris de l’ampleur en raison de l’adoption accrue du concept de gestion du cycle de vie des informations en matière de maîtrise des coûts du stockage. Ce concept affirme que :

  • La valeur temporelle des données évolue considérablement au cours de leur cycle de vie. Le besoin d’accéder à une information diminue de manière exponentielle avec le temps.
  • À un moment donné, seule une petite portion des données est utilisée.
  • Même si seulement une petite portion des données est activement utilisée, les anciennes données doivent être conservées pendant une longue période pour diverses raisons professionnelles, comme la conformité à la réglementation.

 

La dualité des types de données (chaudes et tièdes) implique la nécessité d’avoir recours à des solutions de stockage qui permettent de réduire les coûts en stockant les données sur différents niveaux de stockage en fonction des performances. Les solutions de stockage permettant de catégoriser les données hors ligne avec une intervention humaine existent depuis un certain temps. Mais, pour concrétiser le concept de gestion du cycle de vie des informations, et ainsi réaliser des économies de stockage, une solution de stockage hiérarchisé est nécessaire afin d’automatiser le processus de catégorisation des données en fonction de modèles d’accès en temps réel et de déplacer intelligemment les données vers le niveau de stockage approprié au moment opportun.

 

Les solutions de hiérarchisation intelligentes et automatisées catégorisent généralement les données (chaudes ou tièdes) en fonction de plusieurs attributs (également appelés « métadonnées »), par exemple, la fréquence à laquelle les données sont utilisées, l’importance des données et la date à laquelle les données ont été utilisées pour la dernière fois. Ces solutions hiérarchisent principalement les données selon les facteurs essentiels suivants :

  1.  Activité des données : l’activité des données, également appelée température des données, est déterminée en prenant en compte les valeurs d’attribut des données établies pendant l’exécution de la charge de travail des applications. Quel est le degré d’activité des données ? Quelle est la température des données ? Les données dites chaudes sont transférées vers les niveaux hautes performances, tandis que les données tièdes restent sur les niveaux à haute capacité.
  2. Sensibilité des données : la sensibilité des données est déterminée par la granularité et la fréquence de déplacement des données. À partir de quelle taille un ensemble de données peut-il être hiérarchisé ou déplacé ? Au niveau des fichiers, la granularité peut s’appliquer à tout le fichier ou à tout le répertoire racine. Au niveau des blocs, la granularité peut s’appliquer à quelques blocs ou à tout le volume. À quelle fréquence les données sont-elles hiérarchisées ou déplacées ? Cela peut être une fois par jour ou une fois par heure, voire une fois par minute.
  3. Emplacement des données : l’emplacement des données est composé de plusieurs niveaux de stockage dans une solution de stockage. Un niveau de stockage dépend non seulement du type de disque, de la taille et de la vitesse, mais également des caractéristiques RAID.   

Les valeurs d’attribut des données et leur évolution dans le temps dépendent des caractéristiques d’une charge de travail. Les informations relatives à la charge de travail collectées pendant son exécution sont utilisées par la solution de stockage hiérarchisé pour placer chaque donnée sur le niveau approprié. Ainsi, les caractéristiques de la charge de travail jouent un rôle clé dans la détermination de la rentabilité d’une solution de stockage hiérarchisé.

 

 

Figure 1 : Principaux facteurs ayant une influence sur le coût total de possession d’une solution de stockage hiérarchisé : si l’activité, la sensibilité et l’emplacement des données influencent la rentabilité d’une solution de stockage hiérarchisé, la facilité du processus d’allocation de capacité de stockage à chaque niveau détermine le coût total de possession.

 

Par exemple, le stockage hiérarchisé nécessaire à une charge de travail consistant en du partage de fichier en mode NAS pour un salarié dont l’activité est modérée est très différent de celui requis par une charge de travail OLTP à volume élevé. La charge de travail de type NAS peut être hiérarchisée de façon économique sur des niveaux de stockage basés sur du NL-SAS et SAS basés sur RAID50. Des technologies de stockage Flash et SAS basés sur du RAID10 peuvent être nécessaires pour optimiser les coûts du stockage pour la charge de travail OLTP. De la même façon, la charge de travail NAS peut être optimisée de manière économique avec une sensibilité de hiérarchisation une fois par jour pour une granularité au niveau d’un fichier, tandis qu’une sensibilité de hiérarchisation avec granularité au niveau d’un bloc de 4 ko une fois toutes les 4 heures peut être nécessaire pour optimiser les coûts du stockage pour la charge de travail OLTP. Le stockage hiérarchisé doté de fonctionnalités d’automatisation et d’intelligence permettant d’adapter automatiquement le niveau de sensibilité des données et leur emplacement en fonction de la charge de travail élimine toute intervention manuelle et réduit le coût total de possession.

De plus, la facilité de reconfiguration des capacités de hiérarchisation au sein d’une solution de stockage hiérarchisé a également un impact sur sa rentabilité. Au fur et à mesure de l’évolution des besoins en matière de stockage de la charge de travail, la facilité d’ajout et de suppression de la capacité de stockage à chaque niveau a une incidence sur la productivité du personnel. Par exemple, une solution de stockage pour laquelle la capacité de stockage pour chaque niveau peut être allouée en ligne par un administrateur système général peut permettre de réduire le coût total de possession, contrairement à une solution de stockage qui nécessite un temps d’inactivité planifié et l’intervention d’un représentant du fournisseur ou d’un administrateur de stockage hautement qualifié pour allouer la capacité de stockage de chaque niveau.  

 

Avantages du stockage hiérarchisé pour les entreprises

Les solutions de stockage hiérarchisé peuvent offrir des avantages réels et mesurables qui ont un impact direct sur le coût total de possession du datacenter. Parmi les principaux avantages des solutions de stockage hiérarchisé figurent :

  • Réduction des coûts tout en répondant aux engagements de niveau de service (SLA): le stockage hiérarchisé peut générer une réduction des coûts de stockage pouvant atteindre 80 %. En offrant la flexibilité de fournir la bonne combinaison de hautes performances et de haute capacité de stockage, la hiérarchisation peut réduire le coût total tout en respectant les niveaux de service. Par exemple, en s’assurant que seules les données nécessitant de la performance soient stockées sur des Médias rapides, mais couteux, cette technologie réduit drastiquement les besoins de ce type de stockage, au profit de stockage plus capacitif et beaucoup moins honéreux.
  • Efficacité d’utilisation améliorée : le stockage hiérarchisé place les données appropriées au moment opportun sur le bon niveau du point de vue des performances et des coûts. Ainsi, de telles solutions peuvent améliorer le retour sur investissement en optimisant l’utilisation de chaque niveau de stockage. Les niveaux de stockage supérieurs sont optimisés pour l’utilisation des performances et les niveaux de stockage inférieurs sont optimisés pour l’utilisation des capacités.
  • Simplification du fonctionnement : les solutions de stockage hiérarchisé dotées de fonctionnalités de collecte d’informations sur l’utilisation et d’automatisation de la hiérarchisation basée sur les politiques éliminent tout besoin d’une intervention manuelle afin d’optimiser les performances et l’utilisation. De même, la flexibilité des performances et les capacités de suppression et d’extension des capacités au sein de chaque niveau simplifient également la planification et la gestion.

 

Considérations relatives à l’adoption

Compte tenu de la complexité des datacenters d’aujourd’***, les politiques d’implémentation qui exploitent plusieurs niveaux de stockage ne sont pas une simple possibilité, mais bien une nécessité. De fait, il est important de bien intégrer les considérations clés relatives à l’adoption afin de différencier les options disponibles et d’identifier la solution appropriée.

  • Caractéristiques de la charge de travail : pour qu’une solution de stockage hiérarchisé soit économique, elle doit tenir compte des caractéristiques de la charge de travail et de leur évolution dans le temps. Pratiquement toutes les charges de travail de production peuvent tirer parti de schémas de hiérarchisation simples. Cependant, la solution de stockage en mesure de hiérarchiser dynamiquement et automatiquement les données en fonction des caractéristiques de la charge de travail sera capable de réduire le coût total de possession du stockage.
  • Virtualisation du stockage : la virtualisation du stockage, associée à des services de données comme le transfert automatisé de blocs de données de petite taille, crée une base solide pour une solution de stockage hiérarchisé avancée. Ainsi, une solution de stockage hiérarchisé dotée d’une infrastructure de virtualisation intégrée fait bénéficier bien plus efficacement des avantages de la hiérarchisation qu’une solution de stockage standard à laquelle on ajoute une infrastructure de virtualisation.
  • Collecte d’informations avancée, automatisée et en temps réel : compte tenu de l’évolution des valeurs d’attribut des données d’applications et des exigences en termes de capacité de stockage aujourd’***, il est peu pratique et inefficace d’effectuer une classification des données manuelle ou hors ligne. Les solutions de stockage hiérarchisé dotées de fonctionnalités de collecte d’informations natives et d’automatisation pour une classification complète des données à un niveau granulaire peuvent réduire le coût total de possession en éliminant l’intervention manuelle requise pour réaliser une hiérarchisation efficace sur le long terme.
  • Flexibilité de la hiérarchisation : les solutions de stockage hiérarchisé consolidées sont partagées par plusieurs charges de travail soumises à différents modèles d’accès et besoins en termes de performances. Ainsi, la possibilité d’adaptation de la granularité, de la politique de transfert des données et de la fréquence peut avoir un énorme impact sur la rentabilité.
  • Hiérarchisation et stockage Flash : l’implémentation de la hiérarchisation dans des solutions de stockage hybride basées sur des disques Flash ou SSD garantit que des considérations supplémentaires, comme les données utilisées fréquemment en lecture ou les données nécessitant des écritures intensive, sont prises en considération par rapport à des solutions de hiérarchisation implémentées dans des solutions de stockage basées sur des disques durs traditionnels. Les solutions de hiérarchisation permettant aux clients d’intégrer et de protéger intelligemment, efficacement et de façon flexible les différents types d’implémentations RAID et Flash dans les domaines de stockage et de serveurs sont fortement recommandées pour les datacenters modernes nécessitant un certain niveau de performances.

 

Conclusion

Les solutions de stockage hiérarchisé constituent une base indispensable dans le monde actuel de la gestion des données dans lequel les responsables informatiques doivent déployer des pratiques d’excellence en matière de gestion des informations, comme la gestion du cycle de vie des informations, afin d’optimiser le coût total de possession du datacenter. L’adoption de technologies Flash dans les domaines de stockage et de serveurs accentue le besoin d’utiliser des solutions de hiérarchisation robustes afin de réduire les coûts et d’augmenter les performances. Les solutions de stockage hiérarchisé avancées qui étendent la portée de la hiérarchisation afin d’inclure les baies de stockage et les serveurs sont essentielles pour exploiter pleinement le potentiel de la hiérarchisation dans le cadre des datacenters modernes.

 

Dell est un acteur global de l’infrastructure et des nouvelles technologies, offrant un large portefeuille de produits qui répond à tous les besoins des datacenters modernes. L’architecture Dell Fluid Data est conçue pour optimiser le datacenter de façon automatique et intelligente en intégrant les meilleures technologies en matière de serveur, de système de stockage et de solution réseau afin de placer les données appropriées au bon endroit, au bon moment et au meilleur coût.

 

Dell peut optimiser vos investissements en matière de stockage dès aujourd’***. Contactez-nous pour en savoir plus sur la solution de stockage hiérarchisé intelligente et automatisée proposée par Dell.