Entendendo RAID

 

O sistema RAID (Redundant Array of Independent Disks) é usado para aumentar o desempenho e/ou a confiabilidade dos discos rígidos do sistema. Existem duas idéias básicas: divisão de dados (RAID0), para aumentar o desempenho, e espelhamento (RAID1), para aumentar a confiabilidade.

No RAID1 os dados de um disco são copiados para outro disco. Em um sistema com dois discos, os dados do segundo disco serão uma cópia exata dos dados do primeiro disco. Se o primeiro disco queimar, você terá os dados preservados, já que o segundo disco será um espelho do primeiro.

Já o RAID0 aumenta o desempenho do sistema de disco dividindo os arquivos entre os vários discos existentes. Por exemplo, em um sistema RAID0 com dois discos, um arquivo de 100 KB ao ser gravado no disco será dividido como sendo dois de 50 KB, aumentando o desempenho, já que é mais rápido gravar metade de um arquivo do que um arquivo inteiro.

O problema do sistema RAID0 é aumentar a sua confiabilidade, já que se um disco queima, todos os dados são perdidos. Vários sistemas RAID foram criados para aumentar a confiabilidade do sistema de divisão de dados, como o RAID3, que usa um disco rígido extra para armazenamento de informações de paridade e correção de erros, e o RAID5, que é similar ao RAID3 mas armazena as informações de paridade e de correção de erros dentro dos próprios discos do sistema, fazendo com que um disco extra não seja necessário. Note que no RAID5 as informações de paridade e de correção de erros são armazenadas nos discos “de dados”, diminuindo a capacidade de armazenamento neles disponível.

Se há algum erro de leitura, o sistema RAID automaticamente inicia uma operação de recuperação de dados, usando as informações de paridade e de correção de erros para recuperar o dado que está sendo lido.

Sobre o Sistema RAID5

O problema do RAID5 é que se um dos discos do sistema falhar no momento exato em que uma operação de recuperação de falhas estiver sendo executada, o sistema falha e há perda de dados, ou seja, o sistema não só não é capaz de recuperar o dado que gerou o processo de recuperação como também há perda de dados, pois um disco queimou.

Enquanto para sistemas RAID pequenos a probabilidade disso ocorrer é pequena, para grandes sistemas essa probabilidade não é tão remota assim. Veja na Figura 1 a probabilidade de falha do sistema RAID5 para três diferentes configurações. As configurações eram as seguintes:

•Caso 1: Sistema RAID5 com cinco discos de classe “enterprise” de 30 GB cada (total de 120 GB). Freqüência com que processos de recuperação de dados são necessários: 1 a cada 23 anos (em laranja no gráfico). Probabilidade de falha do sistema durante o processo de recuperação de dados: 0,12% (isto é, um erro a cada 834 operações de recuperação, em verde no gráfico).

•Caso 2: Sistema RAID5 com cinco discos de classe “desktop” de 300 GB cada (total de 1,2 TB). ). Freqüência com que processos de recuperação de dados são necessários: 1 a cada 2,3 anos (em laranja no gráfico). Probabilidade de falha do sistema durante o processo de recuperação de dados: 11% (isto é, uma a cada nove operações de recuperação, em verde no gráfico).

•Caso 3: Sistema RAID5 com 50 discos de classe “desktop” de 300 GB cada (total de 15 TB). Freqüência com que processos de recuperação de dados são necessários: 1 a cada 3 meses (em laranja no gráfico). Probabilidade de falha do sistema durante o processo de recuperação de dados: 70% (isto é, uma a cada duas operações de recuperação, em verde no gráfico).

•Como você pode ver, a probabilidade de perda de dados durante um processo de recuperação de dados aumenta tanto quando aumentamos a quantidade de discos quanto quando aumentamos a capacidade de cada disco.

 

Figura 1: Probabilidade de perda de dados em sistemas RAID5.

Vantagens do Sistema RAID6

O sistema RAID6 em vez de armazenar apenas uma informação de paridade e correção de erros, armazena duas, que são organizadas de tal forma que mesmo que um dos discos rígidos falhe (queime) durante um processo de recuperação de dados, o sistema continua operacional, não havendo perda de dados.

Para uma comparação da probabilidade de falha com perda de dados de sistemas RAID 0 (em azul), 5 (em amarelo a probabilidade de queima de disco e em rosa a probabilidade de falha do sistema) e 6 (em azul claro), observe a Figura 2.

 

Figura 2: Comparação entre RAID0, RAID5 e RAID6.

O eixo y do gráfico indica o número de meses até uma falha irrecuperável ocorrer, o eixo x indica a capacidade do sistema, em GB.

Como você pode ver pelo gráfico, o RAID6 só iguala em probabilidade de falha o RAID5 quando temos sistemas a partir de 23 TB, abaixo disso o sistema RAID6 apresenta uma probabilidade de falha muito inferior ao do RAID5, sendo a opção recomendada para sistemas onde confiabilidade seja a palavra-chave.

 

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *