Entenda tudo sobre RAID

Quem trabalha com armazenamento de dados e segurança da informação certamente já deve ter se deparado com o termo RAID em algum momento. Porém, embora alguns cheguem a utilizar os seus conceitos, nem todos sabem exatamente o que é RAID e quais são os tipos de RAID que existem.

Como tudo na vida, compreender o funcionamento desse mecanismo é importante para descobrir tudo o que esse sistema é capaz de proporcionar.

Nesse Post, vamos explicar em detalhes para você não apenas o conceito, mas também quais são os diferentes tipos de RAID que existem. A ideia é bastante simples e depois de entender o que significa cada item fica mais fácil compreender a lógica do seu funcionamento.

O que é RAID?

RAID é uma sigla em inglês para Redundant Array of Inexpensive Disks. Em tradução direta, o termo quer dizer algo como Matriz Redundante de Discos Independentes.

Ficou ainda mais perdido? Calma. Traduzindo essa informação: trata-se da combinação de vários discos rígidos, os populares HDs, de maneira que eles formem uma única unidade lógica. Dessa forma, os mesmos dados que são armazenados em um disco estão disponíveis em outro.

Em outras palavras, quando vários HDs funcionam como se fossem um só, temos uma RAID. E por que isso é útil? Em caso de falhas em um disco, os demais vão continuar em funcionamento, evitando que as informações se percam ou que haja interrupção no acesso aos dados. Assim, podemos dizer que o RAID proporciona mais segurança e mais desempenho. Ele pode funcionar como um mecanismo de redundância, por exemplo.

Quais são os tipos de RAID que existem?

Existem vários tipos de RAID que podem ser realizados com discos de armazenamento. Cada um tem uma finalidade distinta. Alguns são mais focados em desempenho enquanto outros em segurança. Não há uma escolha “certa” a se fazer, uma vez que cada ocasião e circunstância vai pedir uma decisão diferente. Em linhas gerais, temos os seguintes RAIDs:

RAID 0

A divisão de dados consiste em usar um disco extra em paralelo para armazená-los, dividindo a informação através dos dois HDs disponíveis. Sua vantagem está no fato de ser possível ler e gravar o dobro de informações ao mesmo tempo, assim diminuindo o tempo de operação quase pela metade. Tal esquema é a base do RAID 0. Vamos exemplificar o seu funcionamento através do seguinte exemplo. Suponha que o seu computador tenha um único disco rígido e você deseja que o dobro de dados seja transmitido ao mesmo tempo.

No RAID 0, um novo disco é utilizado em paralelo com o já existente, dividindo o conteúdo entre os dois HDS. Suponha que uma palavra seja formada pelos caracteres A1A2…A7A8. Neste mecanismo, nós mandaríamos os caracteres com final ímpar, para o disco 0 e com o final par para o disco 1. O resultado pode ser conferido na ilustração ao lado.

Tanto na leitura e na escrita em uma posição qualquer, ela será acessada em ambos os discos ao mesmo tempo. Isso faz com que dois dados sejam lidos ou escritos no mesmo momento, dobrando a taxa de leitura ou gravação. Logo, se a taxa de transferência era de 100 MB/s, ela passaria a trabalhar como 200 MB/s. As principais desvantagens deste método são o custo adicional do HD extra e o fato de que um erro em um disco compromete toda a informação armazenada.

Vantagens:

Muito rápido para acessar a informações
Tem custo baixo em expansão de memória

Desvantagens:

Não tem espelhamento
Não faz paridade de dados
Caso alguns dos setores do HD apresente falha, o arquivo que está dividido pode se tornar irrecuperável

RAID 1

A replicação, como seu próprio nome indica, faz com que dois ou mais discos possuam exatamente o mesmo conteúdo, tornando um cópia idêntica do outro. Assim, sempre haverá um backup pronto para ser utilizado. Consequentemente é necessário também duplicar o hardware utilizado. Tal esquema é a base do RAID 1.

Suponha que por algum motivo um computador apresente perdas de dados em seu disco rígido. Com o RAID 1, um segundo disco seria usado paralelamente ao primeiro, funcionando como cópia idêntica. Em uma escrita, os dados necessitam ser modificados nos dois discos ao mesmo tempo. Por exemplo, a palavra A1A2A3A4 ficaria armazenada do mesmo modo em ambos HDs.

Assim a taxa de transferência de dados continuaria a mesma, mas o espaço utilizado seria o dobro do real, pois um disco rígido de 250 MB exigiria outra cópia idêntica de 250 MB.

RAIDs que trabalham com paridade

Duplicar um disco inteiro como backup pode não ser uma ótima opção, principalmente se a sua máquina utiliza vários Hds ao mesmo tempo. Por isso, os mecanismos de RAID 3 até o RAID 6 efetuam cálculos de paridade de uma mesma posição em todos os discos e armazenam o resultado em um novo disco. Dependendo do RAID utilizado, o esquema de paridade varia um pouco, mas o princípio continua o mesmo. Em seguida, um novo cálculo de paridade é efetuado. Caso os resultados obtidos sejam distintos, significa que algum bit está incorreto. A figura abaixo exemplifica o esquema, reapresentando o RAID 4.

Vantagens:

Segurança nos dados (com relação a defeitos do HD)
Caso algum setor falhe, você consegue recuperar copiando os arquivos de outro HD

Desvantagens:

Não é usada paridade
Escrita é mais demorada
Custo mais alto em relação ao RAID 0

RAID 5

Necessita de no mínimo 3 discos para ser implementado. Ao contrário do RAID 1 que utiliza metade dos discos para manter cópias completas, no RAID 5 independente do número de discos contidos no arranjo, é utilizado o espaço equivalente a apenas um dos discos para manter a redundância através de bits de pariedade que são distribuídos alternadamente entre todos os discos do arranjo. Caso qualquer um dos discos venha a falhar, a controladora é capaz de calcular e recuperar em tempo real os dados contidos no disco defeituoso, permitindo assim que o sistema continue operando mesmo sem um dos discos.

A paridade funciona de uma maneira muito simples. Para cada grupo de bits é gerado um bit adicional que pode ser par ou impar dependendo do número de bits contido no grupo.

Para entender melhor como tudo funciona vamos tomar como exemplo um Arranjo de 5 HDs. Neste caso temos 1 bit adicional para cada 4 bits de dados, se tivéssemos 6 HDs no arranjo então teríamos 1 bit adicional para cada 5 bits de dados e assim por diante. O nome “calculo de pariedade” vem do fato do bit adicional ser 0 caso haja um número par de “bits 1” no grupo e 1 caso tenha um numero impar de “bits 1”.

Vantagens:

Mais rápido pra identificar erros
Leitura rápida

Desvantagens:

Escrita lenta
Sistema de controle de discos mais complexo

Entenda tudo sobre RAID