DAS, NAS e RAID
Quando você precisa de mais espaço de armazenamento no seu micro de trabalho, a opção mais comum é simplesmente comprar outro HD. Quando falamos em redes, entretanto, três siglas vêm à tona: NAS, DAS e SAN, acompanhadas geralmente por longas discussões sobre qual das três é mais adequada a determinada situação. Pode parecer estranho que uma grande empresa pague 50.000 dólares para implementar uma SAN, que oferece apenas alguns terabytes de espaço de armazenamento, quando seria possível obter o mesmo espaço usando um punhado de HDs comuns instalados em um servidor de arquivos, mas, como de praxe, existem fatores que justificam o investimento em muitas situações. Vamos então a uma explicação sobre as três tecnologias, começando com a mais simples: DAS.
A sigla DAS é abreviação de “Direct Attached Storage”. Ela se refere a dispositivos de armazenamento externo ligados diretamente ao servidor (ou a qualquer outro micro da rede), como no caso das gavetas de HD ligadas a portas eSATA (o eSATA é uma versão externa das portas SATA, que mantém a mesma velocidade de 150 ou 300 MB/s, mas permite o uso de um cabo externo) ou a portas USB, por exemplo.
Além de gavetas e suportes baratos para ligar HDs externos, a lista inclui dispositivos mais caros. Nas fotos a seguir temos dois exemplos. O primeiro é uma gaveta de HD simples, ligada em uma porta USB e o segundo é uma unidade eSATA da Micronet, que utiliza 5 HDs, com RAID via hardware e outras funções. Apesar da diferença de complexidade, temos em ambos os casos unidade externa ligada à uma porta USB ou eSATA, que não tem nada a ver com redes:
Um NAS (Network Attached Storage), por sua vez, roda um sistema operacional completo e funciona como um servidor de arquivos, ligado diretamente na rede.
Muitas vezes, eles são chamados de “network storage”, ou simplesmente de “storage”, termos que são mais descritivos para o público não técnico do que “NAS”. Entre o público técnico, eles são também chamado de “filers” (arquivadores). O termo “storage” é na verdade um termo técnico genérico para soluções de armazenamento, que é usado também em outras situações, como no caso das SANs.
Existem muitas opões de NAS, que vão desde sistemas baratos, que custam pouco mais que uma gaveta USB, até equipamentos caros, que utilizam um grande número de HDs. Os modelos mais baratos comportam apenas um ou dois HDs e oferecem apenas funções básicas. Alguns modelos incluem também um transmissor wireless ou disponibilizam uma porta USB, o que permite que sejam ligados ao PC diretamente e seja usados como um DAS. Modelos intermediários suportam em sua maioria 4 drives e modelos high-end ou racks para uso em datacenters suportam muitas vezes 8 drives ou mais.
Os modelos com apenas um HD são genericamente chamados de single-drive e os que utilizam dois ou mais são chamados de multi-drive. Alguns modelos são vendidos sem os drives, que forma que você pode instalar os HDs que quiser (eles são chamados de “diskless”) e são geralmente bem mais baratos, enquanto muitos fabricantes optam por vender os aparelhos com drives pré-instalados (chamados genericamente de “diskfull”), de forma a tentar agregar valor e trabalhar com margens de lucro um pouco maiores. Ao ver o anúncio de um “diskless NAS” no catálgo de alguma loja do exterior, por exemplo, você pode presumir que se trata de um modelo sem os HDs.
Um exemplo de NAS é Buffalo TeraStation Pro II, que permite o uso de 4 discos, que podem ser configurados em modo RAID 0, 1, 10 ou RAID 5. Originalmente ele vinha com 4 drives de 250 GB (daí o nome), mas logo foram lançadas versões atualizadas, com drives de 500 GB, 750 GB e 1 TB, totalizando até 4 GB de espaço de armazenamento:
O mostrador frontal exibe informações básicas, como o endereço IP usado pelo servidor, o status da conexão e a configuração dos discos, mas a configuração em si é feita remotamente, através da interface de administração via navegador. É através dela que você escolhe qual modo RAID será usado, altera a configuração de rede do NAS, cria os compartilhamentos de rede, executa operações administrativas (como realizar testes de superfície nos HDs ou recuperar o array RAID em caso de falha em um dos discos) e assim por diante:
O uso da interface web não é uma exclusividade do TeraStation, muito pelo contrário. Quase todos os modelos de NAS disponíveis são configurados via navegador, com alguns poucos modelos demandando o uso de um software cliente, ou sendo configuráveis apenas via linha de comando (via SSH ou Telnet).
Via de regra, um NAS não faz nada que um PC tradicional não possa ser configurado para fazer. Um número surpreendente deles utilizam processadores x86, rodam Linux e compartilham os arquivos com a rede utilizando o Samba. Ou seja, nada mais são do que PCs compactos, otimizados para a tarefa.
A principal vantagem é que eles são soluções prontas, que podem ser instaladas rapidamente, sem exigir muitos conhecimentos técnicos, o que os torna ideais para uso em escritórios e redes domésticas, por exemplo. Os modelos mais simples são bem mais baratos que um PC, além de serem menos compactos e consumirem menos energia, enquanto os modelos mais caros oferecem mais espaço de armazenamento, recursos de redundância e de gerenciamento que permitem o uso em redes que demandam um maior nível de confiabilidade.
Existem ainda distribuições Linux ou BSD que permitem transformar um PC comum em um NAS de forma prática. Um bom exemplo é o FreeNAS (baseado no FreeBSD), que pode ser instalado de forma simples, ocupando apenas 32 MB, e é inteiramente administrado através de uma interface de gerenciamento via web, sem precisar de monitor. Ele suporta o uso de RAID, compartilhamentos via CIFS (Samba), FTP, NFS e SFTP, além de oferecer um grande volume de recursos de gerenciamento. Você pode baixá-lo no http://www.freenas.org. Outro projeto similar é o OpenFiler, disponível no http://www.openfiler.com.
Com a adoção do WPA2, os pontos de acesso wireless passaram a utilizar controladores muito mais poderosos, de forma a oferecerem suporte à encriptação usando o AES. Muitos fabricantes passaram então a incluir funções de compartilhamento de arquivos, permitindo que o ponto de acesso funcione como um NAS simples, compartilhando pastas em um pendrive ou HD externo, instalado em uma porta USB. Em geral, eles são muito mais limitados que um NAS “de verdade”, a começar pelo fato de suportarem um único pendrive ou HD e oferecerem poucas opções de configuração. Apesar disso, eles podem ser uma opção interessante em algumas situações, já que a inclusão do recurso adiciona muito pouco no custo do aparelho.
Um exemplo é o Linksys WRT600N, que apresenta uma porta USB escondida ao lado do conector da interface WAN (onde você ligaria o cable modem ou o modem ADSL, de forma a compartilhá-lo com a rede). Ao instalar um pendrive ou HD USB, você pode criar compartilhamentos através da opção “Storage” da interface de administração. Os recursos são incrivelmente limitados (não é possível sequer alterar o grupo de trabalho), mas a função básica está presente:
Em muitas situações, entretanto, usar um NAS não é suficiente. Muitas empresas precisam de volumes gigantescos de espaço de armazenamento, que deve não apenas oferecer um desempenho muito bom, mas também incluir backup dos dados e redundância.
De acordo com a escala necessária, usar um único servidor, com HDs SATA regulares seria a solução mais barata, já que muitas placas-mãe possuem até 10 portas SATA (e você poderia adicionar mais portas instalando controladoras adicionais), de forma que, você poderia simplesmente instalar 10 HDs SATA de 1 TB e contar assim com um total de 10 TB de armazenamento.
Usando o Samba você não gastaria nada com o software, que forma que, além da mão de obra, o custo de resumiria ao preços dos HDs e dos demais componentes escolhidos e usando um array RAID você poderia sacrificar parte do espaço de armazenamento para melhorar o desempenho e a confiabilidade. De acordo com o número de HDs disponíveis e o recursos oferecidos pelo sistema operacional usado, os modos RAID disponíveis são:
RAID 0 (Striping): No RAID 0 todos os HDs passam a ser acessados como se fossem um único drive. Ao serem gravados, os arquivos são fragmentados nos vários discos, permitindo que os fragmentos possam ser lidos e gravados simultaneamente, com cada HD realizando parte do trabalho. Isso permite melhorar brutalmente a taxa de leitura e de gravação e continuar usando 100% do espaço disponível nos HDs. O problema é que no RAID 0 não existe redundância. Os HDs armazenam fragmentos de arquivos, e não arquivos completos. Sem um dos HDs, a controladora não tem como reconstruir os arquivos e tudo é perdido. Isso faz com que o modo RAID 0 seja raramente usado em servidores.
RAID 1 (Mirroring): No RAID 1 são usados dois HDs (ou qualquer outro número par). O primeiro HD armazena dados e o segundo armazena um cópia exata do primeiro, atualizada em tempo real. Se o primeiro HD falha, a controladora automaticamente chaveia para o segundo HD, permitindo que o sistema continue funcionando. Em servidores é comum o uso de HDs com suporte a hot-swap, o que permite que o HD defeituoso seja substituído a quente, com o servidor ligado. A desvantagem em usar RAID 0 é que metade do espaço de armazenamento é sacrificado.
RAID 10 (Mirror/Strip): Este modo combina os modos 0 e 1 e pode ser usado com a partir de 4 HDs (ou outro número par). Metade dos HDs são usados em modo striping (RAID 0), enquanto a segunda metade armazena uma cópia dos dados dos primeiros, oferecendo redundância.
RAID 5: Este é o modo mais utilizado em servidores com um grande número de HDs. O RAID 5 usa um sistema de paridade para manter a integridade dos dados. Os arquivos são divididos em fragmentos e, para cada grupo de fragmentos, é gerado um fragmento adicional, contendo códigos de paridade. Os códigos de correção são espalhados entre os discos. Dessa forma, é possível gravar dados simultaneamente em todos os HDs, melhorando o desempenho.
O RAID 5 pode ser usado com a partir de 3 discos. Independentemente da quantidade de discos usados, sempre temos sacrificado o espaço equivalente a um deles. Em um NAS com 4 HDs de 1 TB, por exemplo, você ficaria com 3 TB de espaço disponível, em um servidor com 10 HDs de 1 TB, você ficaria com 9 TB disponíveis e assim por diante. Os dados continuam seguros caso qualquer um dos HDs usados falhe, mas se um segundo HD falhar antes que o primeiro seja substituído (ou antes que a controladora tenha tempo de regravar os dados), todos os dados são perdidos. Você pode pensar no RAID 5 como um RAID 0 com uma camada de redundância.
RAID 6: O RAID 6 dobra o número de bits de paridade, eliminando o ponto fraco do RAID 5, que é a perda de todos os dados caso um segundo HD falhe. No RAID 6, a integridade dos dados é mantida caso dois HDs falhem simultaneamente, o que reduz brutalmente as possibilidades matemáticas de perda de dados.
A percentagem de espaço sacrificado decai conforme são acrescentados mais discos, de forma que o uso do RAID 6 vai tornado-se progressivamente mais atrativo. No caso de um grande servidor, com 20 HDs, por exemplo, seria sacrificado o espaço equivalente a apenas dois discos, ou seja, apenas 10% do espaço total. O maior problema é que o RAID 6 exige o uso de algoritmos muito mais complexos por parte da controladora, de forma que ele não é suportado por todos os dispositivos.
JBOD: No JBOD (Just a Bunch Of Disks) os HDs disponíveis são simplesmente concatenados e passam a ser vistos pelo sistema como um único disco, com a capacidade de todos somada. Os arquivos são simplesmente espalhados pelos discos, com cada um armazenando parte dos arquivos (nesse caso arquivos completos, e não fragmentos como no caso do RAID 0). No JBOD não existe qualquer ganho de desempenho, nem de confiabilidade, ele é apenas uma forma simples de juntar vários HDs de forma a criar uma única unidade de armazenamento. Ele não é uma boa opção para armazenamento de dados importantes, mas pode ser usado para tarefas secundária, como no caso de servidores de backup.
O uso de um NAS, ou de um servidor de arquivos com vários HDs atende bem à maioria das redes de pequeno e médio porte. Entretanto, muitas empresas precisam de muito mais do que 10 TB de espaço de armazenamento, sobretudo quando falamos em grandes bancos de dados e aplicações web. Usar vários pequenos servidores seria uma solução barata, mas em compensação complexa e mais propensa a falhas. Surge então a opção de usar uma SAN (Storage Area Network).
Deixe seu comentário