SAN

Toda SAN tem como bloco de montagem HDs tradicionais, que são ligados a uma unidade controladora (que se encarrega do acesso aos dados, RAID e outras funções) e é ligada a um servidor através de uma interface dedicada, que pode ser tanto uma interface Fibre Channel quanto uma interface de rede Gigabit Ethernet ou 10 Gigabit Ethernet (usando o iSCSI). O servidor se encarrega então de distribuir os dados para os clientes da rede ou fornecê-los para aplicativos específicos, como no caso de um cluster de servidores web, que utilizam a SAN para armazenar um grande banco de dados usado para atender às requisições dos clientes.

Além da maior capacidade de armazenamento e de recursos de redundância, a principal diferença de uma SAN e um NAS ou um servidor de arquivos tradicional é que o SAN se comporta como se fosse uma única unidade de armazenamento, que o servidor pode acessar diretamente, de forma transparente. Ou seja, é como se você conectasse um único HD de 100 TB (por exemplo) no servidor, diferente de um NAS, que se comporta como um servidor de arquivos e pode ser acessado simultaneamente por vários clientes.

Apesar disso, na grande maioria dos casos, o objetivo de usar uma SAN não é simplesmente obter um grande espaço de armazenamento, mas sim obter ganhos de desempenho e de confiabilidade para aplicações críticas. Imagine o caso de um cluster de servidores responsáveis pelo site de um grande portal. As páginas são montadas a partir de um enorme banco de dados, armazenado na SAN, que é acessado de forma conjunta por todos os servidores do cluster. As unidades de armazenamento combinam um grande número de HDs em RAID, o que as torna capazes de atender a um grande volume de requisições por segundo, o que permite atender aos muitos visitantes simultâneos. Além do desempenho e do armazenamento centralizado, temos também a questão da redundância, que garante que o sistema funcione de forma contínua, sobrevivendo a falhas em componentes diversos.

Os componentes básicos de uma SAN são um ou storage racks (as unidades de armazenamento, com os arrays de discos), um switch Fibre Channel, os cabos e o servidor ao qual a SAN é conectada. Apesar disso, é comum o uso de dois switchs e dois servidores, de forma a oferecer um sistema redundante (o segundo servidor fica a postos para assumir o lugar o primeiro em caso de falha). Os componentes são ligados como na figura abaixo, de forma a garantir que o sistema continue funcionando caso qualquer um dos componentes falhe. O próprio array de discos é constituído por componentes redundantes, incluindo o uso de fontes e outros circuitos redundantes e RAID:

index_html_m49a92907

A principal vantagem do uso de uma SAN é que o sistema pode ser expandido conforme necessário, incluindo mais storage racks e mais switchs. Os diferentes arrays podem então ser acessados por diferentes servidores e, dependendo da configuração, até mesmo serem configurados para se comportarem como uma única unidade, com as capacidades somadas. Se dinheiro não for problema, é possível atingir facilmente a marca de 100 terabytes de espaço de armazenamento, com direito a um sistema de redundância completo.

O grande problema é mesmo a questão do custo, já que um SAN completa pode facilmente superar a marca dos US$ 50.000, em preços do exterior. Isso faz com que elas fiquem restritas a ambientes onde as vantagens compensam o maior custo. Para pequenas redes, servidores com diversos HDs (configurados como um array RAID) acabam sendo a melhor opção, já que podem oferecer um espaço de armazenamento similar ao de uma pequena SAN (embora com um desempenho e confiabilidade inferiores) a uma fração do custo.

index_html_1e882a5c
Storage rack com redundância

Continuando, é possível também que um único array seja dividido em várias unidades lógicas, cada uma com um identificador próprio (chamado de LUN, ou “Logical Unit Number”), permitindo que cada unidade possa ser acessada por um servidor diferente. Isso permite centralizar o armazenamento de dados da rede, armazenando todos os dados importantes na SAN, ao invés de utilizar HDs separados em cada servidor. As unidades podem ser inclusive redimensionadas durante o uso, realocando o espaço entre os servidores conforme necessário.

O Fibre Channel é um padrão de redes desenvolvido especialmente para uso de unidades remotas de armazenamento. Existem diversos padrões de Fibre Channel, que incluem o 1GFC (1.06 gigabits), 2GFC (2.12 gigabits), 4 GFC (4.25 gigabits), 8GFC (8.5 gigabits) e o 10GFC (10.5 gigabits), sendo que atualmente (início de 2008) os padrões mais usados ainda são o 2GFC e o 4GFC.

Existem três topologias de Fibre Channel: Ponto-a-ponto (dois dispositivos ligados diretamente), Arbitrated loop (onde os dispositivos são ligados uns aos outros, formando um anel) e Switched fabric (onde os dispositivos são ligados a um switch central, de forma similar ao que temos em uma rede de par trançado). Como pode imaginar a topologia Switched fabric é de longe a mais utilizada atualmente.

index_html_7dd09c2f
Switch Fibre Channel

Embora exista um padrão de Fibre Channel que utiliza fios de cobre, os cabos de fibra óptica são de longe os mais comuns. É possível utilizar cabos de fibra óptica de até 50 km, utilizando cabos monomodo, mas o mais comum é que sejam usados cabos multimodo (mais baratos e suficientes para a maioria das situações), que oferecem um alcance de até 300 metros. Tipicamente, os cabos são curtos, com de 2 a 10 metros, de forma que a questão do alcance raramente é um problema. As controladoras Fibre Channel são chamadas de FC HBA (Fibre Channel Host Bus Adapter).

index_html_m5501567a

index_html_c943325
Fibre Channel HBA e conectores de um cabo Fibre Channel LC/LC

Outra tecnologia, mais recente é o iSCSI (pronuncia-se “ai-iscâzi”) que permite que o cliente (chamado de initiator) envie comandos SCSI para um array de armazenamento (chamado de target) via TCP/IP, utilizando uma rede Ethernet tradicional. Isso permite que eles sejam sejam acessados como se fossem unidades de armazenamento local através de cabos de rede. Você pode pensar no iSCSI como um protocolo para encapsular comandos de acesso a disco, juntamente com os dados resultantes, transformando-os em pacotes TCP/IP.

A função é basicamente a mesma do Fibre Channel, ou seja, interligar os servidores aos arrays de discos que formam a SAN, mas nesse caso a um custo mais baixo, já que dispensa o uso dos caros switchs, controladores e cabos Fibre Channel, substituídos por cabos de rede e switchs Ethernet.

Abaixo temos uma controladora iSCSI Adaptec 7211C. À primeira vista ela parece uma placa de rede, incluindo o uso do conector RJ45, mas a presença do processador, chipset e chips de memória denunciam sua verdadeira função. As controladoras iSCSI (chamadas de iSCSI HBA) executam muito mais processamento que uma simples placa de rede e por isso incluem um volume muito maior de componentes. Quando instaladas, as controladoras iSCSI são vistas pelo sistema como controladoras de disco e não como interfaces de rede:

index_html_m3840ddcc

As funções da controladora SCSI podem ser também executadas via software (o software cliente é chamado de iSCSI initiator), o que permite utilizar uma placa de rede Ethernet regular no lugar da controladora iSCSI. O desempenho é naturalmente mais baixo, mas a redução no custo faz com que esta seja a opção mais usada em pequenas instalações. Com relação ao cabeamento, o ideal é que seja utilizado um segmento dedicado entre o servidor e os arrays de discos, mas o tráfego do iSCSI pode conviver com o tráfego Ethernet da rede, de forma que (embora não seja a solução ideal do ponto de vista do desempenho, nem da segurança) é possível simplesmente ligar os arrays em uma rede já existente, utilizando inclusive links de longa distância, o que permite a criação de sistemas de armazenamento remoto.

A popularização dos arrays iSCSI tornou as SANs muito mais acessíveis. Montar uma pequena SAN usando Fibre Channel custa, pelo menos, US$ 10.000 (em preços do exterior, sem contar os impostos) apenas em equipamento básico (o array de discos, o switch, as controladoras e os cabos), sem sequer incluir os HDs. Um array de discos iSCSI, por sua vez, pode ser ligado diretamente a uma placa gigabit Ethernet no servidor, o que torna possível montar uma pequena SAN utilizando apenas o array (os mais simples custam a partir de US$ 1500) e os HDs.

Aqui temos o iX8-RAID, um exemplo de array iSCSI de baixo custo. Ele permite o uso de até 8 HDs SATA, que podem ser usados em modo RAID 0, 10, 5, 50, 6 ou 60 e é conectado ao servidor através de um ou duas interfaces Gigabit Ethernet (a segunda é usada para redundância). Ele inclui um processador de Intel IOP 331 e 512 MB de memória, usada pra cache de disco e é administrado através de uma interface web. Mas, diferente de um NAS, ele não compartilha arquivos diretamente na rede. Depois de ligá-lo ao servidor, você instala o iSCSI initiator, que faz com que ele seja visto pelo servidor como uma unidade local. A partir daí, você pode formatar os discos e usar o espaço como quiser, inclusive criando compartilhamentos de rede:

index_html_1c70170f

index_html_m1ec422c9

Com 8 HDs, os modos RAID com melhor custo-benefício são os modos 5 e 6. Optando pelo RAID 5, você sacrifica o espaço equivalente a apenas um dos discos e tem segurança contra falha de qualquer um dos HDs. Melhor ainda, o sistema pode continuar funcionando normalmente, mesmo sem um dos HDs, já que a controladora é capaz de reconstruir os dados a partir dos códigos de paridade em tempo real.

A falha é reportada através do display frontal e através da interface web (opcionalmente, você pode configurar também o envio de avisos por e-mail) e a troca pode ser feita à quente, sem precisar desativar a SAN. Desde que dois HDs não falhem simultaneamente e que você não demore muito para trocar o HD defeituoso, todos os dados ficam protegidos. Existe ainda a opção de usar o modo RAID 6, onde dois dos HDs são sacrificados, dobrando o volume de bits de redundância e permitindo que o array resista à falha de dois dos HDs.

Hoje em dia é comum também o uso de servidores de armazenamento que oferecem diversas opções de interface de comunicação, já que isso adiciona relativamente pouco (proporcionalmente) ao custo. Eles podem ser tanto usados em uma SAN, conectados via iSCSI ou Fibre Channel quanto trabalharem ligados diretamente na rede, como um NAS. Nas fotos temos um StorMaster SNi-4020ez SAN NAS iSCSI Storage Server, um exemplo de storage rack de maior porte, que oferece as três interfaces e permite o uso de até 40 HDs (com mais dois HDs extra, instalados na parte traseira, usados pelo sistema operacional):

index_html_m176f9b12

index_html_m64947fd9

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X