A durabilidade dos SSDs nos 20 nm

A durabilidade dos SSDs nos 20 nm

Como reportei no meu artigo SLC, MLC e TLC: Por quê as memórias Flash estão ficando piores, a transição da memória Flash para técnicas mais avançadas de produção têm reduzido o custo por GB, mas em compensação tem trazido um efeito desagradável, que é uma redução noticiável nos ciclos de escrita, causada pela fragilização das células, que apresentam uma estrutura mais complexa e bem mais delicada que a dos transistores:

Enquanto os chips MLC de 50 nm suportavam 10.000 operações de escrita, os de 34 nm passaram a suportar apenas 5.000 e os de 25 nm apenas 3.000 ciclos. Os chips SLC também decaíram, mas no caso deles a redução têm sido bem menos significativa (já que pela célula armazenar apenas dois valores, o dano cumulativo demora bem mais tempo para se manifestar), permitindo que os fabricantes continuem produzindo chips com células capazes de suportarem 100.000 ciclos através de melhorias nas técnicas de fabricação.

Este problema na redução dos ciclos de escrita é ainda mais noticiável no caso dos chips TLC (que armazenam 3 bits por célula), o que têm feito os fabricantes adiarem o lançamento de SSDs baseados neles. Nos 20 nm os chips TLC ofereceriam apenas algumas centenas de ciclos, o que seria inadequado para qualquer tipo de SSD. 

De volta aos chips MLC, estamos assistindo à migração dos chips de 25 nm para os de 20 nm, que está trazendo preocupações similares às que tivemos na migração anterior, dos 35 nm para os 25 nm. No caso dos SSDs mainstream da Intel, temos chips de 25 nm usados no SSDs da série 330 e 20 nm nos novos drives da série 335. A grande vantagem da nova geração é a capacidade: a série 330 inclui modelos de 60, 120, 180 e 240 GB, enquanto a série 335 começa com um modelo de 240 GB, com perspectivas de lançamento de modelos de até 480 GB, uma vez que agora temos 8 ou 16 GB por die (16 ou 32 GB or chip), em vez de 4 ou 8 GB (8 ou 16 GB por chip) como na geração anterior:

Por serem baseados no mesmo controlador, o SandForce SF-2281, os drives de ambas as gerações oferecem um desempenho similar. De fato, as especificações técnicas da Intel trazem os mesmos números para ambas as famílias, com 500 MB/s de leitura sequencial, 450 MB/s de escrita sequencial, 42K IOPS em leitura randômica de blocos de 4KB e 52K IOPS em escrita randômica. Entretanto, em testes reais o desempenho das duas famílias é diferente, com o SSD 335 de 240 GB perdendo por uma pequena margem para os SSD 330, como pode ser visto neste teste do Anandtech. Tipicamente, uma nova família de drives chega ao mercado com um desempenho sutilmente inferior à da geração anterior (embora o fabricante sempre faça de tudo para tentar nos fazer acreditar que o desempenho é idêntico) que sobe eventualmente quando é lançada uma nova série com um controlador atualizado. Como comentei no primeiro artigo, estamos assistindo a uma corrida, onde os fabricantes de controladores estão investindo pesado em controladores mais avançados, capazes de mascarar a redução no desempenho dos chips de memória.

Mais do que uma pequena redução no desempenho, a questão realmente complicada é mesmo o número de ciclos de escrita e a curva de redução de desempenho conforme o drive envelhece nos drives com chips de 20 nm.

 

A Intel classificou os chips de 20 nm como suportando os mesmos 3.000 ciclos de escrita que a geração anterior, de 25 nm, ao contrário do que era anteriormente esperado, que seria algo em torno de 1500 ciclos. Isso pode ser atribuído a refinamentos nas técnicas de fabricação e na qualidade dos materiais usados, que a Intel foi implementando ao longo da produção dos chips de 25 nm e transplantou para a linha de 20 nm. Na verdade, a Intel vinha produzindo chips de 25 nm com células capazes de suportar até 6.000 ciclos (como foi comprovado em um teste do SSD 330 feito pelo Anandtech) e quando a transição para os 20 nm foi realizada, voltaram aos 3.000 ciclos originais. Em outras palavras, isso não elimina o fato de que as células MLC de 20 nm possuem uma durabilidade cerca de 50% menor que a da geração anterior, mas que pelo menos a Intel conseguiu fazer a lição de casa, melhorando a contagem de ciclos antes de fazer a transição. Caso os preços sejam similares, a geração antiga de drives de 25 nm são mais desejáveis que os novos, de 20 nm.

 

De uma forma geral, drives de maior capacidade amenizam a questão da durabilidade da memória Flash MLC, já que você tende a ocupar a maior parte do espaço com arquivos grandes, que serão substituídos com uma pequena frequência e continua a usar apenas alguns gigabytes com dados que são realmente substituídos com frequência. Em outras palavras, você continua subscrevendo mais ou menos o mesmo volume de dados, mas por ser maior o drive suporta um volume maior de ciclos de escrita e por isso a durabilidade final acaba sendo maior. Outra questão é que os fabricantes têm trabalhado freneticamente em algoritmos melhores de balanceamento e uso racional das células, bem como em novas ideias voltadas para a redução do número de operações de escrita, como o uso de chips de memória SLC como buffers para absorver operações repetidas de escrita, poupando os limitados ciclos das memórias MLC.

 

Naturalmente, isso não se aplica aos servidores, onde o volume de dados escritos é várias ordens de magnitude maior e muitas vezes é limitado apenas pelo próprio desempenho de escrita dos drives, mas no caso deles temos os drives SLC, que continuam oferecendo um volume de operações de escrita muito bom.

A boa notícia é que os SSDs não pifam de uma hora para a outra devido ao esgotamento dos ciclos de escrita das células. Na prática o que ocorre é que conforme as células envelhecem, a diferença de tensão entre os estados lógicos 1 e 0 decai e o controlador precisa de mais tempo para detectar qual é o bit armazenado e de muito mais tempo para gravar novos dados. Como resultado, você notará que o desempenho do drive começará a cair gradualmente (similar a vários defeitos nos drives magnéticos, que também “avisam” da falência do drive com uma queda noticiável no desempenho) até o ponto em que você resolver substituir o drive. Ao insistir no uso do drive, o controlador passará a marcar algumas das células como somente-leitura, permitindo que o restante do drive continue a ser usado para gravar novos dados, até o ponto em que todas as células sejam marcadas como somente-leitura. Nesse ponto hipotético, o drive ainda continuaria funcionando, com todos os dados acessíveis, mas naturalmente você não poderia mais usá-lo como drive de boot já que ele não suportaria mais a gravação de novos dados.

O envelhecimento do drive pode ser checado através de um parâmetro SMART, o Media Wearout Indicator (MWI), bem como através do Total NAND Writes, que armazena o total de dados escritos diretamente nos chips, em GB (excluindo os dados escritos em buffers pelo controlador). No caso dos drives da Intel por exemplo, eles podem ser acompanhados através do SSD Toolbox:

 

O MWI é representado através de uma contagem que começa em 100 e vai até zero, indicando a vida útil estimada do drive. É provável que o drive ainda continue funcionando por um bom tempo mesmo depois que o MWI chegar a zero (nas condições que expliquei nos parágrafos anteriores), mas naturalmente o fabricante não oferece nenhum tipo de garantia a partir daí. Em outras palavras, o MWI chegando a zero não é o fim, mas simplesmente uma indicação de que é hora de começar a pensar em outro drive.

De qualquer maneira, em situações normais de uso entretanto isso demoraria bastante para acontecer (pelo menos nos drives MLC de grande capacidade), já que em um SSD 335 de 240 GB (que suporta cerca de 2100 escritas completas no drive) você precisaria escrever 240 GB de dados todos os dias durante mais de 5 anos para esgotar o MWI.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X