Definição de MTBF

Por Carlos E. Morimoto. Há .

Duas informações que constam nas especificações dos HD e que são freqüentemente mal entendidas são o MTBF e o service life, que se destinam a dar uma idéia estimada da confiabilidade do HD.

MTBF significa "Mean Time Between Failures" ou "tempo médio entre falhas". A maioria dos HDs de baixo custo, destinados ao mercado doméstico, possuem MTBF de 300.000 ou 600.000 horas, enquanto os modelos high-end, ou destinados a servidores, normalmente ostentam um MTBF de 1.200.000 horas. Complementando temos o "service life" ou "component design life", que normalmente é de 5 anos.

Como era de se esperar, o service life indica o tempo de vida "recomendado" pelo fabricante. Como o HD é composto por componentes mecânicos, um certo desgaste é acumulado durante o uso, culminando na falha do HD. Um service life de 5 anos indica que o HD é projetado para durar 5 anos e que a grande maioria das unidades deve realmente resistir ao tempo especificado.

O MTBF, por sua vez, não é uma indicação do tempo de vida do HD, mas sim indica a percentagem de chance do HD apresentar defeito antes do final do service life. Se o service life é de 5 anos e o MTFB é de 600.000 horas, significa que existe uma possibilidade de 1.4% do seu HD apresentar defeito antes disso.

Parece complicado, mas na verdade não é tanto :). A idéia é que se você tivesse um datacenter com 1.000 HDs iguais, um deles pifaria em média a cada 600.000 horas somadas (somando os 1.000 HDs), ou seja a cada 25 dias, ao longo dos primeiros 5 anos de uso. Depois isso, você pode esperar que a taxa de mortalidade seja cada vez maior nos anos seguintes, embora um pequeno número dos HDs possa resistir a 10 anos de uso ou mais.

Outra forma de explicar seria que, se você substituísse seu HD por outro igual a cada 5 anos, aposentando os antigos, seriam necessárias (em média) 600.000 horas, ou seja, 68.4 anos para que você perdesse os dados por causa de falha em um dos HDs.

Ou seja, tudo gira em torno de possibilidades. Se você for "sortudo", mesmo um HD com MTBF de 1.200.000 horas pode pifar no primeiro mês de uso, da mesma forma que o HD de 200 reais do vizinho pode resistir durante 10 anos e ainda voltar a funcionar depois de removido o pó acumulado ;). O MTBF apenas serve como um indicativo da possibilidade de qualquer um dos dois extremos ocorrer.

Outra questão interessante é sobre como o MTBF é calculado, já que obviamente o fabricante não tem como realizar um teste de 5 anos antes de colocar um novo HD no mercado. Normalmente o número é calculado com base nos materiais e tecnologia usados na fabricação, simulações, dados estatísticos sobre outros modelos similares lançados anteriormente e, em geral, também um teste piloto de curta duração, usando algumas dezenas de unidades.

Complementando, temos também o "Start/Stop Cycles", ou seja, o número de ciclos de desligamento que o drive é projetado para suportar. Quando o HD é ligado, o motor de rotação precisa realizar um esforço maior que o habitual para acelerar os discos, o que acentua o desgaste. Nos HDs antigos, onde ainda não são utilizadas rampas para estacionar as cabeças de leitura, existe também o desgaste causado pelo atrito das cabeças ao tocar a landing zone a cada desligamento.

Contam não apenas o número de vezes em que o micro é desligado, mas também o número de vezes que o HD entra em modo de economia de energia. Os HDs atuais normalmente são projetados para suportarem 50.000 ciclos, de forma que este normalmente não é um problema dentro do uso normal.

Tenha apenas o cuidado de não configurar o tempo de desligamento do HD com valores muito agressivos, como de 1 em 1 minuto por exemplo. Se o HD precisar acelerar 30 vezes por hora, pode ter certeza de que isso poderá levar a uma falha prematura mais cedo ou mais tarde. :)

Como sempre, estamos falando sobre probabilidade e não sobre dados infalíveis. Um exemplo histórico são os IBM Deskstar 75GX que, devido a um conjunto de problemas de projeto, possuíam uma taxa de mortalidade assustadoramente alta, embora possuíssem um MTBF de 500.000 horas. O caso foi tão grave que acabou dando origem a uma ação coletiva por parte dos usuários afetados, que levou a um recall dos drives. Pouco depois a IBM decidiu sair do ramo de produção de HDs, vendendo toda a divisão para a Hitachi.

Como de praxe, a única forma de se proteger contra falhas é fazer backups regulares. Existe ainda a opção de utilizar um sistema RAID 1, onde temos dois HDs e o segundo armazena uma cópia atualizada do conteúdo do primeiro. O RAID não substitui o backup, mas evita que seu servidor ou máquina de trabalho fique fora do ar enquanto você restaura os dados.

Veja também
Um toque de elegância: a história do exclusivo PS1 dourado produzido pela Sony em 1996
Um toque de elegância: a história do exclusivo PS1 dourado produzido pela Sony em 1996
Artigos
Seu Jorge usa fone de ouvido que purifica o ar e viraliza nas redes; mas será que funciona?
Seu Jorge usa fone de ouvido que purifica o ar e viraliza nas redes; mas será que funciona?
Notícias
Propaganda em todo lugar! Uber mostrará anúncios antes das corridas no Brasil
Propaganda em todo lugar! Uber mostrará anúncios antes das corridas no Brasil
Notícias
The Crew: Americanas faz promoção de game que não funciona mais
The Crew: Americanas faz promoção de game que não funciona mais
Games
Pesquisa revela que jovens estão trocando os consoles por dispositivos portáteis
Pesquisa revela que jovens estão trocando os consoles por dispositivos portáteis
Games
Qualcomm lança processadores Snapdragon X Elite e Plus para notebooks
Qualcomm lança processadores Snapdragon X Elite e Plus para notebooks
Hardware
true