Logo Hardware.com.br
Patrick Gilmore
Patrick Gilm... Membro Senior Registrado
191 Mensagens 8 Curtidas

Relatório: Morte de discos rígidos

#1 Por Patrick Gilm... 12/01/2008 - 19:28
Essa é uma pesquisa feita internamente pela Google, observaram por meses uma população de 100.000 HDs a suas falhas, tirando várias conclusões interessantes, sobre probabilidade de falhas e correlação com os alertas SMART:

http://labs.google.com/papers/disk_failures.pdf

(Precisa do Adobe Reader pra ler o arquivo - textos em inglês)

Eles mencionam que teve diferenças marcantes entre vários fabricantes na taxa de falhas de HDs, mas infelizmente eles não mencionam nomes para não ter problemas.

Tentando resumir as conclusões da pesquisa para quem não quer ler:

- Após o segundo ano de vida do HD a probabilidade de falha quadruplica.

- A utilização do HD influencia menos que o esperado; a alta utilização só aumenta sensivelmente a taxa de falhas nos 6 primeiros meses e após o 5º. ano de uso.

- A temperatura também influencia menos que o esperado. A longo prazo a melhor temperatura de operação é entre 30-40 graus. Tanto acima quanto abaixo dessa tempo aumenta a taxa de falhas.

E analisando a significância dos dados do SMART:

- Após o primeiro Scan Error (Raw Read Erro Rate) a chance de um HD falhar nos próximos 60 dias aumenta pelo fator 39.

- Após o primeiro Reallocation Count chance de um HD falhar nos próximos 60 dias aumenta pelo fator 14.

- Após o primeiro Offline Realocation chance de um HD falhar nos próximos 60 dias aumenta pelo fator 21.

- Após o primeiro Pending Sector chance de um HD falhar nos próximos 60 dias aumenta pelo fator 16.

- E mais...

Mesmo assim é importante ressaltar que usando o SMART só daria pra predizer cerca de dois terços das falhas. O outro terço ocorreu sem indicação prévia de falha iminente.

Como fazer para ver o log de avisos do sistema onde também se encontram as mensagens de erros do disco:

No Windows XP ou 2000, clique direito em Meu Computador > Gerenciar > Ferramentas de Sistema > Visualizar Eventos > Sistema.

Lá aparecem todos os avisos. Podemos agora filtrar as mensagens para só ver os erros graves: Clique direito na lista (ou em cima da aba Sistema) e vá em > Exibir > Filtro. No menu que se abre desmarque todas as caixas exceto Erros e confirme.


Só para não causar pânico: Bad block não é necessariamente sinal de HD que está indo pro saco, pode ser uma falha localizada, causada por diversos fatores. Só quando começarem a aparecer vários em curto espaço de tempo que está na hora de salvar todos os dados.

Então é isso, o que ajuda a prever erros é o SMART, aquela série de estatísticas que os HDs vão fazendo e que podem apontar uma falha iminente. Tem vários utilitários que conseguem ler esses dados.
Patrick Gilmore
Patrick Gilm... Membro Senior Registrado
191 Mensagens 8 Curtidas
#4 Por Patrick Gilm...
12/01/2008 - 20:08
Acho que uma coisa é certa, os HDs da Maxtor certamente são os que mais devem dar defeito. Nunca vi HD tão reclamado por aí. Já devem ser produzidos com defeito de fábrica, mais propensos a falhas.

Que nem os DVD players da Gradiente. big_green.png

Acho que os HDs da Samsung são os melhores, além de silenciosos e baratos. Seagate nunca usei.

Aqui o meu PC vive ligado direto, uso um HD Samsung há 3 anos, e nunca tive problemas. Quer dizer, já vi mensagens de erro CRC (verificação cíclica de redundância) aparecerem umas 3 ou 4 vezes, e o arquivo não podia ser copiado de um HD a outro, ou senão, aparentava estar com defeito em certas áreas.

Ex: um vídeo em DiVX em que um bloco de 2 minutos não pode ser lido pelo tocador. Mas o que vem antes e depois pode ser lido normal.

Mas eu acho que sei a causa disso - falta de desfragmentar. Eu baixo todo dia 1/2 GB de arquivos, assisto, apago, e isso milhares de vezes, o HD deve estar fragmentadíssimo. Acho que não libero mais de 20 % de espaço há uns 2 anos (isso pq o Defrag exige 15% ou mais de espaço pra rodar direito).

Além disso, soube que o erro de CRC pode aparecer, por exemplo, por causa de cabo IDE ruim. Pode haver corrupção de dados por causa de um cabo defeituoso (ao gravar grava errado então ao ler aparece o erro de CRC). Trocando o cabo não daria pra recuperar os arquivos afetados, mas não apareceriam mais erros novos.

Quando eu liberar espaço vou tentar esse aqui, é melhor que o Defrag do Windows (desfragmenta vários discos ao mesmo tempo e é mais rápido):

http://www.oo-software.com/home/en/products

E é certo que os ciclos de liga e desliga vão causando fadiga material por causa do aquece-esfria-aquece-..., mas o que tem se mostrado um dos principais culpados para a morte de componentes é a temperatura (não tô falando de superaquecimento).

Quanto mais alta a temperatura de operação, mais provavel fica uma falha. Válido especialmente para HD.
Vitor Machado
Vitor Machad... General de Pijama Registrado
4.6K Mensagens 72 Curtidas
#7 Por Vitor Machad...
12/01/2008 - 20:21
Patrick Gilmore disse:
Acho que uma coisa é certa, os HDs da Matrox certamente são os que mais devem dar defeito. Nunca vi HD tão reclamado por aí.
Acho que você quis dizer Maxtor.

EDIT: Só como curiosidade, Matrox também existe, mas é uma fabricante de placas-de-vídeo e acessórios.

Interessante essas informações, mas realmente é uma pena não ter os fabricantes...
[Essa conta não será mais utilizada]
Patrick Gilmore
Patrick Gilm... Membro Senior Registrado
191 Mensagens 8 Curtidas
#8 Por Patrick Gilm...
12/01/2008 - 20:52
Isso que dá só pensar em placa de captura. big_green.png

Eu achei o texto da notícia em português, que tá fazendo um ano:
http://br-linux.org/linux/estatisticas-falhas-discos-rigidos

Google divulga estatísticas sobre falhas e manutenção de discos rígidos

Quando se procura estatísticas sobre consumo e manutenção de carros, o melhor é usar como fonte quem gerencia uma grande frota, e não quem vende ou fabrica os veículos, certo?

E na hora de buscar estatísticas sobre durabilidade e manutenção de discos rígidos, que fonte poderia ser melhor do que o Google, que tem centenas de milhares de micros, e usa HDs "comuns" (SATA ou não, de 80 a 400GB, de 5400 a 7200rpm) neles?

A boa notícia é que o Google vem mesmo coletando dados sobre esta questão, e os disponibilizou em um recente relatório. A má é que os dados demonstram algumas correlações que são bem diferentes do que esperaríamos.

Por exemplo, os dados do Google demonstraram que 56% dos casos que demandaram substituição do HD não foram detectados previamente pela tecnologia SMART (implementada pelos fabricantes do HD justamente para gerar este tipo de alerta antecipado - você pode usá-la no Linux com o comando smartctl), que a taxa de falha não é proporcional ao índice de uso do HD (exceto no caso dos HDs muito novos ou muito velhos), e que há menos correlação entre temperatura de operação e incidência de falhas do que se imaginava (na verdade, há até um pouco mais de falha nos HDs mantidos mais refrigerados), e que de fato há correlação clara do número de falhas com a idade (e não o uso), o modelo e o fabricante do HD, embora o estudo não revele quais as marcas e modelos campeãs.
koldUn
koldUn Super Participante Registrado
833 Mensagens 4 Curtidas
#11 Por koldUn
14/01/2008 - 11:12
Muito boa a informação do tópico, aqui no trabalho fiz o procedimento e no visualizar eventos só constam 02 erros como "Disco" e consta a descrição abaixo:

"A estrutura do sistema de arquivos está corrompida e inutilizável. Execute o utilitário chkdsk no volume F:."

Mais tarde vou fazer uma checagem em casa para ver a situação do hd...
[Q6600 2.4GHz]-[Intel 975XBX2]-[8GB DDR2 800]-[Zogis 9600GT-512MB DDR3]-[320G/500GB SATA II]-[7Team 620W]-[Kubuntu__10.10_64 bits/XP_sp3]-[Linux User: 491323]-[Ubuntu User: 28977]
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#12 Por Penitante
07/04/2009 - 05:20
Sobre morte de HDs, um questionamento que eu ia fazer em outro tópico, mas vou aproveitar esse:

Uma das primeiras resenhas colocadas na página do HD de 2 TB/Western Digital (modelo WD20EADS) da Newegg me chamou atenção, vou reproduzir aqui pois em síntese, o cara fala algo que eu já vinha suspeitando, de possíveis limitações da tecnologia ao usar capacidades maiores.

Tivemos aí o Samsung de 1 TB, o Seagate de 1.5 TB (ambos com inúmeras reclamações de bugs/problemas), e o próprio HD de 2 TB não é muito bem aceito, dizem que seria mais lento (o que acaba sendo um contra, principalmente em quem mexe com vídeos/aplicativos que exigem um HD mais rápido, pelo menos a par com os 7200 RPM que proliferam no mercado).

O comentário:

Pros: Good capacity....

Cons: High capacity...

Other Thoughts: High capacity drives come at the cost of volatility. When seagate released the 1.5 TB drive, I was skeptical. As a physicist, I know that capacity is limited by technology, and while miniaturization is moving quite quickly, there is still a physical capacity, regardless. with magnetic storage this dense, one slight error by the head will corrupt the file, and repeated events - all of your files.

While the storage, and other perks from reviews already posted, are pretty good, I don't see these drives having a long lifetime, and most definitely wouldn't use them in high volume and mission critical environments.

I'll stick with my 1TB drives until these have been on the market for a good amount of time. Call me a skeptic, but I'd like to think that I didn't spend an obscene amount of time in school for nothing.
Fiz uma tradução livre do inglês acima:

Prós: Boa capacidade...

Contras: Alta capacidade...

Outros comentários: Discos de alta capacidade existem ao custo de volatilidade. Quando a Seagate lançou o modelo de 1.5 TB, eu estava cético. Como físico, eu sei que a capacidade é limitada pela tecnologia, e conquanto a miniaturização está bem avançada, ainda existe a capacidade física, entretanto.

Com armazenagem magnética à essa densidade, um pequeno errinho no cabeçote (OBS do tradutor: não sei se é cabeça/cabeçote do disco rígido) irá corromper o arquivo, e em repetidos eventos - todos os seus arquivos.

Embora a armazenagem, e outros comentários de resenhas já postadas sejam bons/animadores, eu não vejo esses HDs tendo um longo ciclo de vida, e definitivamente não usaria eles em alto volume e ambientes com tarefas críticas.

Eu vou ficar com os drives de 1 Terabyte até que esses tenham estado no mercado por um bom tempo. Me chame de cético, mas eu gostaria de pensar que não gastei uma obscena quantidade de tempo na escola por nada.
Sobre os HDs pifando, algumas pessoas relataram que o de 1 TB da Samsung (curiosamente apontado em resenhas como o melhor nessa capacidade) por ex. morria vários mêses após a compra, o que seria péssimo por ser algo totalmente imprevisível.

De HDs tenho dois antigos, um Samsung IDE de 160 GB e um SATA normal de 300 GB da Seagate, acho que cada um deve ter uns 5 anos, nunca tive problemas. E dois Samsung de 750 GB com apenas alguns mêses de uso, esses não dá pra dizer nada ainda. Mas os de 750 GB não vejo reclamações na mesma intensidade. Aqui os meus PCs vivem ligados 24h/dia, e onde vivo realmente faz calor, o ano todo.

Mas o que me preocupou não foi o "porquê/como" os drives morreriam. E sim as expectativas de que você teria com esses tipos de drives. Eles seriam tão complexos, mas desenvolvidos de uma maneira que permitisse um tempo de vida razoável, ou as companhias estariam investindo em algo que não deveria ter essas capacidades?

Algo que sempre me perguntei foi o porquê dos HDs de 10 ou 15 mil RPM terem baixas capacidades de armazenamento, o porquê de não haver um disco de 500 GB por ex, comercialmente viável pra maioria. Lembro de ter lido em algum lugar que isso seria impossível devido à limites da tecnologia, a mesma que permite que os drives tenham 10 ou 15K RPM, sendo mais barulhentos por isso, não permitiria que eles tivessem alta capacidade.

Fazendo uma analogia: será que não há uma semelhança entre esses HDs maiores e o projeto da Torre de Pisa, que estava errado desde o começo?

Os HDs são uma tecnologia muito antiga, talvez um único drive não deveria ter tanto espaço disponível, sem efeitos colaterais, ou provavelmente um tempo de vida menor ou conturbado.

Nota: Depois desse questionamento tive acesso à dois podcasts em inglês que basicamente falam sobre recuperação de arquivos/discos.

http://www.podnutz.com/podnutz/podnutz028
http://www.podnutz.com/podnutz/podnutz029

http://www.techpodcasts.com/computers/78584/computer-america-0324-hour-1
http://www.techpodcasts.com/computers/78586/computer-america-0324-hour-2

O mais curioso no podcast 29 (o segundo link acima) é que aos 30 minutos da MP3, o entrevistado fala isso sobre os drives de maior capacidade (que a gravação perpendicular teria uma área de dados bem menor, por isso uma alta probabilidade de corromper os dados e ter falha nos discos). Fiz uma transcrição dos comentários abaixo, quem ouvir talvez possa corrigir algumas palavrinhas:

Q: Is there any particular brand that you think is better than any other on hard drives?

A: I would say that all of the drives are, at least today, not great drives. They are all made, and they are all going to die, a fairly quick death, pretty much the drives that are 500 GB and larger, are dying on a daily-basis for everybody. Terabyte drives, things like that. My preference would be to buy Seagate, only because of the warranty.

So, in my opinion, at least (because the drive is going to die) I can get a replacement based on the warranty, that's my hope.

Q: But why are the bigger drives failing?

A: The thing that has happened since 2006 is that everybody is going to a perpendicular format. And what that means is before, pretty much before 2006 every drive was written in what is called longitudinal format.

And that meant the north and south poles that you used to seem on a platter when you actually think about "how my data is written, it's laying down on a platter, north and south poles, and the head reads in that direction".

Well, since 2006 perpendicular basically means it's no longer laying down on the drive, now we are going to store it up and down. It's the difference between, you know, let's instead of burying [?????] in the ground, laying down, let's bury standing up right, because they will save a lot more space.

That's exactly what's happening with the bits and data stored on the platters now. So, at least from a stand point of sensitivity, the heads are much more sensitive to the amount of space and density that they got to read the content, and everybody is saying "let's get the biggest drive we can possibly get now", so, you know, one of the consequences of that is going to be: heat, and less time to test things.

I've know people who bought 500 GB drives, bought 3 or 4 book drives, or something like that, and within a week of each other they are dying.

And it's a fairly consistent inconstant thing now that one of things that you see in for recovery are these 500 GB drives both from Seagate, Western Digital, a few other companies, but, primarly Seagate and WD, the two I see most of.

Q: I see. So, there is no real brand loyalty, they are build not great, but if you are going to put your money on something, you might wanna put on Seagate because of the warranty?

A: That's my opinion, because they tipically they back the 5-year warranty before, I am pretty sure that's what it is now, still, but, tipically some other vendors, only either add 1-year or 3-years.

It also depends if either you are buying in the external case or not, or OEM drive, cause if you are buying a Lacie, the drives inside them are not made by them, but Maxtor, Seagate, or somebody, and tipically, they only give you a 1-year warranty, you'll have to read the box to be sure, but versus what the manufacturer might offer, so you might not get the 5-year warranty when it's inside the case.
Tradução (sorry se está ruim, mas é melhor ouvindo e/ou lendo no original):

P: Você tem alguma companhia favorita de HDs?

R: Eu diria que todos os HDs são, ao menos hoje, não tão bons assim. Eles são todos feitos, e todos vão morrer (de forma igualmente rápida), basicamente aqueles discos com 500 GB ou maior capacidade, estão "morrendo" quase que diariamente pra todos. HDs na casa dos Terabytes, por aí. Minha preferência seria comprar um Seagate, mas por conta da garantia.

Na minha opinião, pelo menos (porque o drive irá morrer), eu posso fazer a troca baseado na garantia, é o que espero.

P: Mas por que os drives maiores estão falhando?

R: O que ocorreu desde 2006 é que todos estão indo pelo formato perpendicular. E o que acontece é que antes desse ano, todo HD foi desenvolvido no que é chamado de formato longitudinal.

E isso significa que os pólos norte e sul que você costumava ver na placa quando pensa "como meus dados são gravados, está deitado sobre ela, e a cabeça lê naquela direção dos pólos".

Desde 2006 o formato perpendicular basicamente significa que não está mais "deitado sob o drive", agora que está pra cima e pra baixo. É a diferença entre, ao invés de enterrar [???? Palavra desconhecida] na terra, em posição horizontal, enterrar posicionado pra cima, pois assim irá salvar muito mais espaço.

É exatamente isso que acontece com os dados armazenados nas placas dos HDs agora. Então ao menos sob a ótica da sensitividade, as cabeças dos HDs agora são muito mais frágeis à quantidade de espaço e densidade que elas tem pra ler o conteúdo, e todos estão dizendo "vamos pegar o maior HD disponível", então, você sabe, uma das consequências disso é: aquecimento/calor, e menos tempo pra testar as coisas.

Eu conheci pessoas que compraram HDs de 500 GB, e também 3 ou 4 book drives, ou algo desse tipo, e em uma semana entre um e outro, os discos morreram.

E agora você vê nos centros de recuperação de dados os discos de 500 GB tanto da Seagate, como Western Digital, e outras companhias, mas principalmente da Seagate e Western Digital, os dois que mais vejo.

P: Entendo. Então não tem uma marca realmente confiável, não são tão bem desenvolvidos assim, mas se você vai investir em algo, vai querer um Seagate pela garantia?

R: É minha opinião, porque eles anunciam/anunciavam uma garantia de 5 anos, acho que é assim ainda, e alguns outros fabricantes davam 1 ou 3 anos.

Também depende se você está comprando num case externo ou não, ou é um drive OEM, porque se você está comprando um "Lacie" por ex., os HDs dentro dos cases não foram feitos por eles, mas pela Maxtor, Seagate, etc., e tipicamente, eles te dão apenas 1 ano de garantia, você tem que ler o que diz na caixa pra ter certeza, mas é isso contra o que os fabricantes originais oferecem, então (*talvez*) você não consiga os 5 anos de garantia *quando* vier dentro do case (HD externo).
P.S.: E eu ainda vim comentar que peguei o HD de 750 GB da Samsung porque o de 1 TB tinha muitas críticas de defeitos de fábrica. Olhem só, 105 comentários dando a qualificação mais baixa na página da Newegg (cerca de 15% do total), desse HD aí (que peguei pra mim): Link das críticas

O item consta como desativado agora na Newegg. Agora o que chama atenção são esses tipos de comentários:

Comentário 1:

Pros: Especially quiet now that it is dead.

Cons: Purchased at the $109 price point from Newegg.com back on 13/5/2008. Drive is dead now and will now attempt to RMA.

Other Thoughts: DO NOT BUY THIS DRIVE OR ANY OTHER MADE BY SAMSUNG UNTIL THEY HAVE PROVEN RELIABLE.
Esse primeiro foi postado em 22/01/2009. O HD do cara morreu 8 mêses depois da compra.

Comentário 2 (vou postar só os contras, pra ir direto ao ponto):

Cons: Bad compatibility. I was running it on XP and kept getting write failures. Switched it to an external enclosure via USB and it worked ok. I imagine because the connection was slower. Drive failed after 2 months. Lost 600GB of data which was always destined to be backed up tomorrow. I'm not sure if I even want to try to RMA it because of all the horror stories on this drive.
Comentário 3:

Pros: None!!! Should have the ability to list as ZERO EGGS!

Cons: Drive Failure After 5 Months. Take A Close Look At The Reviews. 1 day to 1 week, All Happy. 1 month to 1 Year, Huge Amount Of Failures. Just Know That Samsung Makes It Impossible To RMA!!! Thay Staste A 3 Year Warrany, But That Is Only As Good As The Company Behind It. Samsung Sucks. Thank New Egg For Posting All These Reviews, Maybee YOU WONT SUFFER LIKE ALL THE REST OF US!!! And To You Reviewers That Are Happy, JUST WAIT. YOUR TIME WILL COME! GOOD LUCK WITH YOUR RMA!!!

Other Thoughts: Waited For A Week Now, And I Still Have No Return Corrispondance With Samsung. And If You Think They Make It Easy For Returns, Your Dreamin! They Know This Drive Sucks And Dont Want To Have To Pay To Cover There "Warranty". Shop Elseware. I paid $109.00 in Aug '08. Now Its $79.00. Wonder Why?! Thanks Samsung, Lost Customer For Life On All Products. Hope To See Where You Land In This Recession.
E não são apenas 3, tem vários comentários, em suma, os HDs morrem após dias ou mêses de uso, ou já quando você pluga eles... eu pessoalmente nunca vi um HD pifar, mas seria realmente trágico se a primeira vez fosse com um HD desses novo, e com alta capacidade. Não trágico porque eu perderia os dados dele, não é isso - eu poderia muito bem ter backup de tudo.

Mas você investir uma boa grana num dispositivo que supostamente deveria ser mais avançado/confiável que os antigos, e se mostra pior? Uma bomba-relógio?

Dizem também que os HDs são a peça mais lenta de toda uma máquina, enquanto uma CPU é incrivelmente mais rápida, o HD deixa todo o resto em espera...
JoaoNeto
JoaoNeto Cyber Highlander Registrado
15.3K Mensagens 2.9K Curtidas
#13 Por JoaoNeto
07/04/2009 - 12:21
Patrick Gilmore disse:
Acho que uma coisa é certa, os HDs da Maxtor certamente são os que mais devem dar defeito. Nunca vi HD tão reclamado por aí. Já devem ser produzidos com defeito de fábrica, mais propensos a falhas.

Que nem os DVD players da Gradiente. big_green.png

Acho que os HDs da Samsung são os melhores, além de silenciosos e baratos. Seagate nunca usei.


Tá certo que opinião cada um tem a sua, porém a marca Maxtor é muito boa, assim como a Samsung que vc mencionou, que aliás é a marca do meu e já deu defeito algumas vezes. A maioria dos erros que vc ouviu falar não é culpa do HD mas sim do usuário que desliga o micro de forma errada, balança o micro dando socos na mesa, chutes...
Se não fosse o C iriamos programar em Basi, Pasal e Obol
Penitante
Penitante Geek Registrado
1.6K Mensagens 246 Curtidas
#14 Por Penitante
10/04/2009 - 02:46
Tem também outro fator que mencionaram numa discussão que é a maneira como os HDs são transportados até sua casa. Na Newegg choveram críticas com relação à isso, mencionando que aqueles que são guardados/enviados corretamente se previnem de falhas consideráveis.

Mesmo se você compra de uma grande loja, tem que prestar atenção nisso, por exemplo, ter duas camadas de plástico-bolha não significa que esteja embalado corretamente, e isso é algo que é feito nos armazéns que despacham essas peças, não o fabricante que fez o drive zuado desde o princípio. Por isso que depois de um tempo eles começam a falhar, também.

Nada pode ser descartado... HDs certamente são muito frágeis e requerem um cuidado extremo, e sem dúvida uma garantia extendida seria uma das melhores formas de prevenção contra esses infortúnios.
© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal