Logo Hardware.com.br
AndreMR
AndreMR Geek Registrado
3.7K Mensagens 18 Curtidas

SFV ou MD5? Qual é melhor?

#1 Por AndreMR 15/02/2006 - 01:29
O programa já escolhi, adorei esse hkSFV big_green.png
Botão direito no Explorer, cria SFV e MD5, inclusive pra vários arquivos de uma vez, e verifica os dois formatos.
Único problema que vejo nele é não gerar um arquivo pra todos os subdiretórios (ou do CD inteiro), tem que mandar pasta por pasta...

O problema agora é decidir se uso SFV ou MD5 pra botar nos meus CDs de dados...
O que a página do programa disse me deixou mais na dúvida ainda:

What is an .SFV? -- An .SFV file is a tiny list of files and CRCs, which allow you to check to see if the files you have downloaded are exactly what you are expecting. The CRC algorithm used in .SFV files allows you to see if the file you have has been changed, even a single byte, since the .SFV file was created.

What is an .MD5? -- In a sense, .MD5 did not exist until now, as md5sum is a popular Unix format similar to .SFV and Unix does not use file extensions the way Windows based systems do. .MD5 uses the md5 algorithm to compute its checksums, rather than the crc32 method used by .SFV. The md5 algorithm is almost as fast as crc32, but it is much more accurate at detecting changes in files.

http://www.big-o-software.com/products/hksfv/

Eles dizem que MD5 foi feito pra Unix, e que não usa extensões de arquivos do jeito que Win usa. Diz que é quase tão rápido quanto SFV, mas que é bem mais preciso pra detectar mudanças nos arquivos.

Muito arquivo que baixa em Torrent e eMule vem com SFV... sinal que parece ser mais popular, o que não quer dizer que é melhor.

Agora não sei qual usar, qual seria melhor.
Que acham? Qual vocês usam, SFV ou MD5? 8O
The Brink of Time
The Brink of... Veterano Registrado
1.5K Mensagens 2 Curtidas
#2 Por The Brink of...
15/02/2006 - 13:37
Eu uso o md5 exatamente por ser "The md5 algorithm is almost as fast as crc32, but it is much more accurate at detecting changes in files.". Sim, muitos torrents vem em sfv, assim como muitos bootlegs (gravações ao vivo não oficias de bandas) que voce pega na net em formatos lossless também vem em md5. Depende da preferencia.

Eu nunca analisei a fundo os dois algoritmos, mas por definição dizem que o md5 é mais exato que o sfv, portanto uso o md5. Mas quando pego arquivos que vem com sfv, mantenho do jeito que recebi.
Z0
Z0 Zerinho Registrado
2.3K Mensagens 0 Curtidas
#5 Por Z0
16/02/2006 - 18:10
Eu sempre uso MD5, e realmente um bit de dados mudados entre um arquivo e outro já gera um resultado completamente diferente (mas nunca usei SFV para saber). O que li uma vez é que foi provado que o MD5 pode gerar um mesmo resultado para 2 arquivos diferentes, e recomendavam usar o SFV, não que ele não pudesse ter esse defeito, mas que ainda não foi provado nada.

De qualquer forma, teria que ter muita paciência para ir testando e fazer 2 MD5s iguais em arquivos diferentes, o que na prática torna absolutamente impossível de você baixar um arquivo, conferir o MD5 e mesmo assim ele estar errado. E claro que pode ser igual, tanto em um quanto em outro (se SFV for da mesma forma): é só analisar quantos resultados possíveis podem dar as combinações alfanuméricas e observar que podemos ter infinitos arquivos distintos, como um .txt escrito A, um .txt escrito AB, etc...
The Brink of Time
The Brink of... Veterano Registrado
1.5K Mensagens 2 Curtidas
#6 Por The Brink of...
16/02/2006 - 19:57
O que li uma vez é que foi provado que o MD5 pode gerar um mesmo resultado para 2 arquivos diferentes, e recomendavam usar o SFV

Mas era uma especia de brute force com infinitos ataques... acho que pro dia a dia em arquivos corriqueiros ou mesmo arquivos do mundo real não sofrem do problema encontrado nesse teste.

Eu tinha um pdf sobre isso, vou ver se encontro.
AndreMR
AndreMR Geek Registrado
3.7K Mensagens 18 Curtidas
#7 Por AndreMR
21/02/2006 - 18:51
Tô satisfeito com o hksfv, depois que vi que ele cria MD5 do disco todo (sub-diretórios & arquivos) de uma só vez pelo Win Explorer.
:mrgreen:

Só não dá pra criar CDs de áudio com esses arquivos MD5 ou SFV, né? :cry:
CD e DVD de dados, e DVD de vídeo com algum esforço dá...
Mas CD de áudio não vai. Há alguma forma de fazer o MD5 das faixas de áudio criando um CD Extra ou Mixed-mode (áudio e dados)?
8O
Manabu
Manabu Veterano Registrado
1.8K Mensagens 12 Curtidas
#8 Por Manabu
21/02/2006 - 22:36
Pera perai ai um pouco. Vamos organizar as coisas por aqui:
Eles dizem que MD5 foi feito pra Unix, e que não usa extensões de arquivos do jeito que Win usa.

Você interpretou o que leu de forma equivocada. Ele disse que o MD5 é popular no Unix. Nada mais nada menos. Provavelmente foi feito no unix também, mas isso não quer dizer que ele foi feito para unix. É um algorítimo matemático que foi feito para detectar arquivos corrompidos, e pode ser aplicado em qualquer lugar, até mesmo com seu lápis.

A outra informação que ele passou foi que o unix não costuma usar extensões, e portanto, o MD5Sun ainda não tinha recebido nenhuma extensão oficial. Isso não quer dizer que o MD5 não usa extensões, só quer dizer que ninguém usava extensões para ele. Há uma sutil diferença.

Eu sempre uso MD5, e realmente um bit de dados mudados entre um arquivo e outro já gera um resultado completamente diferente (mas nunca usei SFV para saber).

Sim. A base desses algorítimos é que pequenas mudanças levem à grandes diferenças nas assinaturas. Isso é perfeito para verificar se um dado foi corrompido ou não, pois normalmente essa corrupção é pontual (perde uns bits, ou troca-se uns bits), não altera o arquivo inteiro. Mas no caso de grandes mudanças...
O que li uma vez é que foi provado que o MD5 pode gerar um mesmo resultado para 2 arquivos diferentes, e recomendavam usar o SFV, não que ele não pudesse ter esse defeito, mas que ainda não foi provado nada.

...qualquer um desses algorítimos podem dar o mesmo resultado do arquivo original não mudado. Mas pense bem: se eles realmente fossem únicos, nós poderiamos usar eles como ferramentas de compactação. Imagine um filme de 700mb sendo reduzido à 32bits de dados, ou 8 digitos alfa/numéricos (esse é o jeito que o CRC/SFV é mais visto). Impossível: há milhares, ou até milhões de arquivos de até 1GB com a mesma assinatura. Se não limitarmos o tamanho máximo, temos infinitos arquivos com a mesma assinatura. O mesmo com os 128bits do MD5Sun, só que esse número cai um pouco.

Se você pensar agora, depois de ler o que eu falei, o resultado desse experimento que você falou não é nada surpreendente, concorda? E que o SFV também sofre do mesmo problema, inclusive algumas poucas vezes pior.

Conclusão: Esses algorítimos não são adequados para comparar dois arquivos possivelmente muito diferentes, muito menos compactar dados. Mas entretanto são muito adequados para detectar mínimas mudanças pontuais em um arquivo armazenado ou transmitido.

Uma das únicas vantagens do CRC (algorítimo usado nos arquivos SFV) é que ele é curto, e seus 8 digitos podem ser colocados no nome do arquivo por exemplo. Ele é preciso 99,8% das vezes. Se vc quiser subir isso para 99,98% das vezes, e for guardar o valor para checagem em um arquivo separado por exemplo, use o MD5Sun.
(valores chutados ao acaso. Não fiz calculos para chegar à essas probabilidades... mas deve ser algo por ai, com o MD5Sun sendo muitas vezes mais preciso do que o CRC, mas quando vc olha deste ponto de vista, vc vê que a diferença não é muito grande. Igual protetor solar.)
AndreMR
AndreMR Geek Registrado
3.7K Mensagens 18 Curtidas
#9 Por AndreMR
22/02/2006 - 00:59
Manabu
Pera perai ai um pouco. Vamos organizar as coisas por aqui:

8O
A bença! :mrgreen:

~ ~ ~
Então tá resolvido: EU usarei MD5, porque vou usar esse programinha hkSFV que gera um arquivo separado, e vou usar esse arquivo separado pra conferir também, e pouca diferença de velocidade eu provavelmente não vou notar, mas vou gostar de ter um método mais "accurate" pra detectar mudanças, que é o que interessa pra arquivos gravados nas porcas mídias de CD e DVD que temos no mercado.
:P

~ ~ ~
E continuo querendo alguma sugestão, se tiver, pra usar isso em discos de Áudio. :roll:
Manabu
Manabu Veterano Registrado
1.8K Mensagens 12 Curtidas
#10 Por Manabu
22/02/2006 - 16:04
O melhor é gravar em uma mídia boa, pois o máximo que esses algorítimos fazem é detectar se houve ou não correção. Se houve, então está perdido e você já não pode fazer muita coisa...

Alguns links da wikipedia para complementar:
http://en.wikipedia.org/wiki/Checksum
http://en.wikipedia.org/wiki/Cyclic_redundancy_check
http://en.wikipedia.org/wiki/MD5
http://en.wikipedia.org/wiki/SFV

São uma boa leitura.
The Brink of Time
The Brink of... Veterano Registrado
1.5K Mensagens 2 Curtidas
#14 Por The Brink of...
22/02/2006 - 19:26
O segundo, manabu. smile.png trocando em miúdos, é um método parecido com o md5, com a opção de oferecer restauração de dados perdidos como exemplo dados perdidos em dvds.

Desvantagem: espaço, obviamente. Ao que parece, de uma forma bem simplista e numa média simples, para obter esses recursos para cada dvd de 4.7 que eu gravasse de dados teria o equivalente em arquivos PAR2 que lotariam um cdr de 700mb.

Mas para os paaranóicos, é uma opção. Um programa gratuito: http://www.quickpar.org.uk/AboutPAR2.htm

Nunca testei, mas um dia vou gravar uns dvds, colocar uma fita tape em cima e depois tentar recuperar os dados. Pra quem ainda não confia nas mídias de dvd pra backups, é uma alternativa.

AndreMR, daqui a 5 anos, provavelmente você irá transferir esses seus arquivos para outra mídia de armazenamento, e se precisar, fará outro o fingerprint com qualquer que seja o "futuro md5". :mrgreen:
AndreMR
AndreMR Geek Registrado
3.7K Mensagens 18 Curtidas
#15 Por AndreMR
24/02/2006 - 00:26
The Brink of Time
AndreMR, daqui a 5 anos, provavelmente você irá transferir esses seus arquivos para outra mídia de armazenamento, e se precisar, fará outro o fingerprint com qualquer que seja o "futuro md5".

Ah, isso é... 8)
Por exemplo, essa preocupação toda que tô tendo agora, é porque só esse mês comprei um gravador de DVD e tô tirando meus backups de 5 anos ou mais da gaveta. Copiando CD pra DVD. E é quando eu vi que CD parado perde dados também, não sei se foi mídia ruim da época ou falsa, ou mal armazenamento.

Daqui uns 5 anos devo tá trocando de PC de novo e provavelmente copiando os DVDs que tô gravando hoje, pra Blu-Ray, ou algo bakana da época.

:mrgreen:

Mas que eu torço pro tal do disco holográfico sair logo, isso sim. :?
© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal