"Placebo: Algo sem nenhum benefício real mas que ainda assim faz as pessoas se sentirem melhores." (Wikcionário)
Muitas vezes vejo certas afirmações que são, digamos, extremamente improváveis. Eu sei que é normal ficar empolgado com o seu equipamento de som novo e tal, mas muitas vezes nos deixamos levar pelo placebo. Vou desenvolver alguns exemplos aqui:
- "mp3 é uma porcaria, mesmo 320k. Eu só uso flac."Primeiramente, nenhum problema em usar flac, e se você tem espaço em disco o faça. FLAC é muito mais flexível pois pode ser re-codificado para qualquer outro formato sem perdas do tipo lossy -> lossy (google: lossless lossy para mais informações).
Agora, dizer que você ouve claramente a diferença de mp3 320kbps pra flac na sua caixa-de-som multimídia nova são outros quinhentos.
Muita gente com alguns milhares gastos em equipamentos de som diz que é muito difícil detectar a diferença entre 320k e o original, a não ser em trechos bem específicos e prestando muita atenção. Mesmo mp3 V0 (245kbps VBR) ainda é considerado muito difícil, e somente abaixo disso a diferença vai ficando realmente clara se o seu equipamento permitir.
Lhes encorajo a fazerem o chamado teste ABX (google é seu amigo. Tem um plugin pro foobar2000 pra fazer isso, é bem simples), para ver até onde vocês conseguem diferenciar.
- "som 24-bits/96KHz é muito melhor que 16-bits/44KHz""Segundo o Teorema de Nyquist, a frequência de amostragem de um sinal analógico, para que possa posteriormente ser reconstituído com o mínimo de perda de informação, deve ser igual ou maior a duas vezes a maior frequência do espectro desse sinal." (Wikipédia)Os CDs não tem 44KHz por acaso, a metade desse valor é 22KHz que é considerado o topo da capacidade auditiva dos humanos (a maioria das pessoas ouve menos que isso, e cai com a idade).
O teorema diz que o áudio original é exatamente determinado por uma amostragem com o dobro da frequência do original, então não existe vantagem para os nossos ouvidos em ouvir um som digital PCM com amostragem maior que 44KHz.
Agora vamos aos bits...
16-bits equivalem um total de 65.536 valores diferentes. Cada um desses valores representa uma certa amplitude de onda, sendo 0 o mais baixo (silêncio) e 65.536 o ponto mais alto.
Sem entrar em muitos detalhes, esses valores permitem uma faixa dinâmica (diferença entre sons mais baixos e mais altos) de 96dB.
No caso de 24-bits, a faixa dinâmica é 144dB.
Tudo bem, só tem um detalhe: a maioria das músicas modernas não passa de 40dB de faixa dinâmica, e mesmo gravações de orquestras em alta qualidade não passam de 80dB.
O erro de quantização (o erro da representação em bits, por "passinhos", em relação ao original) também é muito pequeno e inaudível, portanto 16-bits são suficientes para um som perfeito para humanos.
Por que existe 24-bits/96KHz então?
A vantagem desses formatos é para o estágio de gravação e mixagem, aonde serão aplicados diversos filtros ao som, e então é útil ter uma "sobra" para evitar perdas de qualidade. Quem mexe com fotografia HDR sabe do que estou falando.
Mas depois que está pronto, 16/44 é suficiente.
Muitas vezes áudio 24-bits/96KHz tem som melhor simplesmente porque foi masterizado melhor, ou então devido a implementação do seu hardware trabalhar melhor com esses formatos, mas não é devido ao formato em si.
- "programa X tem som melhor que programa Y"É suficiente eu colar aqui um trecho da parte de perguntas e respostas do player foobar2000:"O foobar2000 tem som melhor que outros players?Ou seja, se um player tem som melhor que outro pra você, ou é placebo, ou então o player está aplicando algum filtro que lhe agrada, mas está assim modificando o som original sem você saber.
Não. A maioria das "diferenças de qualidade de som" que as pessoas "ouvem" são placebo (pelo menos com música real), já que as diferenças práticas nas informações de áudio produzidas estão abaixo do seu piso de ruído audível (1 ou 2 últimos bits em amostras de 16-bits). O foobar2000 tem recursos de processamento de som como resampling ou saída de áudio 24-bits para placas-de-som topo de linha, mas a maioria dos outros players são capazes de fazer o mesmo a essa altura."
______________________________________
Se você ainda está aí, vamos ver um pouco mais sobre mp3...
Quem aí já teve a (in)felicidade de estudar Cálculo, vai lembrar das séries de Fourier.
Você tem uma função matemática qualquer, e quando você faz a transformada de Fourier, você transforma essa função original em diversas componentes senóides que somadas, retornam à função original. Existem componentes de frequências mais baixas, e componentes de frequências mais altas.
O que se faz ao compactar áudio para mp3, é um processo chamado DCT (discrete cosine transform) que é uma das variações da transformada de Fourier. Então, dependendo da qualidade escolhida para o mp3, serão descartadas as componentes de frequência mais alta.
Por que isso da certo?
Simples, porque a maior parte da informação original está contida nas frequências mais baixas. Veja essa imagem:
A onda original está em preto. As outras são componentes (se somadas, o resultado será a preta). Repare que se eu descartar a componente roxa não vai fazer muita diferença. Mas se eu descartar a vermelha, vai tudo pro espaço.
É fácil ver a diferença de um mp3 (mesmo 320k) pro original se você olhar em um espectrograma (que mostra a intensidade de cada frequência), você vai notar que as frequências mais altas somem no mp3 (quanto pior a qualidade, mais se perdem altas frequências).
Mais isso se traduz em pouca perda audível, pois há poucas informações relevantes nas altas frequências, e a grande maioria das músicas já tem pouca informação nessa faixa pra começar.
O mp3 leva ainda em consideração outras características da audição humana (psicoacústica), mas não vamos entrar nesse mérito.
Esse é exatamente o mesmo princípio usado na compactação JPEG (no caso para imagens), e é razão pela qual por exemplo, textos pretos em um fundo branco ficam horríveis em JPEG. O contraste branco/preto é uma mudança brusca, uma alta frequência.
Da mesma forma como no mp3, quando o JPEG é aplicado a uma foto real, a diferença perceptível é muito pequena se a qualidade do JPEG for alta.
EDIT: Ah, devo lembrar que, embora eu esteja falando sempre de mp3, todos os outros formatos de áudio lossy (como Vorbis e AAC) são baseados em transformadas de Fourier, bem como formatos de imagem e vídeo lossy.
As diferenças estão em outros detalhes e otimizações (as vezes um formato é melhor para certo tipo de dado do que outro).