Logo Hardware.com.br
Vitor Machado
Vitor Machad... General de Pijama Registrado
4.6K Mensagens 72 Curtidas

Placebo e você: alguns mitos relacionados a áudio

#1 Por Vitor Machad... 07/02/2011 - 02:44
"Placebo: Algo sem nenhum benefício real mas que ainda assim faz as pessoas se sentirem melhores." (Wikcionário)
Muitas vezes vejo certas afirmações que são, digamos, extremamente improváveis. stick_out_tongue.png
Eu sei que é normal ficar empolgado com o seu equipamento de som novo e tal, mas muitas vezes nos deixamos levar pelo placebo. Vou desenvolver alguns exemplos aqui:
  • "mp3 é uma porcaria, mesmo 320k. Eu só uso flac."
    Primeiramente, nenhum problema em usar flac, e se você tem espaço em disco o faça. FLAC é muito mais flexível pois pode ser re-codificado para qualquer outro formato sem perdas do tipo lossy -> lossy (google: lossless lossy para mais informações).

    Agora, dizer que você ouve claramente a diferença de mp3 320kbps pra flac na sua caixa-de-som multimídia nova são outros quinhentos. stick_out_tongue.png
    Muita gente com alguns milhares gastos em equipamentos de som diz que é muito difícil detectar a diferença entre 320k e o original, a não ser em trechos bem específicos e prestando muita atenção. Mesmo mp3 V0 (245kbps VBR) ainda é considerado muito difícil, e somente abaixo disso a diferença vai ficando realmente clara se o seu equipamento permitir.

    Lhes encorajo a fazerem o chamado teste ABX (google é seu amigo. Tem um plugin pro foobar2000 pra fazer isso, é bem simples), para ver até onde vocês conseguem diferenciar.

  • "som 24-bits/96KHz é muito melhor que 16-bits/44KHz"
    "Segundo o Teorema de Nyquist, a frequência de amostragem de um sinal analógico, para que possa posteriormente ser reconstituído com o mínimo de perda de informação, deve ser igual ou maior a duas vezes a maior frequência do espectro desse sinal." (Wikipédia)
    Os CDs não tem 44KHz por acaso, a metade desse valor é 22KHz que é considerado o topo da capacidade auditiva dos humanos (a maioria das pessoas ouve menos que isso, e cai com a idade).

    O teorema diz que o áudio original é exatamente determinado por uma amostragem com o dobro da frequência do original, então não existe vantagem para os nossos ouvidos em ouvir um som digital PCM com amostragem maior que 44KHz.

    Agora vamos aos bits...
    16-bits equivalem um total de 65.536 valores diferentes. Cada um desses valores representa uma certa amplitude de onda, sendo 0 o mais baixo (silêncio) e 65.536 o ponto mais alto.
    Sem entrar em muitos detalhes, esses valores permitem uma faixa dinâmica (diferença entre sons mais baixos e mais altos) de 96dB.
    No caso de 24-bits, a faixa dinâmica é 144dB.

    Tudo bem, só tem um detalhe: a maioria das músicas modernas não passa de 40dB de faixa dinâmica, e mesmo gravações de orquestras em alta qualidade não passam de 80dB.

    O erro de quantização (o erro da representação em bits, por "passinhos", em relação ao original) também é muito pequeno e inaudível, portanto 16-bits são suficientes para um som perfeito para humanos.

    Por que existe 24-bits/96KHz então?
    A vantagem desses formatos é para o estágio de gravação e mixagem, aonde serão aplicados diversos filtros ao som, e então é útil ter uma "sobra" para evitar perdas de qualidade. Quem mexe com fotografia HDR sabe do que estou falando.
    Mas depois que está pronto, 16/44 é suficiente.

    Muitas vezes áudio 24-bits/96KHz tem som melhor simplesmente porque foi masterizado melhor, ou então devido a implementação do seu hardware trabalhar melhor com esses formatos, mas não é devido ao formato em si.

  • "programa X tem som melhor que programa Y"
    É suficiente eu colar aqui um trecho da parte de perguntas e respostas do player foobar2000:
    "O foobar2000 tem som melhor que outros players?

    Não. A maioria das "diferenças de qualidade de som" que as pessoas "ouvem" são placebo (pelo menos com música real), já que as diferenças práticas nas informações de áudio produzidas estão abaixo do seu piso de ruído audível (1 ou 2 últimos bits em amostras de 16-bits). O foobar2000 tem recursos de processamento de som como resampling ou saída de áudio 24-bits para placas-de-som topo de linha, mas a maioria dos outros players são capazes de fazer o mesmo a essa altura.
    "
    Ou seja, se um player tem som melhor que outro pra você, ou é placebo, ou então o player está aplicando algum filtro que lhe agrada, mas está assim modificando o som original sem você saber.
______________________________________


Se você ainda está aí, vamos ver um pouco mais sobre mp3...

Quem aí já teve a (in)felicidade de estudar Cálculo, vai lembrar das séries de Fourier. mostrando_dentes.png
Você tem uma função matemática qualquer, e quando você faz a transformada de Fourier, você transforma essa função original em diversas componentes senóides que somadas, retornam à função original. Existem componentes de frequências mais baixas, e componentes de frequências mais altas.

O que se faz ao compactar áudio para mp3, é um processo chamado DCT (discrete cosine transform) que é uma das variações da transformada de Fourier. Então, dependendo da qualidade escolhida para o mp3, serão descartadas as componentes de frequência mais alta.

Por que isso da certo?
Simples, porque a maior parte da informação original está contida nas frequências mais baixas. Veja essa imagem:
Imagem

A onda original está em preto. As outras são componentes (se somadas, o resultado será a preta). Repare que se eu descartar a componente roxa não vai fazer muita diferença. Mas se eu descartar a vermelha, vai tudo pro espaço.

É fácil ver a diferença de um mp3 (mesmo 320k) pro original se você olhar em um espectrograma (que mostra a intensidade de cada frequência), você vai notar que as frequências mais altas somem no mp3 (quanto pior a qualidade, mais se perdem altas frequências).
Mais isso se traduz em pouca perda audível, pois há poucas informações relevantes nas altas frequências, e a grande maioria das músicas já tem pouca informação nessa faixa pra começar.
O mp3 leva ainda em consideração outras características da audição humana (psicoacústica), mas não vamos entrar nesse mérito. stick_out_tongue.png

Esse é exatamente o mesmo princípio usado na compactação JPEG (no caso para imagens), e é razão pela qual por exemplo, textos pretos em um fundo branco ficam horríveis em JPEG. O contraste branco/preto é uma mudança brusca, uma alta frequência. wink.png
Da mesma forma como no mp3, quando o JPEG é aplicado a uma foto real, a diferença perceptível é muito pequena se a qualidade do JPEG for alta.

EDIT: Ah, devo lembrar que, embora eu esteja falando sempre de mp3, todos os outros formatos de áudio lossy (como Vorbis e AAC) são baseados em transformadas de Fourier, bem como formatos de imagem e vídeo lossy.
As diferenças estão em outros detalhes e otimizações (as vezes um formato é melhor para certo tipo de dado do que outro).
Responder
elissonandrade
elissonandra... Tô em todas Registrado
1.3K Mensagens 166 Curtidas
#7 Por elissonandra...
07/02/2011 - 14:47
Olha eu acho que a fonte é simples pesquisa dele mesmo. Ele mesmo citou várias referências (Wikicionário, Teorema de Nyquist, Faq do Foobar).

Como estudante de engenharia elétrica, confirmo o que ele disse sobre corte de frequências altas e o teorema lá de Nyquist. Eu também acho que ele quer que agente pesquise pra que nós mesmo possamos confirmar, não?

Só alguns adendos: As vezes, o corte efetuado em frequências altas é proposital, pois é lá onde ficam a maioria dos ruídos.

Em relação á qualidade, bem, como também trabalho com sonoplastia, posso dizer que a qualidade está mais ligada ao equipamento do cara que grava do que do cara que escuta. Se o cara gravou mal, não ajustou a equalização, não colocou filtro adequados, num tem equipamento bom que ajeite.
Fergo
Fergo Highlander Registrado
9.3K Mensagens 1.1K Curtidas
#8 Por Fergo
07/02/2011 - 14:51
O problema dos 16/24 bits é justamente o fato de usar 24 na mixagem e renderizar para 16. Por mais que 24bits forneçam um maior headroom na mixagem, ao passar para 16 inevitavelmente você acaba comprimindo o sinal de áudio (no sentido amplitude da onda, não de compressão de dados). Por isso que é bem comum você ouvir gente falando que áudio de CD tem muito menos dinâmica do que uma fonte analógica. Pra piorar a situação, na hora da masterização, muitos engenheiros ainda colocam um compressor para "deixar a música mais alta". A famosa loudness war.

Eu discordo também um pouco de ser "impossível" identificar a diferença entre um MP3@320kbps e um formato lossless. Pode ser impossível se você não costuma usar equalização. A partir do momento que você sobe os agudos de um MP3 já é possível notar uma perda significativa de clareza nessa faixa. Utilizando fones de monitoração, como o MDR-7502 da Sony, também é possível perceber sem muito esforço a diferença entre uma fonte lossless e outra lossy.

Fergo
Site pessoal www.fergonez.net
Portfolio
www.fbirck.com
Artigos
Informática
Marcos FRM
Marcos FRM Highlander Registrado
10.3K Mensagens 712 Curtidas
#9 Por Marcos FRM
07/02/2011 - 14:56
Fergo disse:
O problema dos 16/24 bits é justamente o fato de usar 24 na mixagem e renderizar para 16. Por mais que 24bits forneçam um maior headroom na mixagem, ao passar para 16 inevitavelmente você acaba comprimindo o sinal de áudio (no sentido amplitude da onda, não de compressão de dados). Por isso que é bem comum você ouvir gente falando que áudio de CD tem muito menos dinâmica do que uma fonte analógica. Pra piorar a situação, na hora da masterização, muitos engenheiros ainda colocam um compressor para "deixar a música mais alta". A famosa loudness war.

Loudness war esbravando.gif esbravando.gif esbravando.gif
...
Vitor Machado
Vitor Machad... General de Pijama Registrado
4.6K Mensagens 72 Curtidas
#10 Por Vitor Machad...
07/02/2011 - 15:56
JUNIM disse:
Colega, de onde é este texto, e a fonte permite copiar para publicar em outros locais?
A fonte sou eu mesmo. stick_out_tongue.png
Aonde necessário eu citei as fontes.

Se quiser pode copiar aonde quiser hehe.

Fergo disse:
O problema dos 16/24 bits é justamente o fato de usar 24 na mixagem e renderizar para 16. Por mais que 24bits forneçam um maior headroom na mixagem, ao passar para 16 inevitavelmente você acaba comprimindo o sinal de áudio (no sentido amplitude da onda, não de compressão de dados). Por isso que é bem comum você ouvir gente falando que áudio de CD tem muito menos dinâmica do que uma fonte analógica. Pra piorar a situação, na hora da masterização, muitos engenheiros ainda colocam um compressor para "deixar a música mais alta". A famosa loudness war.
A taxa de amostragem não tem haver com amplitude de onda, ela é a quantidade de "pontos" (as amostras) por faixa de tempo considerada (no caso são 44.100 pontos por segundo).
Mas de acordo com o teorema é possível reduzir a amostragem de 96KHz para 44KHz sem problemas, desde que o áudio contenha apenas frequências iguais ou menores a 22KHz.
Geralmente são aplicados filtros para cortar qualquer som acima de 22KHz antes de passar pra amostragem de 44KHz, para evitar artefatos.

A dinâmica (ou seja a amplitude) tem haver é com os bits, mas como eu já disse no texto, 16-bits é dinâmica suficiente para música, mesmo música de alta qualidade (não afetada pela loudness war).

Fergo disse:
Eu discordo também um pouco de ser "impossível" identificar a diferença entre um MP3@320kbps e um formato lossless. Pode ser impossível se você não costuma usar equalização. A partir do momento que você sobe os agudos de um MP3 já é possível notar uma perda significativa de clareza nessa faixa. Utilizando fones de monitoração, como o MDR-7502 da Sony, também é possível perceber sem muito esforço a diferença entre uma fonte lossless e outra lossy.

Fergo
Eu não disse que é impossível, só disse que requer equipamento excelente e muita concentração, e trechos específicos das músicas.

Claro que se você começar a mexer no equalizador de propósito você vai facilitar a audição da diferença, assim como quando você aumenta o contraste de uma foto você vê muito mais facilmente os artefatos JPEG. wink.png
[Essa conta não será mais utilizada]
flattakk
flattakk Ubbergeek Registrado
3.8K Mensagens 629 Curtidas
#11 Por flattakk
07/02/2011 - 16:08
Esse é um assunto que rende muito debate e existem bons argumentos de ambos os lados.
Eu sou da turma que não consegue diferenciar um mp3 de um flac na maioria das situações, somente em casos extremos.

Mas hoje em dia a abordagem sobre o esse assunto deve ser por um ângulo diferente: O mp3 ainda é justificável e válido?

O mp3 foi criado em um tempo onde, por uma série de limitações era justificável alterar e diminuir a qualidade original do áudio.
Mas com a evolução da tecnologia como um todo, a maioria dessas limitações estão sendo superadas e pra mim o mp3 já é passado.

- Hoje em dia espaço de armazenamento no pc não é problema com os hds chegando na casa dos terabytes.
- Transmissões através da internet não é mais problema com a da banda larga evoluindo gradativamente.
- Mesmo nos portáteis, um dos poucos segmentos onde o mp3 ainda é justificável, aos poucos estão sendo superados pois já temos discos dvd e bluray, players portáteis e pendrives chegando nas dezenas e centenas de gigabytes de armazenamento.

Enfim, não se justifica mais continuar utilizando um codec de manipulação tão restrito que altera e diminui a qualidade original do áudio.
Quando eu digo "manipulação" me refiro a praticidade dos codecs lossless de serem editados ou mesmo convertidos para outros formatos quantas vezes forem necessários mantendo a mesma qualidade do arquivo original.
arkOrange">arkOrange">
Vitor Machado
Vitor Machad... General de Pijama Registrado
4.6K Mensagens 72 Curtidas
#12 Por Vitor Machad...
07/02/2011 - 16:14
elissonandrade disse:
Em relação á qualidade, bem, como também trabalho com sonoplastia, posso dizer que a qualidade está mais ligada ao equipamento do cara que grava do que do cara que escuta. Se o cara gravou mal, não ajustou a equalização, não colocou filtro adequados, num tem equipamento bom que ajeite.
Exatamente cara.
As pessoas se preocupam muito com esses detalhes insignificantes (pelo menos na grande maioria dos casos) que eu mencionei, e se esquecem que grande parte das músicas de hoje são masterizadas muito porcamente, e tem sua dinâmica totalmente comprimida.

Procurem ouvir álbuns bem masterizados, como por exemplo, os álbuns do Dire Straits (Brothers in Arms em especial). Aquilo sim é qualidade e dinâmica. wink.png

flattakk disse:
Mas hoje em dia a abordagem sobre o esse assunto deve ser por um ângulo diferente: O mp3 ainda é justificável e válido?
Correto.
Como eu falei, se puder usar flac use.
No mínimo, você vai ganhar a flexibilidade de poder re-codificar pra qualquer outro formato quantas vezes quiser sem perdas.

EDIT: Quer ver uma prova de que a gente se preocupa muito com o que não deve? Olhem isso:

Imagem
(ambos gráficos aqui medidos por Tyll Hertsens da HeadRoom)

Isso é a resposta de um dos melhores fones de ouvido que existem, o Audez'e LCD-2, reproduzindo uma onda quadrada de 300Hz. Reparem as oscilações (claro que parte dessas oscilações se devem também ao resto do equipamento usado, mas que certamente está à altura do fone).

Ah, esse fone custa uns 950 dólares.

Agora olha a medida de um Sony Qualia, que é um modelo mas antigo, mas que é considerado também um fone excelente e tem status quase lendário entre os audiófilos:

Imagem

Legal né? E a gente se preocupando com diferença de som entre player. stick_out_tongue.png
[Essa conta não será mais utilizada]
Fergo
Fergo Highlander Registrado
9.3K Mensagens 1.1K Curtidas
#13 Por Fergo
07/02/2011 - 16:15
Vitor Machado disse:

A taxa de amostragem não tem haver com amplitude de onda, ela é a quantidade de "pontos" (as amostras) por faixa de tempo considerada (no caso são 44.100 pontos por segundo).


Sim, mas eu não estava falado da taxa de amostragem, estava falando da quantidade de bits, que corresponde ao "eixo Y" (amplitude) onda:

Fergo disse:
O problema dos 16/24 bits é justamente o fato de usar 24 na mixagem e renderizar para 16. [...]


Fergo
Site pessoal www.fergonez.net
Portfolio
www.fbirck.com
Artigos
Informática
ivoaudio
ivoaudio Cyber Highlander Registrado
7K Mensagens 2.2K Curtidas
#15 Por ivoaudio
07/02/2011 - 17:20
Vitor Machado disse:
Legal né? E a gente se preocupando com diferença de som entre player. stick_out_tongue.png


A coisa ainda pode ser pior: já li sobre gente que se preocupava com a cor do plástico isolante do fio das caixas de som, jurando que fazia diferença no som...

Trabalhei com áudio profissional, mas cheguei até o Pro Tools 24 bits a 44.1KHz antes de mudar de profissão. Como o máximo que fiz foi gravar ao vivo em adat 20 bits, transferir para Pro Tools, mixar e pré-masterizar para CD, e trabalhei muito com jingles e spots, não posso dizer que experimentei o melhor em áudio.
Jazz rocks!
---
Responder Tópico
© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal