Placebo e você: alguns mitos relacionados a áudio

Question

Placebo: Algo sem nenhum benef&iacute;cio real mas que ainda assim faz as pessoas se sentirem melhores. (Wikcion&aacute;rio)Muitas vezes vejo certas afirma&ccedil;&otilde;es que s&atilde;o, digamos, extremamente improv&aacute;veis. 
Eu  sei que &eacute; normal ficar empolgado com o seu equipamento de som novo e tal, mas muitas vezes nos  deixamos levar pelo placebo. Vou desenvolver alguns exemplos aqui:
mp3 &eacute; uma porcaria, mesmo 320k. Eu s&oacute; uso flac.Primeiramente,  nenhum problema em usar flac, e se voc&ecirc; tem espa&ccedil;o em disco o fa&ccedil;a.  FLAC &eacute; muito mais flex&iacute;vel pois pode ser re-codificado para qualquer  outro formato sem perdas do tipo lossy -&gt; lossy (google: lossless lossy para mais informa&ccedil;&otilde;es).

Agora, dizer que voc&ecirc; ouve claramente a diferen&ccedil;a de mp3 320kbps pra flac na sua caixa-de-som multim&iacute;dia nova s&atilde;o outros quinhentos. 
Muita  gente com alguns milhares gastos em equipamentos de som diz que &eacute; muito  dif&iacute;cil detectar a diferen&ccedil;a entre 320k e o original, a n&atilde;o ser em  trechos bem espec&iacute;ficos e prestando muita aten&ccedil;&atilde;o. Mesmo mp3 V0 (245kbps  VBR) ainda &eacute; considerado muito dif&iacute;cil, e somente abaixo disso a  diferen&ccedil;a vai ficando realmente clara se o seu equipamento permitir.

Lhes  encorajo a fazerem o chamado teste ABX (google &eacute; seu amigo. Tem um plugin pro foobar2000 pra fazer isso, &eacute; bem simples), para ver at&eacute; onde voc&ecirc;s conseguem diferenciar.
som 24-bits/96KHz &eacute; muito melhor que 16-bits/44KHzSegundo  o Teorema de Nyquist, a frequ&ecirc;ncia de amostragem de um sinal anal&oacute;gico,  para que possa posteriormente ser reconstitu&iacute;do com o m&iacute;nimo de perda  de informa&ccedil;&atilde;o, deve ser igual ou maior a duas vezes a maior frequ&ecirc;ncia  do espectro desse sinal. (Wikip&eacute;dia)Os CDs n&atilde;o tem 44KHz  por acaso, a metade desse valor &eacute; 22KHz que &eacute; considerado o topo da  capacidade auditiva dos humanos (a maioria das pessoas ouve menos que  isso, e cai com a idade).

O teorema diz que o &aacute;udio original &eacute;  exatamente determinado por uma amostragem com o dobro da frequ&ecirc;ncia do  original, ent&atilde;o n&atilde;o existe vantagem para os nossos ouvidos em ouvir um  som digital PCM com amostragem maior que 44KHz.

Agora vamos aos bits...
16-bits  equivalem um total de 65.536 valores diferentes. Cada um desses valores  representa uma certa amplitude de onda, sendo 0 o mais baixo (sil&ecirc;ncio)  e 65.536 o ponto mais alto.
Sem entrar em muitos detalhes, esses  valores permitem uma faixa din&acirc;mica (diferen&ccedil;a entre sons mais baixos e  mais altos) de 96dB.
No caso de 24-bits, a faixa din&acirc;mica &eacute; 144dB.

Tudo  bem, s&oacute; tem um detalhe: a maioria das m&uacute;sicas modernas n&atilde;o passa de  40dB de faixa din&acirc;mica, e mesmo grava&ccedil;&otilde;es de orquestras em alta  qualidade n&atilde;o passam de 80dB.

O erro de quantiza&ccedil;&atilde;o (o erro da  representa&ccedil;&atilde;o em bits, por passinhos, em rela&ccedil;&atilde;o ao original) tamb&eacute;m &eacute;  muito pequeno e inaud&iacute;vel, portanto 16-bits s&atilde;o suficientes para um som  perfeito para humanos.

Por que existe 24-bits/96KHz ent&atilde;o?
A  vantagem desses formatos &eacute; para o est&aacute;gio de grava&ccedil;&atilde;o e mixagem, aonde  ser&atilde;o aplicados diversos filtros ao som, e ent&atilde;o &eacute; &uacute;til ter uma sobra  para evitar perdas de qualidade. Quem mexe com fotografia HDR sabe do  que estou falando.
Mas depois que est&aacute; pronto, 16/44 &eacute; suficiente.

Muitas  vezes &aacute;udio 24-bits/96KHz tem som melhor simplesmente porque foi  masterizado melhor, ou ent&atilde;o devido a implementa&ccedil;&atilde;o do seu hardware  trabalhar melhor com esses formatos, mas n&atilde;o &eacute; devido ao formato em si.
programa X tem som melhor que programa Y&Eacute; suficiente eu colar aqui um trecho da parte de perguntas e respostas do player foobar2000:O foobar2000 tem som melhor que outros players?

N&atilde;o.  A maioria das diferen&ccedil;as de qualidade de som que as pessoas ouvem  s&atilde;o placebo (pelo menos com m&uacute;sica real), j&aacute; que as diferen&ccedil;as pr&aacute;ticas  nas informa&ccedil;&otilde;es de &aacute;udio produzidas est&atilde;o abaixo do seu piso de ru&iacute;do  aud&iacute;vel (1 ou 2 &uacute;ltimos bits em amostras de 16-bits). O foobar2000 tem  recursos de processamento de som como resampling ou sa&iacute;da de &aacute;udio  24-bits para placas-de-som topo de linha, mas a maioria dos outros  players s&atilde;o capazes de fazer o mesmo a essa altura.Ou seja,  se um player tem som melhor que outro pra voc&ecirc;, ou &eacute; placebo, ou ent&atilde;o o  player est&aacute; aplicando algum filtro que lhe agrada, mas est&aacute; assim  modificando o som original sem voc&ecirc; saber.______________________________________

Se voc&ecirc; ainda est&aacute; a&iacute;, vamos ver um pouco mais sobre mp3...

Quem a&iacute; j&aacute; teve a (in)felicidade de estudar C&aacute;lculo, vai lembrar das s&eacute;ries de Fourier.  
Voc&ecirc;  tem uma fun&ccedil;&atilde;o matem&aacute;tica qualquer, e quando voc&ecirc; faz a transformada de  Fourier, voc&ecirc; transforma essa fun&ccedil;&atilde;o original em diversas componentes  sen&oacute;ides que somadas, retornam &agrave; fun&ccedil;&atilde;o original. Existem componentes de  frequ&ecirc;ncias mais baixas, e componentes de frequ&ecirc;ncias mais altas.

O  que se faz ao compactar &aacute;udio para mp3, &eacute; um processo chamado DCT  (discrete cosine transform) que &eacute; uma das varia&ccedil;&otilde;es da transformada de  Fourier. Ent&atilde;o, dependendo da qualidade escolhida para o mp3, ser&atilde;o  descartadas as componentes de frequ&ecirc;ncia mais alta.

Por que isso da certo?
Simples, porque a maior parte da informa&ccedil;&atilde;o original est&aacute; contida nas frequ&ecirc;ncias mais baixas. Veja essa imagem:

A  onda original est&aacute; em preto. As outras s&atilde;o componentes (se somadas, o  resultado ser&aacute; a preta). Repare que se eu descartar a componente roxa  n&atilde;o vai fazer muita diferen&ccedil;a. Mas se eu descartar a vermelha, vai tudo  pro espa&ccedil;o.

&Eacute; f&aacute;cil ver a diferen&ccedil;a de um mp3 (mesmo 320k) pro  original se voc&ecirc; olhar em um espectrograma (que mostra a intensidade de  cada frequ&ecirc;ncia), voc&ecirc; vai notar que as frequ&ecirc;ncias mais altas somem no  mp3 (quanto pior a qualidade, mais se perdem altas frequ&ecirc;ncias).
Mais  isso se traduz em pouca perda aud&iacute;vel, pois h&aacute; poucas informa&ccedil;&otilde;es  relevantes nas altas frequ&ecirc;ncias, e a grande maioria das m&uacute;sicas j&aacute; tem  pouca informa&ccedil;&atilde;o nessa faixa pra come&ccedil;ar.
O mp3 leva ainda em considera&ccedil;&atilde;o outras caracter&iacute;sticas da audi&ccedil;&atilde;o humana (psicoac&uacute;stica), mas n&atilde;o vamos entrar nesse m&eacute;rito.

Esse &eacute; exatamente o mesmo  princ&iacute;pio usado na compacta&ccedil;&atilde;o JPEG (no caso para imagens), e &eacute; raz&atilde;o  pela qual por exemplo, textos pretos em um fundo branco ficam horr&iacute;veis  em JPEG. O contraste branco/preto &eacute; uma mudan&ccedil;a brusca, uma alta  frequ&ecirc;ncia. 
Da  mesma forma como no mp3, quando o JPEG &eacute; aplicado a uma foto real, a  diferen&ccedil;a percept&iacute;vel &eacute; muito pequena se a qualidade do JPEG for alta.

EDIT: Ah, devo lembrar que, embora eu esteja falando sempre de mp3, todos os outros formatos de &aacute;udio lossy (como Vorbis e AAC) s&atilde;o baseados em transformadas de Fourier, bem como formatos de imagem e v&iacute;deo lossy.
As diferen&ccedil;as est&atilde;o em outros detalhes e otimiza&ccedil;&otilde;es (as vezes um formato &eacute; melhor para certo tipo de dado do que outro).

Answer

Muito bom!!!

Answer

Colega, de onde &eacute; este texto, e a fonte permite copiar para publicar em outros locais?

Answer

E eu que sempre achei que tinha uma audi&ccedil;&atilde;o inferior pois n&atilde;o conseguia distinguir as diferen&ccedil;as de qualidade entre o Player A x Player B.

T&aacute; a&iacute; uma informa&ccedil;&atilde;o &uacute;til

Parabens

Answer

JUNIM disse: Colega, de onde &eacute; este texto, e a fonte permite copiar para publicar em outros locais?

Pergunta pertinente!

Answer

Tirando a quest&atilde;o da fonte do texto, o conte&uacute;do &eacute; muito bom!

Answer

Olha eu acho que a fonte &eacute; simples pesquisa dele mesmo. Ele mesmo citou v&aacute;rias refer&ecirc;ncias (Wikicion&aacute;rio, Teorema de Nyquist,  Faq do Foobar).

Como estudante de engenharia el&eacute;trica, confirmo o que ele disse sobre corte de frequ&ecirc;ncias altas e o teorema l&aacute; de Nyquist. Eu tamb&eacute;m acho que ele quer que agente pesquise pra que n&oacute;s mesmo possamos confirmar, n&atilde;o?

S&oacute; alguns adendos: As vezes, o corte efetuado em frequ&ecirc;ncias altas &eacute; proposital, pois &eacute; l&aacute; onde ficam a maioria dos ru&iacute;dos.

Em rela&ccedil;&atilde;o &aacute; qualidade, bem, como tamb&eacute;m trabalho com sonoplastia, posso dizer que a qualidade est&aacute; mais ligada ao equipamento do cara que grava do que do cara que escuta. Se o cara gravou mal, n&atilde;o ajustou a equaliza&ccedil;&atilde;o, n&atilde;o colocou filtro adequados, num tem equipamento bom que ajeite.

Answer

O problema dos 16/24 bits &eacute; justamente o fato de usar 24 na mixagem e renderizar para 16. Por mais que 24bits forne&ccedil;am um maior headroom na mixagem, ao passar para 16 inevitavelmente voc&ecirc; acaba comprimindo o sinal de &aacute;udio (no sentido amplitude da onda, n&atilde;o de compress&atilde;o de dados). Por isso que &eacute; bem comum voc&ecirc; ouvir gente falando que &aacute;udio de CD tem muito menos din&acirc;mica do que uma fonte anal&oacute;gica. Pra piorar a situa&ccedil;&atilde;o, na hora da masteriza&ccedil;&atilde;o, muitos engenheiros ainda colocam um compressor para deixar a m&uacute;sica mais alta. A famosa loudness war.

Eu discordo tamb&eacute;m um pouco de ser imposs&iacute;vel identificar a diferen&ccedil;a entre um MP3@320kbps e um formato lossless. Pode ser imposs&iacute;vel se voc&ecirc; n&atilde;o costuma usar equaliza&ccedil;&atilde;o. A partir do momento que voc&ecirc; sobe os agudos de um MP3 j&aacute; &eacute; poss&iacute;vel notar uma perda significativa de clareza nessa faixa. Utilizando fones de monitora&ccedil;&atilde;o, como o MDR-7502 da Sony, tamb&eacute;m &eacute; poss&iacute;vel perceber sem muito esfor&ccedil;o a diferen&ccedil;a entre uma fonte lossless e outra lossy.

Fergo

Answer

Fergo disse: O problema dos 16/24 bits &eacute; justamente o fato de usar 24 na mixagem e renderizar para 16. Por mais que 24bits forne&ccedil;am um maior headroom na mixagem, ao passar para 16 inevitavelmente voc&ecirc; acaba comprimindo o sinal de &aacute;udio (no sentido amplitude da onda, n&atilde;o de compress&atilde;o de dados). Por isso que &eacute; bem comum voc&ecirc; ouvir gente falando que &aacute;udio de CD tem muito menos din&acirc;mica do que uma fonte anal&oacute;gica. Pra piorar a situa&ccedil;&atilde;o, na hora da masteriza&ccedil;&atilde;o, muitos engenheiros ainda colocam um compressor para deixar a m&uacute;sica mais alta. A famosa loudness war.
Loudness war

Answer

JUNIM disse: Colega, de onde &eacute; este texto, e a fonte permite copiar para publicar em outros locais?
A fonte sou eu mesmo. 
Aonde necess&aacute;rio eu citei as fontes.

Se quiser pode copiar aonde quiser hehe.

Fergo disse: O problema dos 16/24 bits &eacute; justamente o fato de  usar 24 na mixagem e renderizar para 16. Por mais que 24bits forne&ccedil;am um  maior headroom na mixagem, ao passar para 16 inevitavelmente voc&ecirc; acaba  comprimindo o sinal de &aacute;udio (no sentido amplitude da onda, n&atilde;o de  compress&atilde;o de dados). Por isso que &eacute; bem comum voc&ecirc; ouvir gente falando  que &aacute;udio de CD tem muito menos din&acirc;mica do que uma fonte anal&oacute;gica. Pra  piorar a situa&ccedil;&atilde;o, na hora da masteriza&ccedil;&atilde;o, muitos engenheiros ainda  colocam um compressor para deixar a m&uacute;sica mais alta. A famosa  loudness war.A taxa de amostragem n&atilde;o tem haver com amplitude de onda, ela &eacute; a quantidade de pontos (as amostras) por faixa de tempo considerada (no caso s&atilde;o 44.100 pontos por segundo).
Mas de acordo com o teorema &eacute; poss&iacute;vel reduzir a amostragem de 96KHz para 44KHz sem problemas, desde que o &aacute;udio contenha apenas frequ&ecirc;ncias iguais ou menores a 22KHz.
Geralmente s&atilde;o aplicados filtros para cortar qualquer som acima de 22KHz antes de passar pra amostragem de 44KHz, para evitar artefatos.

A din&acirc;mica (ou seja a amplitude) tem haver &eacute; com os bits, mas como eu j&aacute; disse no texto, 16-bits &eacute; din&acirc;mica suficiente para m&uacute;sica, mesmo m&uacute;sica de alta qualidade (n&atilde;o afetada pela loudness war).

Fergo disse: Eu discordo tamb&eacute;m um pouco de ser imposs&iacute;vel identificar a diferen&ccedil;a  entre um MP3@320kbps e um formato lossless. Pode ser imposs&iacute;vel se voc&ecirc;  n&atilde;o costuma usar equaliza&ccedil;&atilde;o. A partir do momento que voc&ecirc; sobe os  agudos de um MP3 j&aacute; &eacute; poss&iacute;vel notar uma perda significativa de clareza  nessa faixa. Utilizando fones de monitora&ccedil;&atilde;o, como o MDR-7502 da Sony,  tamb&eacute;m &eacute; poss&iacute;vel perceber sem muito esfor&ccedil;o a diferen&ccedil;a entre uma fonte  lossless e outra lossy.
 
 FergoEu n&atilde;o disse que &eacute; imposs&iacute;vel, s&oacute; disse que requer equipamento excelente e muita concentra&ccedil;&atilde;o, e trechos espec&iacute;ficos das m&uacute;sicas.

Claro que se voc&ecirc; come&ccedil;ar a mexer no equalizador de prop&oacute;sito voc&ecirc; vai facilitar a audi&ccedil;&atilde;o da diferen&ccedil;a, assim como quando voc&ecirc; aumenta o contraste de uma foto voc&ecirc; v&ecirc; muito mais facilmente os artefatos JPEG.

Answer

Esse &eacute; um assunto que rende muito debate e existem bons argumentos de ambos os lados.
Eu sou da turma que n&atilde;o consegue diferenciar um mp3 de um flac na maioria das situa&ccedil;&otilde;es, somente em casos extremos.

Mas hoje em dia a abordagem sobre o esse assunto deve ser por um &acirc;ngulo diferente: O mp3 ainda &eacute; justific&aacute;vel e v&aacute;lido?

O mp3 foi criado em um tempo onde, por uma s&eacute;rie de limita&ccedil;&otilde;es era justific&aacute;vel alterar e diminuir a qualidade original do &aacute;udio.
Mas com a evolu&ccedil;&atilde;o da tecnologia como um todo, a maioria dessas limita&ccedil;&otilde;es est&atilde;o sendo superadas e pra mim o mp3 j&aacute; &eacute; passado.
 
- Hoje em dia espa&ccedil;o de armazenamento no pc n&atilde;o &eacute; problema com os hds chegando na casa dos terabytes.
- Transmiss&otilde;es atrav&eacute;s da internet n&atilde;o &eacute; mais problema com a da banda larga evoluindo gradativamente.
- Mesmo nos port&aacute;teis, um dos poucos segmentos onde o mp3 ainda &eacute; justific&aacute;vel, aos poucos est&atilde;o sendo superados pois j&aacute; temos discos dvd e bluray, players port&aacute;teis e pendrives chegando nas dezenas e centenas de gigabytes de armazenamento.

Enfim, n&atilde;o se justifica mais continuar utilizando um codec de manipula&ccedil;&atilde;o t&atilde;o restrito que altera e diminui a qualidade original do &aacute;udio.
Quando eu digo manipula&ccedil;&atilde;o me refiro a praticidade dos codecs lossless de serem editados ou mesmo convertidos para outros formatos quantas vezes forem necess&aacute;rios mantendo a mesma qualidade do arquivo original.

Answer

elissonandrade disse: Em rela&ccedil;&atilde;o &aacute; qualidade, bem, como tamb&eacute;m  trabalho com sonoplastia, posso dizer que a qualidade est&aacute; mais ligada  ao equipamento do cara que grava do que do cara que escuta. Se o cara  gravou mal, n&atilde;o ajustou a equaliza&ccedil;&atilde;o, n&atilde;o colocou filtro adequados, num  tem equipamento bom que ajeite.Exatamente cara.
As pessoas se preocupam muito com esses detalhes insignificantes (pelo menos na grande maioria dos casos) que eu mencionei, e se esquecem que grande parte das m&uacute;sicas de hoje s&atilde;o masterizadas muito porcamente, e tem sua din&acirc;mica totalmente comprimida.

Procurem ouvir &aacute;lbuns bem masterizados, como por exemplo, os &aacute;lbuns do Dire Straits (Brothers in Arms em especial). Aquilo sim &eacute; qualidade e din&acirc;mica.

flattakk disse: Mas hoje em dia a abordagem sobre o esse assunto deve ser por um &acirc;ngulo diferente: O mp3 ainda &eacute; justific&aacute;vel e v&aacute;lido?Correto.
Como eu falei, se puder usar flac use.
No m&iacute;nimo, voc&ecirc; vai ganhar a flexibilidade de poder re-codificar pra qualquer outro formato quantas vezes quiser sem perdas.

EDIT: Quer ver uma prova de que a gente se preocupa muito com o que n&atilde;o deve? Olhem isso:

(ambos gr&aacute;ficos aqui medidos por Tyll Hertsens da HeadRoom)

Isso &eacute; a resposta de um dos melhores fones de ouvido que existem, o Audez'e LCD-2, reproduzindo uma onda quadrada de 300Hz. Reparem as oscila&ccedil;&otilde;es (claro que parte dessas oscila&ccedil;&otilde;es se devem tamb&eacute;m ao resto do equipamento usado, mas que certamente est&aacute; &agrave; altura do fone).

Ah, esse fone custa uns 950 d&oacute;lares.

Agora olha a medida de um Sony Qualia, que &eacute; um modelo mas antigo, mas que &eacute; considerado tamb&eacute;m um fone excelente e tem status quase lend&aacute;rio entre os audi&oacute;filos:

Legal n&eacute;? E a gente se preocupando com diferen&ccedil;a de som entre player.

Answer

Vitor Machado disse: 
A taxa de amostragem n&atilde;o tem haver com amplitude de onda, ela &eacute; a quantidade de pontos (as amostras) por faixa de tempo considerada (no caso s&atilde;o 44.100 pontos por segundo).

Sim, mas eu n&atilde;o estava falado da taxa de amostragem, estava falando da quantidade de bits, que corresponde ao eixo Y (amplitude) onda:

Fergo disse: O problema dos 16/24 bits &eacute; justamente o fato de  usar 24 na mixagem e renderizar para 16. [...]

Fergo

Answer

Fergo disse: Sim, mas eu n&atilde;o estava falado da taxa de amostragem, estava falando da quantidade de bits, que corresponde ao eixo Y (amplitude) onda:
FergoOpa verdade, falha nossa.
Mas enfim, eu comentei os dois j&aacute;.

Answer

Vitor Machado disse: Legal n&eacute;? E a gente se preocupando com diferen&ccedil;a de som entre player.

A coisa ainda pode ser pior: j&aacute; li sobre gente que se preocupava com a cor do pl&aacute;stico isolante do fio das caixas de som, jurando que fazia diferen&ccedil;a no som...

Trabalhei com &aacute;udio profissional, mas cheguei at&eacute; o Pro Tools 24 bits a 44.1KHz antes de mudar de profiss&atilde;o. Como o m&aacute;ximo que fiz foi gravar ao vivo em adat 20 bits, transferir para Pro Tools, mixar e pr&eacute;-masterizar para CD, e trabalhei muito com jingles e spots, n&atilde;o posso dizer que experimentei o melhor em &aacute;udio.

Ferramentas

Mover Tópico