Logo Hardware.com.br
VEHUIAH-
VEHUIAH- Novo Membro Registrado
10 Mensagens 6 Curtidas

Tutorial básico de escolha de VGA/Placa de video

#1 Por VEHUIAH- 24/04/2011 - 01:28
Versão 2.0 - alterado conforme moderação.



Primeiramente o que é renderização? Renderização é o processo de gerar uma imagem a partir de um ou vários modelos, formando uma cena. Um arquivo de cena contém objetos definidos por uma estrutura de dados, que deve conter:

A geometria, perspectiva, textura, iluminação, sombreamento e informações como a descrição da cena virtual.

Os dados contidos no arquivo de cena são então passados para um programa para ser processado e dar saída para uma imagem digital ou arquivo de imagem raster. A pipeline de gráficos ao longo de um dispositivo de processamento, como uma GPU.


Placa de vídeo


VGA (Video Graphics Adapter) é o principal responsável pela parte de desempenho gráfico 3D, em programas de edição/criação/reprodução de imagem e vídeo, e principalmente jogos para computador. O GPU (Graphics Processing Unit) é o processador da placa, embora voce veja algumas pessoas se referindo ao conjunto genericamente como GPU. A GPU é um dispositivo, construído para poder ajudar a CPU na execução cálculos complexos de renderização. No interior uma GPU tem um programa cuidadosamente projetado, com base em uma mistura seletiva de disciplinas relacionadas com: física de luz, percepção visual, matemática e desenvolvimento de software.

Off-board/On-board, Dedicada/ Integrada


On-board: Placa de vídeo com baixo desempenho, integrado na placa mãe.

Off-board: Placa ‘ solta’, com desempenho normalmente superior a uma placa on-board, mas por outro lado são muito mais caras e consomem mais energia.

Essa nomenclatura está sendo substituída em anúncios por ‘Dedicada /Integrada’, não apenas por uma questão de tradução, mas como estratégia para evitar a má impressão que a palavra ‘on-board’ causava em muitos, devido ao desempenho fraco. Mas o esquema na pratica para usuários, segue igual: Dedicada= off-board, Integrada= on-board.

OBS: placas com memórias “compartilhadas” = integrada.


Quantidade de Memoria (Medido em MB/GB)


A quantidade de memória define o volume de informações que a VGA pode manter em sua memória própria, para acesso rápido pela GPU. Basicamente pode ser visto como a relação da memória RAM com a CPU do computador. Quanto maiores a resolução, quantidade de efeitos, dados de texturas e cor, mais memória será alocada, então uma placa de baixo desempenho, não precisará de muito mais que 512 MB de memória de vídeo. Já uma placa mais forte/cara como uma GTX 560 TI, pode aproveitar muito melhor 1 GB de memória para manipular.

Esta é a informação preferida pelos fabricantes e vendedores para fazer propaganda de uma placa, mas aqui mora uma armadilha aos usuários: muitas vezes a quantidade de memória exposta não corresponde ao nível das demais especificações, maquiando o real desempenho.

Ex: ATI RADEON 6470M 1 GB DDR3 > GTX 460 768 MB ? Não.
VEHUIAH-
VEHUIAH- Novo Membro Registrado
10 Mensagens 6 Curtidas
#2 Por VEHUIAH-
24/04/2011 - 01:29
Largura do barramento de memória (Memory Interface, bus witdh)(Medido em bits)



Imagine a largura de barramento como varias pistas de uma avenida. Então no caso de um barramento de 64 bits, temos 64 pistas. Quando a GPU solicita dados à memória, esses dados passaram por estas pistas. Porem mesmo que a memória tenha mais dados armazenados, eles não poderão ser enviados se todas estas pistas já tiverem outros dados passando, e terão que esperar até o próximo ciclo de clock. Agora se essa avenida tivesse 128 pistas, ou 128 bits, o dobro de dados poderia passar. Por este motivo o barramento de memória é importante, quanto mais ‘largo’, mais dados conseguira transferir por vez.
Modelos com menos de 128 bits devem ser evitados.

Tipos de memória:



Para o usuário a diferença entre os tipos de memória é basicamente o aumento de freqüência entre cada uma, e o consumo elétrico. As memórias atuais em ordem de desempenho x consumo são: GDDR3, GDDR4 e GDDR5. Basicamente o que precisa ser observado será o clock mesmo.


Velocidade da Memoria (Medido em MHz/GHz)



A mesma VGA pode ter diferentes velocidades de operação, todas devem ser consideradas para avaliar se o conjunto é equilibrado, pois um valor muito baixo pode significar uma placa castrada, os principais dados aqui são: memory clock, Core/GPU clock, shader clock. Com o memory clock e a largura de banda você pode descobrir o Memory Bandwidth da placa. Com o Core clock, o numero de Pipelines/ROPs/TMUs você obtém a Fill Rate. Fórmulas descritas mais a frente.
Para evitar confusões:

Memory clock= memory speed= velocidade da memória= freqüência da memória
Core clock= GPU clock=core speed= velocidade da GPU= freqüência da GPU
Shader clock= shader speed= stream processor clock= freqüência do shader

Latência e Temporizações de memória



Existem ainda os dados de temporização da memória, que são como ‘intervalos’ programados entre ações da memória. Esses intervalos são extremamente curtos, na casa dos ns (nanossegundo, 1ns = 1 seg/1000000000). As temporizações vem com 4 a 5 valores definidos:

Ex:

2-3-2-6-T1, 7-7-7-21 ou 2-3-2-6

Esta numeração segue o padrão: CL-tRCD-tRP-tRAS-CMD.

CAS Latency (CL)
A latência CAS define quantos ciclos de clock a memória irá levar a retornar uma resposta de solicitação de dados.

RAS to CAS Delay (tRCD)
O número de ciclos de clock necessários entre uma ativação de endereço de linha (RAS) e o endereço de coluna (CAS). O tempo de ler o primeiro bit da memória sem uma linha ativa, é tRCD+CL.

RAS Precharge (tRP)
O número de ciclos de clock necessário entre a emissão do comando de pré-carga (desativar) e de abertura a próxima linha.

Row Active Time (tRAS)
O número de ciclos de clock necessários para acessar uma linha de dados na memória entre a solicitação de dados próxima pré-carga. É conhecida como ativo para atrasar pré-carga.

Command Rate (CMD)
Tempo demorado entre o chip de memória ter sido ativado e o primeiro comando poder ser enviado para a memória. Valor varia entre 1 ou 2, nem sempre informado.

OBS: É possivel fazer um ‘overclock’ nas temporizações da memória RAM, pelo setup da BIOS, embora nem toda placa-mãe permita alterar estes valores. OBS2: ao fazer o overclock comum na memória (clock), acaba diminuindo a tolerância de redução da temporização, é recomendável tentar diminuir estes valores após o overclock estabilizado e não antes, mas isto é assunto para outro tópico.


Vale observar que o intervalo de temporização não é um delay fixo, ele apenas determinada um numero X de pulso de clock da memória. Isto significa que uma memória com CL5, mas freqüência alta pode ter um intervalo real menor que uma memória com CL2, mas com clock bem mais baixo.

Pela latência é possível descobrir a freqüência real (sem o multiplicador DDRx) que a memória opera, usando o exemplo de uma memória com 7,5 ns:

Freqüência real =1000/ns
1000/7,5=133 Mhz

Memory Bandwidth



A forma mais básica de avaliar o desempenho da VGA, quando não há testes disponíveis no mercado de um produto novo, é calculando o memory bandwidth, que como sugere a formula, é a taxa de transferência de dados que a placa pode dar para GPU. O desempenho final ainda dependera do uso dos ROPS, TMUs, stream processors, arquitetura, entre outros, mas ainda assim é uma base importante.

Formula: Bit X Clock da Memória/8 = Banda em MB/s

Ex:

ATI 6470M
Memory clock: 1600MHZ
Largura de banda: 64 bits

64x1600/8= 12,8 GB/s
VEHUIAH-
VEHUIAH- Novo Membro Registrado
10 Mensagens 6 Curtidas
#3 Por VEHUIAH-
24/04/2011 - 01:31
Particularidades da arquitetura/ GPU:



Sabendo se sua memória é dedicada, a quantidade de memória, tipo de memória e velocidades de clock já é uma parte do que você precisa saber na hora de escolher sua placa de vídeo... Isso até alguns anos atrás.
Porém no cenário atual, com a melhor utilização das novas versões do DirectX, ROPs, TMUs e stream processors em jogos, e ainda no uso de especificações de venda diferentes pela AMD e Nvidia a coisa se complicou um pouco.
Para entender melhor o motivo de tudo isso, entenda resumidamente como funciona o processo:


Graphics Pipeline:



Imagine o Graphic Pipeline como uma linha de produção de uma fabrica de refrigerantes, por exemplo, em que estará definido o que cada ‘operário’ irá fazer e a ordem em que isso será feito. Este método varia mesmo entre placas de vídeo do mesmo fabricante, então caso você procure, achará outros métodos, embora algumas etapas sejam essenciais e iguais em todas placas de vídeo, assim como a ordem de execução. O graphic pipeline, não é um componente físico da placa de vídeo, ou uma especificação que você pode achar na descrição da placa, mas um processo que define como a GPU trabalhará para efetuar a renderização ou mais simplesmente o que ela faz para que uma cena seja exibida na tela.







Método exemplo de execução de Graphic Pipeline:



Transformação


Esta etapa consome dados sobre os polígonos com vértices, arestas e faces que compõem a cena. Uma matriz controla as transformações lineares (escala, translação, rotação, etc.) e as transformações de visão (visão do mundo e espaço), que devem ser aplicadas sobre esses dados.

Per-vertex lighting



As formas na cena 3D completa são iluminadas de acordo com os locais definidos de fontes de luz, de refletância e propriedades de superfície. As atuais implementações de hardware do graphic pipeline, calcula a iluminação apenas nos vértices dos polígonos que estão sendo processado. Os valores de iluminação entre os vértices são então interpolados durante a rasterização. A iluminação Per fragment (ou per-pixel) pode ser feita em hardware gráfico moderno como um processo de pós-rasterização, por meio de dos shaders.

Um shader é um conjunto de instruções de software que é usado principalmente para calcular os efeitos de processamento de gráficos com um elevado grau de flexibilidade.

Vertex shaders são executados uma vez para cada vértice dado ao processador de gráficos, considere isto mais ou menos como uma posição em um daqueles gráficos que você viu na escola ( pos x,y[7,2]). O objetivo é transformar a posição 3D de cada vértice no espaço virtual para o coordenadas 2D em que aparece na tela (bem como um valor de profundidade para o Z- buffer ). Os vertex shaders podem manipular propriedades como posição, cor e cordenada da textura, mas não pode criar novos vértices. A saída de dados do vertex shader vai para a próxima fase do pipeline, que pode ser para o geometry shader, ou o para o processo de rasterization.


Transformation ao modo ‘Viewing’



Os objetos são transformados de coordenadas do espaço em 3d em um sistema de coordenadas 3d baseado na posição e orientação de uma câmera virtual. Isso resulta na cena 3D original como pode ser visto a partir do ponto de vista da câmera (chamado de ‘espaço do olho da câmera’), definindo o campo de visão da cena.

Geração de primitivas



Depois da transformação, novas formas primitivas são geradas a partir dos modelos primitivos que foram enviadas para o início do graphic pipeline.

Este processado será executado por um geometry shader. Ele pode gerar novas formas gráficas primitivas (cubo,triangulo, pirâmide, etc.).

Programas de geometry shader são executados após vertex shaders. Eles tomam como entrada um conjunto primitivo, possivelmente com a informação de adjacência. Por exemplo, quando operando em triângulos, os três vértices são a entrada do geometry shader. O shader pode então emitir zero ou mais primitivas, que são rasterizados e seus fragmentos finalmente passados para um pixel shader.


Transformação de projeção



Em uma projeção em perspectiva, os objetos que estão distantes da câmera são feitos menores (cortados). Neste estágio do graphic pipeline, a geometria é transformada a partir do ‘espaço do olho da câmera’ no processamento em um espaço de coordenadas 3D chamado ‘Homogeneous Clip Space’, que define bem os limites de imagem. O range de tela exibido, vai de acordo com a API gráfica (Direct3D ou OpenGL). Simplificando, a Transformação de projeção é responsável por mapear os planos do volume de ‘visão de câmera’ para os planos da caixa que compõe o Clip Space.

Clipping



Primitivas geométricas que agora estão fora do campo de visualização, não serão visíveis e são descartados nesta fase. O Clipping não é necessário para conseguir uma saída de imagem correta, mas ela acelera o processo de renderização, eliminando a rasterização desnecessária e pós-processamento em primitivos que não iriam ser vistos

Viewport transformation



Os vértices pós-clipping são transformadas novamente para a janela do espaço. Isto significa a aplicação de uma escala (multiplicando pela largura da janela) e um viés (aumentando o deslocamento da origem da tela). Neste ponto, os vértices têm coordenadas que se relacionam diretamente com pixels em raster.

Rasterization (rasterização) ou Conversão de busca



É a tarefa de tomar uma imagem descrita em um formato de gráficos vetoriais e convertê- lo em uma imagem raster (pixels ou pontos) para saída em no monitor. Imagine esta etapa como o mesmo processo de uma figura criada no Corel Draw. Para manipular a figura sem um limite definido é preciso usá-la em formato vetorial, assim podemos mudar sua posição, tamanho, dimensão sem perder dados ou qualidade, pois manipulando em forma vetorial elas se tornam objetos, e não apenas um grupo de pixels.

A partir de agora, as operações serão realizadas em cada pixel individual. Esta fase é bastante complexa, envolvendo várias etapas, que como grupo podem ser definido como a fase de processamento do pixel pipeline.

Texturização, fragment shading


Nesta fase, é atribuída uma cor aos fragmentos individuais (ou pré-pixels) com base em valores interpolados a partir dos vértices durante a rasterização ou de uma textura na memória (em conjunto com operação da TMU).

Display (Exibição)



Os pixels já coloridos podem receber os efeitos finais, e ser exibidos em um monitor.



______________________________________________________________________________________________

ROPS
(Raster Operations Pipelines/ Render Output Pipelines):
Os ROPs entram em ação no final do processo de renderização. Eles são responsáveis pela aplicação de filtros adicionais, dos algoritmos de anti-aliasing, cálculo de profundidade e outras operações. O número de ROPs disponíveis na placa não é um indicador direto de desempenho, pois o volume de processamento executado por cada unidade varia muito de acordo com a arquitetura da placa.
Os ROPs são mais exigidos (em relação aos demais componentes da placa) ao utilizar as opções mais pesadas de anti-aliasing e ao ativar o uso de mais filtros e efeitos diversos.


TMUs (Texture Mapping Units) unidades de processamento de texturas que trabalham em conjunto com as unidades de processamento de shaders, carregando texturas utilizadas na cena. Embora o trabalho das TMUs seja muito mais simples do que o das unidades de pixel shader, elas podem ser um limitante em algumas situações, sobretudo ao ativar o uso da Filtragem Anisotrópica, que resulta em um grande número de operações relacionadas ao carregamento de texturas. O desempenho das unidades de texturas também é muito dependente do barramento com a memória.

Fill Rate (Taxa de preenchimento) A velocidade com que sua VGA consegue renderizar pixels e texturas. GPUs com um fill rate alto, podem usar opções mais pedadas de Anti-aliasing e Filtragem anisotrópica (conseqüentemente aumentando a qualidade da cena na tela) sem perder tanto desempenho, assim como mais cores com um framerate maior que outras placas com fill rate inferior.

Formula1: Número de Pipelines[ROPs] * Clock da GPU = Pixel Fill Rate
(GPixel/s)


Ex:

GeForce 6800GT (16 ROPs, clock 350 MHz)
16 X 350 = 5,6 GP/s


GTX 460 (32 ROPs, clock 650 MHz)
32 * 650= 20,8 GP/s

Formula2: Número de TMU * Clock da GPU= Texture Fill Rate (GTexel/s)

Ex

GeForce 6800GT: (16 TMUs, clock 350 MHz)
16 X 350 = 5,6 GT/s


GTX 460 (56 TMUs, clock 650 MHz)
56 * 650= 36,4 GT/s

http://img715.imageshack.us/img715/1909/unifiedpipeline.jpg
VEHUIAH-
VEHUIAH- Novo Membro Registrado
10 Mensagens 6 Curtidas
#4 Por VEHUIAH-
24/04/2011 - 01:32
Stream processors

Stream Processors ou Shaders Unificados são tidos como substitutos dos ROPs, mas acabaram não assumindo totalmente o trabalho de renderização, vieram a trabalhar em conjunto com ROPs e TMUs, ainda que em maior número.

Se você leu todo processo do graphic pipeline, deve ter ao menos uma idéia, o processamento já é bem complexo, e inicialmente os processos de Pixel Shader e Vertex Shader ainda eram feitos de modo separado. O Pipeline ou processava somente Pixel Shader, ou somente Vertex Shader. O problema deste modelo é que as aplicações podem exigir mais operações de Pixel que Vertex shader e vice-versa, deste modo acontece de haver ociosidade do conjunto para o processo de instruções. Com o surgimento dos Stream ele unificou em paralelo o tratamento de vértices e pixels, ou seja, um Stream processor pode tanto processar Pixel Shader, como processar Vertex Shader.

A quantidade de Stream Processor divulgado pela Nvidia e pela ATI é muito diferente, pois elas não usam nem o mesmo padrão de arquitetura, nem o mesmo tipo de contagem. Mas para não ficar totalmente às cegas, existe um método de comparação entre estes números, que apesar de não ser exato, é ‘proporcional’, ele também considera o fato de que nem todos Stream Processors são usados o tempo todo:

Razão Stream Processors ATI-AMD: SPs divulgados / 5
Razão Stream Processors Nvidia: SPs divulgados / 2

Ex:

ATI RV770
SP=800
800/5= 160 SPs

Nvidia GT200
SP= 240
240/2= 120 SPs

Então basicamente, você pode dividindo o valor das placas ATI por 5 e o da Nvidia por 2, achando um valor similar e uma equivalência teórica entre as placas Nvidia e ATI. Obviamente, comparar por lista extensas de benchmarks ou testes práticos é mais eficaz, mas é um modo que pode complementar sua escolha, ou teste adicional.


DirectX



Conjunto de especificações que fazem o intermédio entre hardware (VGA) e software (games, etc), influenciando no desempenho e comportamento de acesso aos recursos da placa de vídeo, som e rede. Cada versão do pacote vem com melhorias na utilização dos recursos de VGA, além de utilizar uma versão melhorada do shader model, muito utilizada nos jogos atuais. Porém a atualização da versão do DirectX em si não faz com que todos os aplicativos ou jogos utilizem essas novas instruções e os novos shader model, dependerá do suporte de cada um.

DirectX 8.1 = Shader Model 1.4
DirectX 9.0 = Shader Model 2.0
DirectX 9.0c = Shader Model 3.0
DirectX 10 = Shader Model 4.0
DirectX 11 = Shader Model 5.0


A questão da necessidade da ultima versão do DX, varia conforme o destino de uso e também limitação da própria VGA.
Por exemplo, uma Radeon HD 6250 (integrada) mesmo que tenha suporte a DX 11, em alguns casos não tem poder nem para rodar jogos Dx 9 direito, muito menos Metro 2033 ou similares. O problema não é o DirectX em si ser mais pesado, a questão é, como o DX 11 é novo, apenas softwares recentes utilizam seus recursos, e quanto mais recente um game, em geral maior será os requisitos para rodá-lo. Isto torna o suporte ao DX 11 um tanto quanto questão de marketing em placas low-end, já que ao você rodar um jogo antigos feito para DirectX 8 ou 9 por exemplo, ele será incapaz de usar as instruções otimizadas do DX 11.

Obs: além da placa, é necessário verificar se seu sistema operacional suporta determinada versão. A ultima versão suportada oficialmente pelo Windows XP é a 9.0c e, mediante gambiarra o 10. O Directx 10.1 e 11 só é suportado pelo Windows Vista e Windows 7.



Outras informações:



TDP: Thermal design power.



É o maximo de energia térmica que pode ser dissipado pela VGA . É importante saber isto, quando se compra uma placa de alto desempenho ou mais ainda para CrossFire/SLI, para ter certeza que cooler/ sistema de refrigeração de seu computador será suficiente para não ultrapassar o limite térmico dos componentes, causando OverHeat (SuperAquecimento). O TDP para um usuário doméstico é quase impossível alcançar, então o valor informado pelo fabricante já pode ser considerado com um ‘limite de segurança’ embutido.

Consumo:



Para ter certeza que sua fonte fornece a energia necessária para alimentar sua VGA com os demais componentes do computador, é recomendável verificar qual o consumo Maximo da placas, para evitar danos em equipamentos, ou mal funcionamento.

VEHUIAH-
VEHUIAH- Novo Membro Registrado
10 Mensagens 6 Curtidas
#5 Por VEHUIAH-
24/04/2011 - 01:33
Barramento de comunicação:



Sobre o slot de comunicação, a principal preocupação do usuário é verificar se sua placa-mãe possui um espaço para PCI-Express 2.0 disponível, caso sua placa utilize este conector. Já a ‘escolha’ entre um padrão e outro dificilmente ocorrera, já que as AGP estão quase extintas, e placas-mãe com PCI-Express 2.0 são compatíveis com a primeira versão. Quanto ao PCI-Express existem placas PCI-E 1x, 4x, 8x e 16x, porém o conector usado para encaixar na placa-mãe é do mesmo então não haverá problema de imcompatibilidade.

CrossFire & SLI:



CrossFire e SLI são tecnologias, da ATI (AMD Radeon) e Nvidia (GeForce), para usar 2 ou mais placas de vídeo em um mesmo computador ao mesmo tempo. Embora o desempenho (e consumo de energia) melhore bastante, não chega a equivaler a potencia total das placas individualmente somadas, ficam na casa dos 60 a 80% normalmente.


Recursos Gráficos



Antialiasing: Também chamado de Full Screen Anti-Aliasing (FSAA), ou simplesmente Antialiasing (AA). Como o nome indica, este é um método que neutraliza o efeito de aliasing. Qual é Aliasing? Aliasing é a serrilha e pixelation que você vê nas imagens do computador - particularmente visível em coisas como as bordas retas das paredes, ou o esboço de prédios e terrenos em jogos 3D. Esse efeito pode ser superado de duas formas: através do aumento da resolução em que exibe seu jogo (por exemplo, de 640x480 para 1024x768), e pelo uso de anti-aliasing, ou ambos. Quando o AA está ativado, ele usa o hardware da sua placa gráfica para misturar as bordas das linhas irregulares e, portanto, produzir uma imagem mais suave.





Quanto maior o nível de suavização aplicada (normalmente em passos de 2x, 4x, 6x e 8x), progressivamente a imagem ficara mais suave, e mais pressão sobre a VGA.


Anisotropic Filtering: (AF) Este é um método que faz texturas (superfícies de todos os objetos 3D) parecem mais limpas e nítidas. Aumentar a resolução de um jogo é uma forma de melhorar a aparência, textura, no entanto texturas recuo na distância ainda pode tornar-se visivelmente borradas e suas características mais finas podem tornar-se indistinguíveis, mesmo em resoluções muito altas. Filtragem anisotrópica é usada para realçar os detalhes de texturas, e para reduzir o desfoque que ocorre com texturas que estão mais distantes.



PhysX: Tecnologia Nvidia ( GeForce) para aumentar a qualidade gráfica, melhorar ou adicionar efeitos, etc. O PhysX não é aplicável a qualquer jogo, é necessário verificar se tem suporte previamente, mas esteja ciente que este é um recurso pesado que afeta consideravelmente o desempenho da VGA. Caso sua placa já tenho dificuldade em manter 30 FPS em algum game, ativar o PhysX provavelmente o deixara em slow motion.

Formas de venda:



VGA refurbished
VGA que teve defeito de fabricação/produto de devolução/danificada, foi ‘consertada’ ou revendida. Essas placas são mais comuns de se encontrar em lugares como Mercado Livre e todo tipo de trambiqueiro. Em teoria ela deve funcionar (por quanto tempo não sabemos), mas eu não recomendo

VGA BOX
Uma placa de vídeo vendida em ‘caixa’, normalmente vem com toda parafernália que a ATI ou Nvidia disponibiliza: cabos para diferentes conexões, CD's de DEMO, Games de cortesia, utilitários, etc.

VGAs OEM
Placas feitas em largas escalas, não vem em BOX, normalmente vem só com saco anti-estático. São mais baratas que as VGA's BOX.


_________________________________________________________________

Créditos: VEHUIAH


© 1999-2024 Hardware.com.br. Todos os direitos reservados.
Imagem do Modal