A GPU Integrada

Todas as outras melhorias, incluindo o cache L3 operando na mesma frequência oferecem ganhos práticos modestos, representando ganhos de desempenho na casa dos 8 a 20% na maioria das aplicações em relação a um Core i7 baseado no Bloomfield do mesmo clock. Considerando que o Sandy Bridge também possui apenas 4 núcleos e que os processadores baseados nele não são capazes de operar a frequências muito mais altas que os Core i7 antigos, isso não parece tão animador assim, principalmente para quem é da época em que o desempenho dos processadores realmente dobrava a cada 18 meses. Para não perder o bonde, a Intel tratou de incluir um argumento adicional de venda: a GPU integrada (batizada de Sandy Bridge Graphics), que oferece um desempenho bem superior ao dos antigos chipsets integrados no chipset.

A GPU integrada não é um grande diferencial para quem está acostumado a uma GPU dedicada (já que mesmo com todas as melhorias, o desempenho continua sendo equivalente à de uma placa low-end) mas ela é uma grande novidade para os que usam o vídeo integrado, já que ela representa um grande salto de desempenho em relação às fracas GPUs Intel integradas das gerações anteriores, permitindo rodar a maioria dos títulos atuais a 1024×768 ou mesmo 1280×800 mantendo um FPS aceitável, desde que você use um nível baixo de detalhes. Você pode ver alguns números do desempenho gráfico no:

http://www.anandtech.com/show/4083/the-sandy-bridge-review-intel-core-i7-2600k-i5-2500k-core-i3-2100-tested/11 e:
http://www.tomshardware.com/reviews/sandy-bridge-core-i7-2600k-core-i5-2500k,2833-7.html

Mesmo o Core i3 2100 é capaz de rodar o CoD Modern Warfare a 1024×768 (baixo nível de detalhes) mantendo uma média de 28 FPS, o World of Warcraft a 39 FPS e o Starcraft II com de 24 a 96 FPS, oferecendo a possibilidade de rodar três dos títulos mais populares atualmente, embora com poucos detalhes gráficos.

Considerando que mais de 90% dos usuários usam vídeo integrado e a maior parte deles usam processadores Intel, fica fácil de perceber o quanto esta mudança é significativa, especialmente nos notebooks, onde a GPU raramente é um componente atualizável.

Em vez de ser uma cidadã de segunda classe como no Clarkdale, a GPU do Sandy Bridge compartilha dos mesmos transistores de 32 nm do restante do processador e tem igual acesso ao cache L3 compartilhado. Ela possui seu próprio sistema de gerenciamento de energia e opera a um clock independente do restante do processador, variando a frequência de operação dinamicamente de acordo com o uso. O Graphics Turbo, introduzido com Arrandale continua disponível, mas no Sandy Bridge estão disponíveis mais degraus de frequência.

O acesso ao cache L3 foi uma forma de amenizar o problema crônico dos chipsets de vídeo integrado, que é o acesso compartilhado à memória RAM. Embora a baixa latência do cache não faça tanta diferença para o chipset de vídeo quanto faz para o processador (a GPU trabalha tipicamente com um volume muito grande de dados), os 6 MB das versões iniciais do Sandy Bridge são suficientes para reduzir consideravelmente o número de requisições à memória RAM, amenizando o problema

Por padrão, o chipset de vídeo tem acesso irrestrito ao cache L3 e tende a ocupar a maior parte do cache em jogos e aplicativos 3D (que acabam sendo limitados pela GPU bem antes de pelo processador). Entretanto, é possível limitar o volume de cache usado pela GPU nas configurações do driver.

Internamente, o chipset de vídeo faz uso intensivo de unidades dedicadas de processamento (processamento de vértices, rasterização, texturas, etc.) em contraste com as GPUs programáveis oferecidas pela nVidia e AMD. Isso faz com que a GPU seja muito menos flexível (menos potente no processamento de shaders e de aplicativos OpenCL) mas faz sentido em relação ao consumo elétrico e número de transistores. Em resumo, a Intel optou por extrair o máximo de desempenho de uma GPU modesta, limitando a área no die do processador ocupada por ela, em vez de tentar incluir uma GPU mais poderosa, que consumisse muita energia. Em relação às APIs, à GPU inclui suporte ao DirectX 10.1, Shader Model 4.0 e OpenGL 2.0, deixando de lado o suporte ao DirectX 11, cujos efeitos exigem mais processamento e não fariam muito sentido em uma GPU integrada da safra atual.

Para a Intel, a GPU é apenas uma assistente, que complementa o trabalho do processador. Dentro dessa filosofia, o processador é a unidade programável, enquanto a GPU é apenas uma unidade de renderização 3D. Isso contrasta com a visão da nVidia, que vê a GPU como a unidade programável e o processador como um mero assistente. Como resultado, temos a nVidia tentando incentivar o uso do OpenCL, e a Intel preferindo não falar no assunto, vendo a GPU como um mero acelerador para gráficos 3D e decodificação de vídeo.

A GPU do Sandy Bridge possui 12 unidades de processamento, sendo que todas as 12 permanecem ativas nos processadores da série K e nos processadores móveis, e 6 delas são desativadas nos demais modelos de processadores desktop (do i3 2100 ao i7 2600), sacrificando parte do desempenho. A versão “completa”, com 12 EUs é chamada pela Intel de HD 3000, enquanto a versão castrada, com 6 EUs de HD 2000.

O reforço no desempenho 3D veio companhado por um reforço na Media Engine, responsável pela decodificação de vídeo. No Clarkdale parte da decodificação era executada pelas unidades programáveis, o que funcionava, mas era ineficiente energeticamente. No Sandy Bridge todas as etapas passaram a ser feitas via hardware, resultando em uma redução considerável no consumo ao decodificar vídeos HD. A Media Engine pode ser acessada também por aplicativos de conversão de vídeo, oferecendo uma grande redução no tempo de conversão para aplicativos otimizados. Dependendo do clock do processador, é possível atingir uma taxa de 400 FPS ao converter um vídeo 1080p para uma resolução mais baixa, gerando um vídeo para ser assistido em um smartphone, por exemplo.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X