Nvidia atualiza roteiro de GPU: revela arquitetura de GPU Pascal |

A Nvidia Corp. atualizou publicamente na terça-feira seu roteiro de unidades de processamento gráfico para os próximos anos. A empresa removeu sua arquitetura Volta de codinome do plano e introduziu a arquitetura Pascal. Acredita-se que este último apresente inovações semelhantes ao Volta, mas ainda mais significativamente adaptado para baixo consumo de energia e ostentará certas tecnologias de interconexão não disponíveis hoje.

Nomeada em homenagem ao matemático francês do século XVII Blaise Pascal, a família de GPUs de próxima geração da Nvidia incluirá três novos recursos principais: DRAM empilhada, uma inovação importante que foi prometida para a família de GPUs Volta; tecnologia de memória unificada que atualmente está disponível apenas nas unidades de processamento acelerado (APUs) da AMD com recursos de arquitetura de sistema heterogêneo (HSA) (por exemplo, Kaveri) e NVLink, uma interconexão de alta velocidade para unidades de processamento gráfico e unidades de processamento central. Quando se trata de recursos de processamento gráfico, o Pascal oferecerá suporte aos recursos do DirectX 12.



Roteiro da Nvidia. Imagem por Avaliações Legítimas

A DRAM empilhada parece se tornar um recurso importante das GPUs de próxima geração com vencimento em 2016 e além da AMD e da Nvidia. A DRAM empilhada permite aumentar a largura de banda e a capacidade da memória sem estender a área ocupada ou as complexidades das placas gráficas. Atualmente, a Nvidia espera um aumento de duas a quatro vezes na largura de banda e tamanho da memória com Pascal, mas na realidade pode haver um aumento muito mais significativo. Os dispositivos HMC 2.0 anunciados recentemente (cubos de memória híbridos, dispositivos DRAM empilhados projetados pela Micron e aliados) têm largura de banda de 480 GB/s em links de 16 pistas. Quatro desses cubos podem fornecer um pouco mais de 2 TB/s de largura de banda.

A memória unificada permite que a CPU acesse a memória da GPU e a GPU acesse a memória da CPU, para que os desenvolvedores não precisem alocar recursos entre as duas. Originalmente, isso fazia parte da arquitetura Maxwell, mas parece que a Nvidia removeu o recurso da nova família de chips. Tendo em mente que a unificação de memória requer colaboração entre designers de GPU e CPU, a tecnologia da Nvidia é resultado do trabalho com Intel e AMD (ou apenas Intel), ou há um padrão para memória unificada CPU-GPU que está chegando.

Exemplos de implementação do NVLink

O NVLink é um pipe entre GPUs e CPU, que possui largura de banda total de 80 GB/s. Dada a largura de banda que os dispositivos de memória híbridos fornecem, há uma clara necessidade de tal interconexão daqui a alguns anos. O NVLink é considerado duas vezes mais eficiente em termos de energia do que o PCI Express 3.0 padrão. O desenvolvedor afirma que em um sistema habilitado para NVLink, transações iniciadas por CPU, como controle e configuração, ainda são direcionadas por uma conexão PCIe, enquanto quaisquer transações iniciadas por GPU usam NVLink. Isso nos permite preservar o modelo de programação PCIe enquanto apresenta uma enorme vantagem na largura de banda da conexão. Além disso, quando conectado a uma CPU que não suporta NVLink, a interconexão pode ser totalmente dedicada a conexões de GPU para GPU, permitindo oportunidades anteriormente indisponíveis para cluster de GPU.

Um exemplo de implementação do NVLink

O desenvolvedor de GPU com sede em Santa Clara, Califórnia, vem projetando sua interconexão de alta velocidade para GPUs e seus núcleos baseados em ARM de uso geral com supercomputadores em mente há vários anos. Talvez, o NVLink seja o primeiro fruto deste trabalho. No entanto, a Nvidia precisará garantir que seu NVLink seja compatível com Intel, AMD, IBM e outros microprocessadores para torná-lo uma solução industrial.

Para demonstrar do que a arquitetura Pascal é capaz, a Nvidia mostrou seu módulo Pascal, um dispositivo semelhante a um módulo MXM que contém uma GPU de alto desempenho com memória integrada.

Como todas as coisas que faltam dois anos, Pascal parece muito promissor e capaz. No entanto, está tão longe que não sabemos qual software ele executará e quais desafios enfrentará. Por exemplo, com uma enorme largura de banda de dispositivos de memória híbrida, deve ser uma solução incrível para jogos em 4K. Mas quando chegar ao mercado, o último se tornará quase mainstream.