Nvidia detalha Tegra X1: 8 núcleos, 256 processadores stream, vídeo 4K e 20nm |

A Nvidia Corp. apresentou na segunda-feira sua mais recente adição à família Tegra de system-on-chips para dispositivos móveis, o Tegra X1. O novo processador de aplicativos apresenta os mais recentes núcleos ARMv8 de 64 bits, gráficos de arquitetura Maxwell, suporte a vídeo de ultra-alta definição, bem como uma enorme quantidade de taxa de transferência da câmera.

O novo Nvidia Tegra X1 integra quatro núcleos ARM Cortex-A57 de alto desempenho com cache L2 de 512 KB, cache de instruções L1 de 48 KB e cache de dados L1 de 32 KB por núcleo, bem como quatro núcleos ARM Cortex-A53 de baixo consumo com cache L2 de 128 KB, Cache de instruções L1 de 32 KB e cache de dados L1 de 32 KB por núcleo. O mais recente system-on-chip da Nvidia também possui um subsistema gráfico avançado baseado na arquitetura Maxwell que possui 256 processadores de fluxo (dois multiprocessadores de fluxo Maxwell), 16 unidades de textura e 16 pipelines de saída raster que suportam OpenGL ES 3.1, OpenGL4.5 , DirectX 12.0 (nível de recurso 11_3) e interfaces de programação de aplicativos AEP. O controlador de memória do novo SoC suporta até 4 GB de memória LPDDR3 ou LPDDR4, enquanto o controlador de armazenamento do AP suporta a interface eMMC 5.1 com enfileiramento CMD. Todas as outras interfaces de E/S também estão presentes (veja o diagrama abaixo).



A Nvidia melhorou bastante os recursos multimídia do Tegra X1. O AP mais recente suporta decodificação de vídeo por hardware em todos os formatos de alta definição e ultra-alta definição (4K) a 60Hz, incluindo VP9, ​​H.265 (HEVC), H.264 e outros. Ele também pode codificar vídeo H.264, H.265 4K a 30fps e vídeo VP8 1080p a 60fps. O chip também suporta até seis entradas de câmera com sensores de até 100MP, o que é um dos motivos pelos quais tem muitas chances de vencer no mercado de automóveis. Por fim, o Tegra X1 possui dois controladores de tela que suportam saídas 4K UHD via interface HDMI 2.0 (com tecnologia HDCP 2.2), algo que pode tornar o chip adequado para uma ampla gama de players de mídia.

O Tegra K1 estabeleceu um novo padrão para o desempenho de computação da GPU e, agora, apenas um ano depois, o Tegra X1 oferece o dobro disso, disse Linley Gwennap, fundador e analista principal do Linley Group. Essa impressionante conquista técnica beneficia tanto os gráficos 3D, principalmente em dispositivos com telas de alta resolução, quanto o software GPGPU que está se tornando mais predominante, principalmente em aplicativos automotivos.

Infelizmente, o chip premium Tegra X1 para eletrônicos de consumo ainda não suporta nenhum tipo de tecnologia de banda larga. Como resultado, poucos smartphones e tablets provavelmente irão integrá-lo, apesar do vasto desempenho e rica funcionalidade.

O sistema em chip Nvidia Tegra X1 é fabricado usando a tecnologia de processo de sistema em chip de 20 nm na Taiwan Semiconductor Manufacturing Co.

A Nvidia não disse nenhuma palavra quando espera que o novo chip surja no mercado dentro de produtos acabados, mas é lógico esperar que isso aconteça este ano. A empresa também não revelou o consumo exato de energia do SoC, mas disse que está abaixo de 10W.

Sem dúvidas, o novo Tegra X1 é uma potência de desempenho móvel. Possui oito grandes núcleos ARMv8 de 64 bits de uso geral, possui um ótimo subsistema gráfico, possui uma tecnologia de processamento de imagem séria e suporta todas as principais interfaces de entrada/saída que todos precisarão no futuro próximo. Por alguma razão, a Nvidia decidiu não tocar em seu consumo de energia, que não deve ser muito alto devido à tecnologia de fabricação 20SoC, mas também não muito baixo devido à alta complexidade. No entanto, os tecnólogos de relações públicas da empresa decidiram comparar o desempenho do FP16 do Tegra X1 com o desempenho do FP64 do supercomputador ASCI Red, o primeiro supercomputador 1TFLOPS do mundo. O problema é que, embora o FP16 seja suficiente para certos aplicativos gráficos hoje (ainda assim, muitos aplicativos usam a precisão total do FP32), definitivamente não é suficiente para nenhum tipo de aplicativo de computação de alto desempenho. Portanto, comparar o desempenho do FP16 com o desempenho do FP64 é claramente um tipo de comparação de maçãs com laranjas. Mas uma coisa importante é que a arquitetura Maxwell não foi projetada para supercomputadores, sua taxa de FP64 é cerca de 1/32 de sua taxa de FP32. Então, se 256 SPs dentro do Tegra X1 podem oferecer 512GFLOPS em FP32, então sua taxa de FP64 é 16GFLOPS. Não é bem um teraflop, hein?