arzh-CNenfrdejakoplptesuk
Buscar encontrar 4120  disqus social  tg2 f2 lin2 in2 Icono X 3 y2  p2 tik steam2

NVIDIA TITAN X

NVIDIA GeForce GTX TITAN X 2

El nuevo TITAN X, que se convirtió en el primer dispositivo basado en el procesador GP102, se posicionó principalmente como un acelerador de clase profesional, destinado a aplicaciones comerciales y de investigación relacionadas con el aprendizaje profundo.

la GPU Concebido como una alternativa a la supercomputadora GP100, no inferior a esta última en cuanto a funciones de renderizado de gráficos 3D y cálculos FP32. Al mismo tiempo, los creadores de la GP102 redujeron todos los componentes que no se ajustaban a la finalidad del producto.

pequeño GP102.750

Por ejemplo, un único SM (Multiprocesador de Streaming, un bloque que combina núcleos CUDA con unidades de mapeo de texturas, programadores, despachadores y segmentos de memoria local) en GP100 contiene 64 núcleos CUDA para operaciones FP32, mientras que el SM en GP102 tiene una configuración heredada de Maxwell en este sentido: 128 núcleos CUDA. Una distribución más precisa de los núcleos CUDA en GP100 permite al procesador ejecutar simultáneamente más flujos de instrucciones (y también grupos de hilos (warps) y bloques warp), y el volumen total de dichos tipos de almacenamiento dentro del SM, como la memoria compartida y el archivo de registros, al calcularse para todo el... GPU aumentado en comparación con la arquitectura Maxwell.

Además, en el GP100, por cada 64 núcleos CUDA para funcionamiento del FP32, hay 32 núcleos para el FP64, mientras que el SM del GP102 tiene una configuración heredada de Maxwell en este sentido: 128 núcleos CUDA para el FP32 y 4 para el FP64. De ahí el reducido rendimiento del GP102 cuando se trabaja con operaciones de doble precisión.
Finalmente, el GP100 lleva un caché L4096 más grande: 3072 KB versus 102 KB en el GP102. Y, por supuesto, el GP2 no tiene controlador de bus NVLINK, y el lugar de los controladores de memoria HBM4096 (con un ancho de bus total de 5 bits) lo ocupan controladores SDRAM GDDR12X. 32 de estos controladores de 384 bits proporcionan un bus de acceso a memoria común de XNUMX bits.


El chip GP102, producido mediante el proceso FinFET de 16 nm en las instalaciones de TSMC, contiene 12 mil millones de transistores en un área de 471 mm2. A modo de comparación: las características del GP100 son 15,3 mil millones de transistores y 610 mm2. Esta es una diferencia muy significativa. Además, si bien TSMC no ha aumentado el tamaño de la fotomáscara para el proceso de 16 nm en comparación con el de 28 nm, el GP100 está casi agotado, mientras que la arquitectura liviana GP102 permitirá a NVIDIA crear un núcleo más grande para el mercado de consumo más amplio en el futuro utilizando la misma producción. línea (lo cual, sin embargo, es poco probable que suceda a menos que los desarrolladores revisen sus estándares con respecto al TDP de los modelos superiores).

Especificaciones de NVIDIA TITAN X

 Fecha de lanzamiento  2 2016 años agosto
 precio inicial, $  1200

Chip

 modelo GPU GP16-102 de 400 nm
 Núcleos: TMU: ROP 3584: 224: 96

Frecuencias

 frecuencia GPU(impulso), MHz 1431 (1531)
 Frecuencia de memoria (efectiva), MHz 1251 (10008)
 Rendimiento FP32, GFLOPS 10,257

Память

 Tamaño de la memoria de vídeo, MB  12288
 bus de memoria, bits  384
 Ancho de banda de la memoria, GB/s  480

Interfaz y TDP

 Interfaz PCI-Express  3.0 x16
 TDP. Mar 250

El nuevo procesador gráfico funciona a frecuencias más altas (1417/1531 MHz) que en el Tesla P100 (hasta 1328/1480 MHz en la versión de supercomputadora y hasta 1300 MHz en el factor de forma de placa PCI-Express). Y, sin embargo, las frecuencias de la Titan son bastante conservadoras en comparación con las características de la GeForce GTX 1080 (1607/1733 MHz). Como veremos en los experimentos de overclocking, el factor limitante fue el consumo de energía del dispositivo, que NVIDIA fijó en el nivel habitual de 250 W. NVIDIA Titan X tiene 3.584 procesadores de flujo a su disposición.

La TITAN X está equipada con 12 GB de SDRAM GDDR5X con un ancho de banda de 10 Gbps por pin. El bus de 384 bits proporciona velocidades de transferencia de datos de 480 GB/s: en este indicador, la TITAN X se sitúa ligeramente por detrás de la actual poseedora del récord, la Radeon R9 Fury X, así como de otros productos AMD basados ​​en... GPU Fiyi (512 GB/s).