arzh-CNenfrdejakoplptesuk
Buscar encontrar 4120  disqus social  tg2 f2 lin2 in2 Icono X 3 y2  p2 tik steam2

Características de la arquitectura GeForce 4 Ti 4200

GeForce 4 Ti - evolución de GeForce 3 Ti

Innovaciones arquitectónicas clave del NV25 (en comparación con NV20)

Dos controladores de pantalla independientes (CRTC). Soporte flexible para varios modos con la salida de dos buffers de cuadros independientes en términos de resolución y contenido a cualquier receptor de señal disponible.
Dos RAMDAC completos de 350 MHz integrados en el chip (con una paleta de 10 bits).
Interfaz TV-Out integrada en el chip.
Transmisor TDMS integrado en el chip (para interfaz DVI).
Dos bloques de interpretación y ejecución de vertex shaders. Prometen un aumento significativo en la velocidad de procesamiento de escenas con geometría compleja. Los bloques no pueden utilizar microcódigos de sombreado diferentes; el único propósito de dicha duplicación es procesar dos vértices al mismo tiempo, para aumentar el rendimiento.
Los canales de sombreado mejorados brindan soporte de hardware para sombreadores de píxeles hasta la versión 1.3 inclusive.
Según NVIDIA, se ha aumentado la tasa de llenado efectiva en los modos MSAA, ahora los modos 2x AA y Quincunx AA causarán un impacto en el rendimiento significativamente menor. Quincunx AA se ha mejorado ligeramente (se han cambiado las posiciones de las muestras). Ha aparecido un nuevo método AA: 4xS.
Sistema de almacenamiento en caché dividido mejorado (4 cachés separados para geometría, texturas, búfer de cuadros y búfer Z).
Compresión avanzada sin pérdidas (1:4) y rápido vaciado del búfer Z.
Algoritmo mejorado para rechazar superficies invisibles (Z Cull HSR).

Para resumir esta lista, me gustaría señalar el carácter evolutivo más que revolucionario de los cambios en comparación con la creación anterior de NVIDIA (NV20). Sin embargo, esto no es sorprendente: históricamente, NVIDIA primero ofreció un producto que contenía muchas tecnologías nuevas y luego lanzó una versión más avanzada (optimizada) basada en él, eliminando las deficiencias que atrajeron la atención principal (durante la presencia del producto en el mercado). ).

Diagrama de bloques de N25

nv251

Según las pruebas realizadas después del lanzamiento de las tarjetas de video, la GeForce4 Ti resultó ser notablemente más rápida que la GeForce3 Ti. Una diferencia de rendimiento tan impresionante para la NV25 no se logró gracias a alguna tecnología fundamentalmente nueva, sino gracias a una mayor depuración y ajuste de las tecnologías existentes en la GeForce3 (NV20). Esto significa que el núcleo GeForce4 era sólo un 5% más grande que el núcleo NV20 con la misma tecnología de proceso (0,15 micrones).

bloque_chip1

Sombreadores de vértices nfiniteFX II

Si GeForce3 tenía solo un módulo de sombreado de vértices, entonces GeForce4 Ti ya tiene dos. Sin embargo, es poco probable que esto le sorprenda, ya que el chip nVidia para Microsoft Xbox también contiene dos módulos de sombreado de vértices. Excepto que en NV25 se mejoraron los módulos.

Obviamente, dos módulos de sombreado de vértices paralelos podrían procesar más vértices por unidad de tiempo. Para ello, el propio chip descompuso los vértices en dos subprocesos, por lo que el nuevo mecanismo es transparente para las aplicaciones y API. El NV25 maneja el envío de instrucciones y el chip debe garantizar que cada módulo de sombreado de vértices esté funcionando en su propio vértice. Las mejoras en los módulos de sombreado de vértices desde la GeForce3 han llevado a una latencia reducida al procesar instrucciones.

Como resultado, la GeForce4 Ti4600 podría procesar aproximadamente 3 veces más vértices que la GeForce3 Ti500 debido a la presencia de dos módulos de sombreado de vértices, su mejora y su funcionamiento a una frecuencia de reloj más alta.

Sombreadores de píxeles nfiniteFX II

nVidia pudo mejorar la funcionalidad de los sombreadores de píxeles en GeForce4 Ti.
El nuevo chip admite sombreadores de píxeles 1.2 y 1.3, pero no la extensión ATi 1.4.

A continuación se muestran los nuevos modos de sombreado de píxeles.
OFFSET_PROJECTIVE_TEXTURE_2D_NV
OFFSET_PROJECTIVE_TEXTURE_2D_SCALE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_NV
OFFSET_PROJECTIVE_TEXTURE_RECTANGLE_SCALE_NV
OFFSET_HILO_TEXTURE_2D_NV
OFFSET_HILO_TEXTURE_RECTANGLE_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_2D_NV
OFFSET_HILO_PROJECTIVE_TEXTURE_RECTANGLE_NV
DEPENDENT_HILO_TEXTURE_2D_NV
DEPENDENT_RGB_TEXTURE_3D_NV
DEPENDENT_RGB_TEXTURE_CUBE_MAP_NV
DOT_PRODUCT_TEXTURE_1D_NV
DOT_PRODUCT_PASS_THROUGH_NV
DOT_PRODUCT_AFFINE_DEPTH_REPLACE_NV

No describiremos cada modo nuevo, pero cabe señalar que la GeForce4 Ti introdujo soporte para el mapeo de relieve correcto en z, lo que hizo posible eliminar los artefactos que aparecen cuando una textura de relieve entra en contacto con otra geometría (por ejemplo, cuando el agua de un lago o del río entra en contacto con el suelo).

nVidia finalmente pudo mejorar el proceso de sombreado de píxeles, lo que tuvo un efecto notable en la velocidad de renderizado de escenas con 3-4 texturas por píxel.

29_s1

Accuview: suavizado mejorado En el momento del lanzamiento de GeForce3, nVidia anunció HRAA: anti-aliasing de alta resolución basado en anti-aliasing de pantalla completa de múltiples muestras. GeForce4 introdujo el anti-aliasing Accuview, que es esencialmente un anti-aliasing multimuestra mejorado, tanto en términos de calidad como de rendimiento.
 Nvidia ha cambiado las posiciones de las muestras, lo que debería mejorar la calidad del suavizado debido a la acumulación de menos errores, especialmente cuando se utiliza el suavizado Quincunx. Nvidia publicó documentación sobre este procedimiento, pero no valía la pena leerla ya que no explicaba mucho. Se habilitó una nueva tecnología de filtrado cada vez que se combinaban muestras en el fotograma antialiasing final, y la tecnología permitió guardar una escritura completa en el búfer de fotogramas, lo que a su vez afectó significativamente el rendimiento del antialiasing.

nv25lma21

LMA II: nueva arquitectura de memoriaFue gracias a las mejoras en la arquitectura de la memoria que la GeForce4 Ti mostró una ventaja tan fuerte sobre la GeForce3.

En GeForce3/GeForce4 el controlador de memoria se dividió en cuatro controladores independientes, cada uno de los cuales utiliza un bus DDR dedicado de 32 bits. Todas las solicitudes de memoria se dividieron entre estos controladores.

En LMA II, se han mejorado casi todos los componentes. Puedes prestar atención a cuatro cachés. Pero el almacenamiento en caché es una característica exclusiva de GeForce, ya que la Radeon 8500 también tenía cachés similares. En general, se prestó mucha menos atención al almacenamiento en caché en los chips gráficos que a los cachés en los procesadores, ya que su tamaño no era tan grande. La razón es clara: los chips gráficos trabajaban más lento que los buses de memoria, mientras que los procesadores centrales trabajaban entre 2 y 16 veces más rápido, por lo que la memoria caché desempeñaba allí un papel mucho más importante.

Controlador de memoria cruzada (controlador de memoria de barra transversal)
La GeForce3 ya tenía este controlador, lo que permitía transferencias de 64 bits, 128 bits y 256 bits normales, lo que mejoraba enormemente el rendimiento. En LMA II, nVidia mejoró los algoritmos de equilibrio de carga para diferentes secciones de memoria y modernizó el esquema de prioridades.

Subsistema visual (subsistema de visibilidad): descartando píxeles ocluidos
Esta tecnología ya existía en la GeForce3, pero en la NV25 se mejoró para seleccionar píxeles con mayor precisión utilizando menos ancho de banda de memoria. Luego, el rechazo se llevó a cabo utilizando un caché especial en el chip, lo que permitió reducir el acceso a la memoria externa de la tarjeta de video. Un estudio de Anandtech demostró que la GeForce4 era un 25% mejor rechazando píxeles que la GeForce3 a la misma velocidad de reloj.

Compresión del búfer Z sin pérdidas
Nuevamente, esta característica existía en GeForce3, pero gracias al nuevo algoritmo de compresión en LMA II, se logró con mayor frecuencia una compresión 4:1 exitosa.

caché de vértice
Almacena los vértices después de haber sido enviados vía AGP. El caché mejoró el uso de AGP porque evitaba pasar vértices duplicados (por ejemplo, si las primitivas tenían límites comunes).

Caché primitivo
Primitivas acumuladas después de su procesamiento (después del sombreador de vértices) en primitivas fundamentales para transferirlas al módulo de instalación de triángulos.

Caché de textura dual
Ya existía en GeForce3. Los nuevos algoritmos funcionaron mejor cuando se utilizaban texturas múltiples o filtrado de alta calidad. Gracias a esto, GeForce4 Ti ha mejorado significativamente el rendimiento al aplicar 3-4 texturas.

Caché de píxeles
El caché se usó al final del proceso de renderizado para la acumulación, muy similar a la función en los procesadores Intel/AMD. El caché acumuló una cierta cantidad de píxeles y luego los escribió en la memoria en modo por lotes.

Precarga automática
Antes de leer del banco de memoria, es necesario precargarlo, lo que provoca retrasos. GeForce4 Ti podría cargar de forma proactiva utilizando un algoritmo de predicción especial.

Borrado Z rápido (borrado Z)
Esta característica se conoce desde hace algún tiempo y se ha utilizado en otros chips. La primera vez que se utilizó el borrado Z rápido fue en un chip ATi Radeon. Simplemente establecía una bandera para una sección específica del búfer de fotogramas, de modo que en lugar de llenar esa sección con ceros, podía simplemente establecer la bandera, lo que ahorraba ancho de banda de memoria.

nfxii8_small1

Características de NVIDIA GeForce 4 Ti 4200

Nombre GeForce 4 Ti 4200
núcleo NV25
Tecnología de proceso (µm) 0,15
Transistores (millones) 63
Frecuencia central 250
Frecuencia de funcionamiento de la memoria (DDR) 222 (444)
Bus y tipo de memoria DDR-128 bits
Ancho de banda (Gb/s) 7,1
Tuberías de píxeles 4
TMU en transportador 2
Texturas por tiempo 8
Texturas por pasada 4
Transportadores de vértice 2
Sombreadores de píxeles 1,3
Sombreadores de vértices 1,1
Velocidad de llenado (Mpix/s) 1000
Tasa de llenado (Mtex/s) 2000
DirectX 8.0
Antialiasing (Máx.) EM - 4x
Filtrado anisotrópico (máx.) 8x
Capacidad de memoria 64 / 128 MB
Interfaz AGP 4x
RAMDAC 2x350MHz

GeForce4 Ti 4200 es una versión liviana de las tarjetas GeForce4 Ti 4600 o 4400. Tenía una frecuencia de reloj más baja, pero también era mucho más barata. 
En muchos sentidos, la tarjeta GeForce4 Ti 4200 puede considerarse un potencial "sepulturero" de la línea GeForce3 Ti 500 si la tarjeta de video Ti 4200, que combina un alto rendimiento con un precio bajo, se lanzara simultáneamente con las más caras GeForce4 Ti 4600 y. 4400, la situación claramente no favorecería a estos últimos. Por lo tanto, NVIDIA retrasó el lanzamiento de la Ti 4200 hasta una fecha posterior, hasta que hubo una caída significativa en las ventas de la línea GeForce3.

Mafia

mafia_colh_car_pursuit1