|
Microprocesadores
K7 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
AMD K7 AthlonEl Athlon es el primer microprocesador de séptima generación de AMD. Inluye 19 nuevas instrucciones compatibles con las 3DNow!, ya habituales en estos micros, para competir con las SSE de Intel. El encapsulado del Athlon, denominado Card Module, luce muy parecido al SECC2 de Intel, según podemos apreciar aquí abajo. Inicialmente se presentará con 512 kb de caché L2, pero podría haber modelos con hasta 8 Mb. Dicho caché se ha movido a la misma PCB que el microprocesador (como hiciera Intel con su Pentium II) y se comunica con éste por un backside bus de 64 bits que corre a 1/2, 2/5 o 1/3 de la frecuencia interna. La caché L1 (128 kb), se halla ubicada en el mismo núcleo (y por ende corriendo a la misma frecuencia que éste) se divide en 64 kb de instrucciones y 64 kb de datos Conexión: bus EV-6El Athlon utiliza el denominado slot A (también llamado SC242) de 242 contactos. Esta arquitectura es físicamente compatible con el Slot 1 de intel, pero electrónicamente compatible con el bus DEC Alpha EV6 (este bus es el que utiliza el procesador Alpha 21264). En efecto, el Slot 1 utiliza el protocolo GTL+, mientras el Slot A emplea el protocolo EV6 con una topología "punto a punto". Es decir que aunque exteriormente los conectores son idénticos, no podemos instalar un Athlon en un motherboard Slot 1. El bus EV6 soporta velocidades de entre 40 y 400 mhz; en ésta implementación de AMD corre a 200 mhz. A diferencia de los sistemas anteriores, en esta nueva arquitectura el bus del Athlon no forma parte del tradicional "bus de sistema" y por ello no tiene que soportar la actividad de los buses periféricos (PCI y AGP). El bus EV6 conecta al Athlon con el North Bridge del chipset en forma directa y exclusiva, con lo cual ningún otro dispositivo puede mermar el ancho de banda de dicha conexión. En arquitecturas P6 el CPU, la RAM, el bus PCI, el bus AGP, el caché L2 (si es que no se conecta a través de un backside bus) y el chipset están todos unidos al bus del sistema. Puesto que RAM y CPU no comparten el bus, entonces la memoria no necesariamente debe correr a la misma velocidad del bus (200 mhz), y pueden utilizarse DIMM's de 100 mhz o de 133 mhz sin problemas. La RAM que podremos utilizar entonces dependerá de la que soporte el chipset. Para alcanzar los 200 mhz de frecuencia en el bus se utiliza la tecnología DDR (Double Data Rate) que consiste en transferir datos en ambos sentidos del bus por cada ciclo, duplicando así el rendimiento. Esta tecnología es similar a la utilizada en DDR-SDRAM y en la interface Ultra ATA 66. De esta forma el Athlon tiene un FSB de 100 mhz pero una velocidad equivalente a (100*2 mhz) 200 mhz. Téngase en cuenta que el ratio de la frecuencia interna del microprocesador se sigue multiplicando contra el FSB de 100 mhz. MultiprocesamientoEl K7 será acompañado por la aparición de chipsets que soporten SMP (Symmetric Multi-Processing), pero recién a mediados del 2001. De esta forma será el primer micro x86 no intel que sea usado en sistemas con más de un procesador; esto será significativo en el mercado de los servidores de altas prestaciones. La arquitectura K6 también es capaz de multiproceso pero jamás llegó al mercado (ni llegará) un chipset SMP disponible para dichos micros.
. El Athlon se fabricó inicialmente en un proceso de 0.25 micrones (Athlones C), pero luego fueron realizados en 0.18 micrones (Athlones A). Ambos tipos pueden diferenciarse mirando por la A o C a la derecha del número de parte listado en el encapsulado. Los de 0.25 son los que se denominan "core K7", los originales; y los de 0.18 se conocen como "core K75". Todos los Athlones de 750 mhz y superiores son fabricados con procesos de 0.18 micrones. Hubo algunos Athlones de 750 mhz con proceso de 0.25 micras pero no llegaron a la etapa de comercialización. Caché L2Cuando se ubica el caché L2 fuera del die del microprocesador, el fabricante debe recurrir a terceros para fabricar chips L2 a un precio razonable para incluir en sus CPU's. Los chips L2 de 350 mhz tienen un tiempo de acceso de 3ns; este es el techo de velocidad de los chips SRAM de caché aprobados por la industria, más allá de este límite dicho chip deja de operar en forma confiable, además de hacerse muy costosa su fabricación. Por ello AMD optó por cambiar el divisor de la velocidad del caché para sus micros a partir de 750 mhz de ½ a 2/5 y luego a 1/3. Así, como se ve en el cuadro de abajo, los cachés L2 de los Athlones no superan 350 mhz.
Note que el modelo a 700 tiene un caché más rápido que el de 800, e incluso que el de 1000!...Esto no afectaba a los micros de Intel, puesto que el caché L2 ya se había movido al die en los nuevos core Coppermine. Un Pentium III 900 ya tiene su caché L2 a 900 mhz (compárese con los meros 300 mhz del Athlon). En este caso el core debe esperar hasta dos ciclos de reloj para recibir un dato del caché L2. Asimismo cuando el caché se halla situado en chips externos al core el bus que comunica ambos se ve restringido a, como máximo, 64 bits porque entre mayor el ancho mayor es la cantidad de pines requeridos para dicha conexión y en los diseños actuales lo que no sobran son pines. Cuando el caché está incluído en el core el ancho de este bus no está restringido por cuestiones de pines. El core Coppermine de Intel, por ejemplo, incluye un bus de 256 bits a su caché L2 (parte de la arquiterctura de Intel llamada " Advance Transfer Cache"). Los micros de AMD, incluídos los Thunderbird, usan un bus de 64 bits. Otra ventaja es que una vez integrado el L2 en la misma pieza de silicio (die) que el núcleo del procesador ya no hay necesidad del formato "cartucho" implantado por Intel con su Slot 1 y seguido por AMD con su Slot A. Esta solución fue necesaria en su época para albergar en un mismo PCB al núcleo del procesador y a su caché L2. Esto buscaba liberar a último del obstáculo de la velocidad fija del FSB (que entonces era de sólo 66 mhz); además en aquella época era muy caro el integrar el L2 en el core y solo se justificaba en micros de gama alta como el Pentium Pro destinado al mercado de los servidores. Ahora, con la tecnología permitiendo procesos 0.18 micrones y menores , integrar el caché es viable y por ello tanto Intel como AMD han vuelto al formato socket que es más barato de fabricar. Con la aparición de los Pentium III coppermine con 256 kb de L2 corriendo a full speed, Intel derribó a AMD del trono de los benchmarks. La velocidad de caché tiene un efecto muy profundo en cierto tipo de aplicaciones (típicamente de productividad y negocios) y los benchmarks han probado que 256 kb de caché a core speed ofrecen superior rendimiento que 512 kb de caché a ½ core speed. Es obvio que si AMD continuaba en este camino la diferencia de performance entre el Athlon, con su caché incrementándose en tasas menores de ½, y el Pentium III, con su caché incrementándose directamente con la velocidad del núcleo, haría crecer la brecha dejando al Athlon muy por debajo. En efecto, AMD corrigió este percance pasando a los nuevos cores Thunderbird y Spitfire. Asimismo la ganancia en performance de pasar, por ejemplo de un Athlon 700 a uno 800 es enmascarada parcialemente gracias al caché ralentizado. Obviamente todos estos datos jamás fueron provistos por AMD quien oficialmente nunca estableció las velocidades del caché de sus micros; después de todo para el típico consumidor solo importa la frecuencia del micro. La FPU, el talón de aquiles de todos los anteriores micros de AMD (que siempre tuvo inferiores prestaciones frente a la de los micros intel), fue mejorada de tal forma que no sólo alcanzó la performance de dichos micros sino que la superó (buen trabajo por parte del equipo de AMD). Toda aplicación que se base en cálculos matemáticos (CAD, ingeniería, ciencia, etc.) que aprovechen la superior FPU de los Athlones seguirán ejecutándose mejor en estos micros que en los equivalentes de Intel (salvo que la aplicación en particular haga mucho uso de las instrucciones SSE y ninguno de 3Dnow! ). Así, por ej., en benchmarks de 3D Studio Max (render 3D), tareas típicas donde influye casi por completo el poder bruto de la FPU -y en menor medida el caché-, el Athlon es superior a cualquier PIII de la misma velocidad. Lo mismo cabe para situaciones de complejos cálculos de escenas 3D, como Quake 3 y otros juegos de tiempo real, donde un Athlon nos da mayores frames por segundo. En donde más se nota la lentitud del caché L2 es en las aplicaciones de negocios, las de productividad y en algunos juegos que no utilizan 3D. La siguiente tabla recoge todas las versiones del Athlon K7 para slot A.
Notas de la tabla: Fuentes: Chip Geek (Part of UGeek Network) - Tom's Hardware - The New Athlon Processor - AMD Is Finally Overtaking Intel
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Ultima actualización:
16-Mar-2008
|