Inicio AMD CPUs para redes y servidores de alto rendimiento

CPUs para redes y servidores de alto rendimiento

4901
0

Compatibilidad integrada con CPUs para redes y servidores perimetrales

Una mayor expansión de tales infraestructuras perimetrales requiere procesadores de servidor con clases de rendimiento flexibles que mapean los casos de uso locales más diversos. Además de elevada conectividad, rendimiento de punto flotante (flops) y administración de memoria generosa para la virtualización, esto también requiere características de seguridad mejoradas y un amplio soporte integrado. Los OEM que proporcionan la tecnología vital de servidor perimetral necesitan una hoja de ruta fiable a largo plazo y un soporte estable y estándar de la industria para sus sistemas.

Los procesadores integrados AMD EPYC de las series 3000, 7001 y 7002 ya brindan a los OEM y desarrolladores una cartera de rendimiento amplia y matizada para cada escenario de aplicación. Así, las nuevas CPU EPYC 7003, conocidas con el nombre en clave «Milan«, significan el próximo salto de rendimiento de AMD, y el nuevo EPYC 7763 es actualmente el procesador para servidores más potente del mundo, como lo atestiguan numerosos puntos de referencia de CPU de servidor publicados por el prestigioso SPEC (www.spec.org).

Zen 3 ofrece más rendimiento por núcleo

Con la serie EPYC 7003, AMD ha presentado los nuevos núcleos Zen 3 en sus CPUs para redes y servidores. Al igual que los procesadores EPYC 7002, se fabrican con la tecnología de proceso de 7 nm de potencia ultrabaja y se conserva el principio de diseño SoC con troqueles complejos de ocho núcleos (CCD) en un módulo multichip.

Sin embargo, lo que ofrece el nuevo diseño del núcleo Zen 3 es un enorme aumento del 19 % en la tasa de IPC. Esto significa que una CPU EPYC 7003 no solo puede ejecutar más instrucciones por ciclo (IPC) que una CPU Zen 2 comparable de la serie EPYC 7002; también aumenta significativamente el rendimiento de la CPU disponible para aplicaciones de redes y cómputos exigentes en el servidor perimetral.

Al igual que los modelos Rome, los núcleos Zen 3 admiten subprocesos múltiples simultáneos (SMT) con hasta dos subprocesos por núcleo. Esto significa que un procesador con un máximo de 64 núcleos puede procesar hasta 128 subprocesos en paralelo. En los nuevos núcleos Zen 3, AMD ahora ha aumentado la cantidad de posibles predicciones de bifurcación por ciclo de reloj y también ha reducido las latencias resultantes de predicciones de bifurcación incorrectas. Y el mayor rendimiento de las operaciones aritméticas de enteros en Zen 3 significa que ahora se pueden procesar hasta diez operaciones por ciclo de reloj, en lugar de las siete anteriores.

Mejor gestión de caché para máquinas virtuales

AMD también ha mejorado significativamente la caché L3 en sus procesadores EPYC de tercera generación. Con hasta 256 MByte por CPU, los procesadores Zen 3 ofrecen el mismo caché L3 total que la generación anterior de Zen 2, pero este caché L3 ahora se puede compartir de manera mucho más flexible entre los núcleos. Al igual que con todos los procesadores AMD basados ​​en Zen, cada núcleo tiene acceso a su propio caché L3 dentro de un complejo de núcleo (CCX). Si es necesario, un núcleo puede usar todo el caché L3 del CCX.

Los ocho núcleos del núcleo complejo (CCD) de la serie EPYC 7003 pueden compartir libremente 32 MB de caché L3. En Zen 2, por otro lado, el CCD se divide en 2 CCX de 4 núcleos con 16 MB de caché L3 cada uno, lo que hace que la gestión del caché sea menos flexible.
Los ocho núcleos del núcleo complejo (CCD) de la serie EPYC 7003 pueden compartir libremente 32 MB de caché L3. En Zen 2, por otro lado, el CCD se divide en 2 CCX de 4 núcleos con 16 MB de caché L3 cada uno, lo que hace que la gestión del caché sea menos flexible.

En generaciones Zen anteriores, AMD combinaba 4 núcleos en un CCX. Pero los procesadores AMD Ryzen 7003, un CCX ahora contiene ocho núcleos. Esto también duplica el caché L3 por CCX de 16 a 32 MB, por lo que si un núcleo ahora necesita un alto rendimiento de un solo subproceso, tiene hasta 32 MB de caché a su disposición.

El intercambio de caché mejorado permite cargar bloques de datos más grandes directamente en el caché L3. Pero esto no es todo. Las reglas de extracción y vaciado de caché también se han optimizado, lo que reduce la latencia de almacenamiento, mejora el rendimiento del programa debido a conjuntos de datos más grandes y aumenta significativamente el rendimiento general, incluso cuando se utilizan máquinas virtuales (VM) que consumen mucha memoria. Esto abre oportunidades adicionales y casos de uso para que los OEM implementen sus sistemas de servidores perimetrales.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.