NVIDIA presenta Gated DeltaNet-2: atención lineal con control desacoplado de memoria

Por Redacción Automatización LatAm · 24 de mayo de 2026 · Fuente original: MarkTechPost

NVIDIA lanzó Gated DeltaNet-2, una arquitectura de atención lineal que mejora la gestión de memoria en modelos de lenguaje al separar el control de borrado y escritura de datos. Con 1.3B parámetros, supera a Mamba-2 y Mamba-3 en tareas de razonamiento y recuperación de contexto extendido.

Problema de la atención lineal tradicional

Los modelos de lenguaje basados en transformadores enfrentan un cuello de botella fundamental: el cache de pares clave-valor (KV) crece sin límite con la longitud de la secuencia, consumiendo memoria exponencialmente. La atención lineal intenta resolver esto comprimiendo ese cache en un estado recurrente de tamaño fijo. Sin embargo, actualizar esta memoria sin destruir las asociaciones ya aprendidas ha sido históricamente difícil de lograr de forma efectiva.

La innovación de Gated DeltaNet-2

ENVIDIA presentó Gated DeltaNet-2, que introduce una mejora conceptual crucial sobre generaciones anteriores. Mientras que modelos previos como Gated DeltaNet y KDA utilizaban un único gate escalar para controlar tanto el borrado de contenido antiguo como la escritura de información nueva, la nueva arquitectura desacopla ambas operaciones: implementa una puerta de borrado sensible a canal (b_t) en el eje de las claves y una puerta de escritura sensible a canal (w_t) en el eje de los valores. Este cambio aparentemente sutil tiene implicaciones profundas para la calidad del modelo.

Resultados experimentales

En pruebas de validación, Gated DeltaNet-2 con 1.3 mil millones de parámetros entrenado en 100 mil millones de tokens de FineWeb-Edu demostró ventajas consistentes sobre competidores establecidos: superó a Mamba-2, Mamba-3 y modelos anteriores de la familia DeltaNet en tareas de modelado de lenguaje, razonamiento de sentido común y recuperación de contexto extendido. Las ganancias más notables aparecieron en pruebas especializadas como RULER S-NIAH (evaluación de aguja en pajar) y recuperación multi-clave de aguja en pajar, dominios donde la retención precisa de información contextual es crítica.

Implicaciones técnicas y prácticas

La arquitectura de atención lineal es particularmente valiosa para escenarios donde el contexto es muy extenso: procesamiento de documentos largos, análisis de conversaciones históricas complejas o inferencia en dispositivos con restricciones de memoria. El desacoplamiento de operaciones de memoria permite que cada eje se especialize: las claves manejan qué información se olvida, mientras que los valores controlan qué se retiene activamente. Esto refleja una comprensión más sofisticada de cómo los modelos deberían gestionar la información a lo largo del tiempo.

Relevancia para la región

En contextos de América Latina donde la infraestructura computacional es frecuentemente limitada, la eficiencia de memoria es un factor crítico de adopción. Modelos de atención lineal como DeltaNet-2 permiten ejecutar sistemas de IA avanzados en servidores menos poderosos o incluso en edge devices, reduciendo dependencia de llamadas a APIs en nube y mejorando latencia en aplicaciones críticas.

Este resumen es un análisis original. Para leer la noticia completa visita la fuente original: MarkTechPost →

#transformers #atencion-lineal #llm #nvidia #arquitectura-ia

LinkedIn X WhatsApp

Sigue leyendo

Inteligencia Artificial·23 may 2026

Nemotron-Labs: Generación de texto a velocidad de luz con modelos de difusión

NVIDIA presenta Nemotron-Labs Diffusion, una arquitectura innovadora que acelera significativamente la generación de texto mediante modelos de difusión. La tecnología promete reducir latencias en aplicaciones de IA generativa para infraestructuras industriales y empresariales.

Fuente: Hugging Face Blog

Inteligencia Artificial·10 jul 2026

Desvelan el funcionamiento interno de Claude y estrategia de OpenAI

Anthropic logró identificar estructuras ocultas dentro de Claude que revelan cómo el modelo procesa conceptos complejos. Simultáneamente, OpenAI avanza en su estrategia de plataforma integrada.

Fuente: MIT Technology Review

Inteligencia Artificial·10 jul 2026

Documentación de planta: la barrera silenciosa para agentes IA

Los sistemas de IA en manufactura enfrentan un obstáculo crítico: la información operativa está atrapada en formatos heredados no estructurados, diseñados para humanos, no para máquinas. Expertos exploran cómo superar esta brecha en AI Manufacturing Day 2026.

Fuente: IIoT World

Inteligencia Artificial·7 jul 2026

Cadetes sin experiencia crean apps IA para defensa con ChatGPT

Investigadores del MIT y la Fuerza Aérea estadounidense demostraron que chatbots de IA permiten a militares sin formación técnica desarrollar aplicaciones de software viables adaptadas a sus necesidades operacionales específicas.

Fuente: MIT News — AI

Inteligencia Artificial·4 jul 2026

NVIDIA Horizon: Agente IA autonomo para diseño RTL

NVIDIA presenta Horizon, un agente de IA que automatiza el diseño de circuitos RTL mediante repositorios versionados, alcanzando 100% de finalización en benchmarks estándar del sector.

Fuente: MarkTechPost

Inteligencia Artificial·2 jul 2026

Microsoft crea división de despliegue de IA con inversión de $2.5B

Microsoft establece una unidad dedicada para implementar soluciones de IA en empresas, siguiendo la estrategia de rivales como Amazon, OpenAI y Anthropic. La inversión busca acelerar la adopción de modelos generativos en la industria.

Fuente: TechCrunch AI