Etiqueta

#inferencia eficiente

2 noticias relacionadas con esta etiqueta.

Inteligencia Artificial·27 jun 2026

DeepSeek lanza DSpark: framework que acelera generación de texto 60-85%

DeepSeek liberó DSpark, un framework de decodificación especulativa que optimiza el modelo DeepSeek-V4 mediante un módulo de borrador paralelo y verificación adaptativa. La solución logra acelerar la generación de tokens por usuario entre 57-85% sin pérdida de calidad.

Fuente: MarkTechPost

Inteligencia Artificial·17 may 2026

Compresión y evaluación de LLMs con cuantización FP8, GPTQ y SmoothQuant

Un tutorial práctico demuestra técnicas de cuantización post-entrenamiento para reducir el tamaño y latencia de modelos de lenguaje ajustados con instrucciones, comparando estrategias de compresión y su impacto en rendimiento.

Fuente: MarkTechPost