Etiqueta

#interpretabilidad

3 noticias relacionadas con esta etiqueta.

Inteligencia Artificial·14 jul 2026

Desvelando el razonamiento interno de los modelos IA

Anthropic descubre nuevas formas de acceder a los procesos de razonamiento interno de Claude, abriendo perspectivas sobre cómo estos modelos generativos construyen respuestas. El hallazgo tiene implicaciones para la transparencia y confiabilidad de sistemas IA en aplicaciones críticas.

Fuente: MIT Technology Review

Inteligencia Artificial·23 may 2026

Nous Research presenta CNA: control de circuitos en LLMs sin modificar pesos

Nous Research desarrolló Contrastive Neuron Attribution (CNA), una técnica que identifica y desactiva circuitos neuronales específicos en modelos de lenguaje para dirigir su comportamiento sin reentrenamiento, modificación de pesos ni pérdida de capacidades generales.

Fuente: MarkTechPost

Inteligencia Artificial·17 may 2026

Guía práctica: implementar flujos de explicabilidad SHAP en modelos de ML

Tutorial completo sobre cómo aplicar SHAP para interpretar modelos de aprendizaje automático más allá de gráficos básicos de importancia. Compara diferentes métodos de explicación (Tree, Exact, Permutation, Kernel) y aborda detectores de desviación y modelos de caja negra.

Fuente: MarkTechPost