Nous Research presenta CNA: control de circuitos en LLMs sin modificar pesos
Nous Research desarrolló Contrastive Neuron Attribution (CNA), una técnica que identifica y desactiva circuitos neuronales específicos en modelos de lenguaje para dirigir su comportamiento sin reentrenamiento, modificación de pesos ni pérdida de capacidades generales.
Fuente: MarkTechPost