0%

2025-03-13-insights

Discovering Influential Neuron Path in Vision Transformers

一篇model circuit的文章,现在挺少见这个领域的工作了。作者定义了一个叫Influential Neuron Path的概念,就是说从一次前向里,每一层走的最大attention/FFN路径,作者认为这个路径定义了模型的思考方法,同时提供了一些可解释性分析的信号。

这个方案和openai前几天的那个monitoring reasoning model,可以说是两套相反的方案。不知道大家认为,AI safety走哪种方案更好呢