2025-03-13-insights

发表于 2025-03-15 更新于 2025-03-18 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 264 阅读时长 ≈ 1 分钟

Discovering Influential Neuron Path in Vision Transformers

一篇model circuit的文章，现在挺少见这个领域的工作了。作者定义了一个叫Influential Neuron Path的概念，就是说从一次前向里，每一层走的最大attention/FFN路径，作者认为这个路径定义了模型的思考方法，同时提供了一些可解释性分析的信号。

这个方案和openai前几天的那个monitoring reasoning model，可以说是两套相反的方案。不知道大家认为，AI safety走哪种方案更好呢