OpenAI新论文拆解语言模型内部机制:用「稀疏电路」解释模型行为
置顶