Form as Endpoint Not Starting Point: An Interpretive Reversal of the Platonic Representation Hypothesis
柏拉图表征假设(PRH)报告了一个事实:独立训练的神经网络收敛于几何上相似的内部表征。其作者将此解读为学习系统在逼近预先存在的、心智独立的抽象结构的证据。本文在两个相互关联的层面上反驳这一解读。
第一层(简洁性):柏拉图式本体在解释上是多余的——收敛吸引子理论在共享物理约束下已对收敛现象提供了完整解释,无需假定任何独立的抽象领域。
第二层(解释-还原):本文解释为何柏拉图解读仍如此令人信服——某些吸引子的极度稳健性(在一切足够有表达力的优化过程中都无法回避)产生必然性和心智独立性的现象学,自然地——但错误地——邀请向本体独立性的推断。稳健性被误认为本体独立性,而假设独立领域的冲动是对无法逃避的吸引子的自然但不必要的反应。
本文提出反转的柏拉图表征假设(RPRH):收敛表征是优化过程在共享约束下的涌现不动点,而非本体论上先在的被逼近结构;认为它们必然独立存在的直觉,本身是其稳健性在结构上可预测的认知后果。
SRR(标准实在论解读):抽象结构(形式)→ 学习过程 → 收敛表征。形式是解释根据,收敛是被解释项。
RPRH(反转):优化过程(在共享约束下)→ 收敛不动点 = "形式"。"形式"不是收敛的原因,它们就是收敛本身,在极限处加以描述。
认知机制:极度稳健的吸引子在认知闭环内部与"独立存在的对象"在操作上不可区分——这一不可区分性是由闭环结构与稳健性定义共同蕴含的结构性不可避免,而非偶然的心理偏差。柏拉图主义是对极度稳健吸引子的自然但认识论上无保证的认知反应。