逸仙逻辑讲坛第五十二期|王康予:因果决策理论与因果世界模型
因果决策理论与因果世界模型

第五十二期逸仙逻辑讲坛
题 目:因果决策理论与因果世界模型
主讲人:王康予 香港大学白洁 助理讲师
主持人:熊卫 白洁 教授
时 间:3月18日(周三)下午15:30
地 点:锡昌堂322室
主办方:白洁 逻辑与认知研究所
主讲人简介

王康予,香港大学白洁 助理讲师,伦敦政治经济学院哲学、逻辑与科学方法系博士候选人,香港大学人工智能与人文实验室、澳大利亚国立大学机器智能与规范理论实验室研究员,伦敦大学 2025 年度雅各布森论文奖(Jacobsen Essay Prize)得主,研究方向为决策论、实践理性、人工智能和机器学习哲学、经济学哲学、社会科学哲学与政治学。
内容简介
If Causal Decision Theory (CDT) is correct, it carries significant implications for artificial intelligence. In Newcomb-style scenarios, where other agents can predict an AI agent’s interventions with high accuracy, the AI agent cannot act rationally without a robust understanding of causal relations. Therefore, a Causal World Model (CWM) enabling the AI agent to represent causal relations and predict the causal impacts of its own interventions is necessary for its rational behavior. This philosophical verdict aligns well with recent technical machine learning research: to be robust against out-of-distribution shifts, AI agents require CWMs. As a corollary, I address Functional Decision Theory (FDT), which some AI researchers propose as an alternative framework for such dilemmas. I argue that FDT is not a true alternative; as it focuses on policies rather than temporally indexed choices, its most defensible form reduces to CDT.
若因果决策理论(CDT)成立,那么它对人工智能具有重要意义。在纽科姆式场景中,当其他智能体能够高精度预测人工智能体的干预行为时,人工智能体若缺乏对因果关系的可靠理解,便无法做出理性行动。因此,要使人工智能体实现理性行为,必须具备因果世界模型(CWM),使其能够表征因果关系并预测自身干预行为的因果效应。
这一哲学结论与近期机器学习领域的技术研究高度吻合:人工智能体需要因果世界模型,才能具备应对分布外偏移的鲁棒性。作为推论,本文还将讨论函数决策理论(FDT)—— 部分人工智能研究者将其作为解决此类困境的替代框架。本文认为,FDT 并非真正意义上的替代方案;由于其关注的是策略而非时间索引下的具体选择,其最具辩护力的形式最终可归约为因果决策理论。

