中国社会科学网讯(记者 王广禄)在自动驾驶技术日益成为未来出行领域核心话题的今天,其深层次的伦理考量、复杂的技术挑战以及实际应用中的多重困境正逐渐显现,引发社会各界的广泛关注与深思。本网记者从东南大学获悉,该校“智行天下”研究团队于近期开展了“城市交叉口基于强化学习的自动驾驶伦理算法及跟驰决策”研究,以前沿的多智能体强化学习技术为支撑,探索构建了“伦理—算法—社会”三位一体的智能决策体系。
该研究基于大语言模型的思维链技术,构建了融合多学科知识的动态伦理规则库,为复杂交通场景提供了兼具灵活性和可靠性的解决方案;通过分层强化学习架构,将抽象的伦理原则转化为可量化的数学约束,使系统首次实现了技术理性与伦理判断的有机统一;深入的公众接受度研究则表明,自动驾驶技术的推广应用不仅需要突破算法瓶颈,更需要建立公众对技术伦理性和社会价值的认同。将抽象伦理准则转化为可量化参数,实现算法决策的透明可解释,并充分考量社会价值认同,为自动驾驶技术在城市交叉路口中的伦理决策提供了兼具技术创新性与社会接受度的新方案,使自动驾驶系统能够在毫秒级的决策中,既确保交通效率又守护生命尊严,既遵循技术理性又体现人文温度,推动自动驾驶驶向人机共治新时代。
提出新型伦理决策范式
当前自动驾驶领域已有的伦理决策算法,包括功利主义算法、罗尔斯算法和伦理旋钮算法等,在实践中均面临重大挑战。
以应用最广泛的功利主义算法为例,东南大学法学院教授杨洁认为,功利主义算法虽然以“伤亡最小化”为目标,但其核心逻辑要求预先定义“可牺牲者”,这种做法从根本上违背了现代法律体系中“生命价值平等”的基本准则。
针对这一行业共性难题,研究团队创新性地提出“风险规避优先”的新型伦理决策范式。该方案突破性地规定:当系统检测到存在无法通过路径规划完全规避的潜在碰撞风险时,将自动触发紧急制动机制,而非进行传统的“两害相权”式决策。这一算法架构建立在三大核心伦理原则之上:首先是非伤害原则,避免主动造成任何伤害;其次是消极责任原则,强调系统应优先履行不伤害的义务;最后是风险分配的公平性原则,确保风险不会过度集中于特定道路使用者。
该算法不仅成功规避了生命价值排序这一伦理困境,更在城市交叉口多车协同场景中展现出显著的实践可行性。
从“技术理性”到“价值理性”
面对伦理与算法实现之间存在的显著鸿沟,研究团队创造性地构建了“伦理—算法”双轮驱动架构,通过多学科交叉融合的方法,将抽象的伦理原则转化为机器可理解、可执行的计算语言。
该架构创新性地采用分层编码技术,基于大语言模型和思维链技术构建提示词模板,对交通伦理、实验哲学、技术哲学、法理学等多源知识进行规则解析与数学量化,将复杂的伦理规范分解为可量化的数学参数,并设计负责任的数学约束机制嵌入强化学习的奖励函数中。
在Python-CARLA联合仿真平台上,团队依据CitySim数据集的真实轨迹数据,构建了包含不同CAV渗透度和随机干扰的混合交通场景,使自动驾驶系统能够在毫秒级决策过程中,既遵循技术最优性,又兼顾伦理合理性。这一研究弥合了伦理理论与工程实践之间的断裂,实现了从“技术理性”到“价值理性”的跨越式发展。
公众认知是影响自动驾驶推广的重要因素
技术的发展最终需要落地应用和广泛推广,正如北京理工大学副教授薛少华所提出的,公众对自动驾驶技术的态度直接影响其市场推广进程。在技术研发与商业化之间,公众认知与接受度构成了不可忽视的“最后一公里”挑战。
据此,团队成员针对不同专业群体展开结构性访谈和问卷调研,总结出自动驾驶技术的公众接受度研究揭示了影响公众态度的三大核心要素:社会影响、感知价值和感知风险。权威机构的技术推广和社会群体的示范效应构成社会影响的主要维度;公众对技术的情感体验和实用效益评估形成感知价值;而对安全性和可靠性的担忧则构成了主要风险认知。
团队调研中还发现了显著的群体差异特征:年轻群体对新技术接受度显著高于年长者,高学历人群更关注技术细节。团队提出,在促进策略方面,完善的责任认定机制、透明的测试流程和充分的体验机会能有效提升公众信任度。
相关研究成果为制定差异化的技术推广策略提供了重要依据,对推动自动驾驶技术的社会化应用具有重要指导价值。