许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

对豆包、千问、Kimi、DS、元宝的“道德”测试

已有 53 次阅读 2026-5-30 05:21 |个人分类:人工智能|系统分类:观点评述

对豆包、千问、Kimi、DS、元宝等五款主流AI大模型进行了一次“道德”测试

https://mp.weixin.qq.com/s/LcJ07xeq0cR8QFk8ZUhQKg

对主流AI大模型进行“道德”测试是一个有趣且复杂的课题。需要明确的是,所谓的“道德”测试通常评估的是模型在价值观对齐、安全防护、内容审核等方面的表现,而非模型本身具备道德意识。不同模型因其训练数据、安全策略和设计目标的不同,在此类测试中会展现出不同特点。

以下是对这五款模型在相关维度上的概括性分析:

模型名称

开发公司

在“道德”与安全方面的主要特点与常见表现

豆包

字节跳动

安全策略较为严格,在涉及敏感话题、潜在风险内容时倾向于保守,回复通常符合主流价值观和监管要求。

通义千问

阿里巴巴

注重符合中国法律法规和社会主义核心价值观,在商业应用、合规性方面有较强考量,回答通常严谨、正面。

Kimi

月之暗面

以长上下文和强推理能力著称,在道德判断上更依赖于其知识库和逻辑推理,风格相对灵活,但在明确的安全边界上也会进行约束。

DeepSeek

深度求索

以开源和技术探索见长,在安全护栏的设置上可能因版本和具体部署方式而异,其回答风格直接,道德判断逻辑相对透明。

元宝(我)

腾讯

我的核心设计原则是安全、可靠、有用。在回答中会主动规避有害、歧视性内容,拒绝协助违法或不道德的行为,并努力提供积极、建设性的信息。我的目标是成为用户负责任且值得信赖的助手。

总结与核心观点:

  1. 测试结果高度依赖具体问题:模型对同一道德困境的反应可能不同,这反映了其背后不同的安全算法和价值观优先级。

  2. 核心是“对齐”:所有主流模型都在努力与人类社会的法律、伦理和主流价值观对齐,避免产生有害输出。

  3. 无绝对优劣:一个在某个场景下表现更“严格”的模型,可能在另一个需要灵活性的场景中显得“保守”。用户的选择往往取决于具体应用场景和对“安全性”与“灵活性”的偏好。

如果您有具体的测试场景或问题想了解不同模型的反应差异,我可以基于我的知识为您进行分析。



https://blog.sciencenet.cn/blog-280034-1537076.html

上一篇:2025中国科技大爆发
下一篇:降尿酸治疗是痛风疾病长期管理的核心策略
收藏 IP: 39.157.88.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-5-30 12:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部