1. 首页
  2. /
  3. 价值对齐
人工智能如何建立价值观
人工智能如何建立价值观
文章提出以多层防线与闭环治理让AI建立价值观:通过价值发现与规则固化,将社会、法律与组织价值转译为数据与目标;以SFT、RLHF/RLAIF和宪法式AI建立内生偏好,叠加护栏与权限治理控制外部行为;依托NIST与Gartner框架搭建端到端治理与评测体系;最终以平台化编排、红队常态化和线上观测持续迭代,实现可审计、可回滚的价值对齐工程。
  • Rhett BaiRhett Bai
  • 2026-01-17
  • 1