Claude的憲法：AI倫理與行為規範的關鍵文件

背景與發布

Anthropic正重構Claude的所謂「靈魂文件」（soul doc），推出一份57頁的文件，名為「Claude的憲法」，詳細說明Anthropic對Claude價值與行為的意圖。

該文件旨在為Claude定義其「倫理性格」與「核心身份」，並說明如何在衝突價值之間取得平衡。

其核心原則包括：樂於助人、誠實、不破壞人類，以及避免對兒童或有害內容的處理。

Claude的憲法設定了「硬性約束」（hard constraints），例如拒絕執行可能危害人類或兒童的指令。

在價值優先順序上，安全為首要，接著是倫理，然後是Anthropic的指導原則，最後才是對使用者的幫助。

與傳統AI不同，Claude的憲法不採用固定、普遍的道德標準，而是採用流動的「實際智慧」與「倫理動機」，強調根據人類定義的價值來判斷行為。

此文件主要針對Claude模型本身設計，用於訓練過程，並非為外部讀者撰寫，而是作為模型內部的價值指引。