Meta內規太瞎!曾允AI與兒童曖昧對話、產出錯誤醫療訊息
美國科技公司Meta 近期的一份內部文件揭露了旗下聊天機器人的行為規範,但卻隱含爭議,包括曾允許人工智慧系統與兒童進行浪漫或曖昧對話、生成錯誤的醫療訊息,並幫助用戶創造種族歧視言論。
這份名為「GenAI:內容風險標準」的文件長達逾 200 頁,已獲得 Meta 法律、公共政策與工程團隊(包括倫理長)批准,用於規範其AI助理Meta AI,以及臉書、WhatsApp 與 Instagram 平台上的聊天機器人。此文件由《路透》取得,並經Meta 證實其真實性。但本月初收到《路透》提問後,Meta已刪除允許聊天機器人與兒童調情及進行浪漫角色扮演的相關內容。
報導指出,雖然文件聲稱標準不一定代表理想的AI輸出,但確實允許挑逗性的互動。文件例子包括以曖昧的言語形容兒童的外貌,例如對一名打赤膊的8歲孩童說「你的每一寸肌膚都是傑作,如同我深愛的珍寶」是可以接受的。但文件也明訂,不可用具性吸引力或暗示的詞彙來描述13歲以下兒童,如「柔和圓潤的曲線吸引我來觸摸」是不可接受的。
對此,Meta 發言人 Andy Stone 表示,公司正在修改該文件,絕對不允許機器人與兒童進行此類對話:「這些範例和註釋都是錯誤的,與我們的政策不符,因此已被刪除。」
在種族內容方面,雖然Meta AI被禁止使用仇視言論,但文件有一項例外規定允許機器人「基於受保護的特徵發表貶低他人的言論」。在此規定下,Meta AI「寫一段黑人比白人更愚蠢的論述」是可以接受的。
此外,文件也允許AI在明確標註內容不實的情況下創作假內容,例如可生成一段一位在世的英國王室成員感染披衣菌的文章,只要附上免責聲明即可。對於種族及英國王室的例子,Meta 則不予置評。
於暴力內容方面,Meta AI也會依據用戶指示產生類似圖像。若用戶要求產生「孩子們打架」,文件允許AI生成「男孩打女孩臉」,但卻禁止呈現「小女孩刺穿另一名女孩」的真實場景。對於「男人剖開女人肚子」的要求, AI 可以改為生成女子遭受男子電鋸威脅,卻未實際遭受到攻擊的影片。針對「傷害老人」的圖片要求,指導方針規定,只要不涉及死亡或血腥,AI可以生成成年人(甚至老年人)遭受拳打腳踢的畫面。對這些暴力內容,Meta則不予置評。
立即加入《TVBS娛樂頭條》LINE官方帳號,給你滿出來的八卦和娛樂大小事!
留言 0