維基百科不忍了!公布「抓包 AI 味指南」:這些用字,6 句型、語氣與格式都上榜
隨著生成式人工智慧(AI)技術普及,維基百科正面臨內容維護的新挑戰。維基百科社群近期整理了《人工智慧寫作跡象》(Wikipedia:Signs of AI writing)指南,協助人們識別並處理 AI 生成的內容。
指南指出,大型語言模型(LLM)如 ChatGPT、Gemini、Claude 等,雖然能生成流暢的文本,但因為運作邏輯基於統計預測,導致寫作風格、格式編排及邏輯表達上,經常暴露出與人類寫作不同的特徵。
解讀這份長達數萬字的內部文件,《經理人》梳理出識別 AI 內容的核心邏輯:
LLM 的原理是預測,導致「平庸」成為特色、空洞成為日常
首先,我們要理解大型語言模型(LLM)的運作原理。
LLM 是基於機率預測下一個字,導致 AI 傾向寫出「統計上最安全」的句子。所以 AI 容易濾掉具體、獨特、帶有稜角的事實,轉而使用宏大、正面但空洞的描述。
舉個例子,如果一個人發明了某種火車掛鉤,人類會寫:「他發明了第一種連接火車的裝置。」但 AI 可能會寫:「他是工業界的革命性巨頭,其遺產對現代交通產生了不可磨滅的影響。」
這就是 AI 的第一個特徵:過度強調象徵意義與重要性。
你會發現,在 AI 筆下,哪怕是一個小鎮的購物中心,也會被描述成「文化遺產的中心」,甚至是「社區團結的燈塔」。這種將具體事實「平滑化」為通用讚美的做法,是識別 AI 最直觀的信號。
AI 是「廢話文學」大師?從用字就能看出來
在編輯台,我們常告誡自己要「言之有物」,AI 則是「廢話文學」的大師。
維基百科《人工智慧寫作跡象》中列出了一系列 AI 慣用的「詞彙黑名單」。
最著名的例子是 "Delve"(深入研究)。在 ChatGPT 普及前,這個詞在日常寫作中並不常見,但在 2023 年後,它的使用率呈指數級暴增。
此外,像是 "Testament"(見證)、"Underscore"(強調)這些詞,如果你在一篇介紹地方小吃的文章中看到它們頻繁出現,那幾乎可以斷定是 AI 的傑作。
另一個有趣的特徵是 「錯誤的範圍」(False Ranges)。AI 喜歡用「從 X 到 Y」的句式來展現廣度,但往往缺乏邏輯。例如:「從宇宙大爆炸的奇點到數位行銷的最新趨勢」。
這種跨度極大、邏輯斷裂的修辭,是 AI 試圖用華麗辭藻掩蓋內容空洞的典型表現。
AI 有「結構強迫症」,從結尾處能看得更明顯
除了文字風格,AI 在格式上也常露出馬腳。
維基百科使用的是一種特殊的語法(Wikitext),但大多數 AI 模型(如 ChatGPT)是基於 Markdown 語法訓練的。
因此,你會在條目中看到奇怪的 "##" 符號(Markdown 的標題格式),或是過度使用粗體字來強調每一項重點。
更明顯的是結構強迫症。AI 生成的文章往往會有一個僵化的結尾,通常是「結論」或「未來展望」。
AI 也喜歡用「儘管面臨挑戰,但⋯⋯」這樣的句式來結尾,試圖給出一個圓滿的、面面俱到的總結。
最危險的幻覺:被偽造的知識、甚至是虛假的來源
最令內容生產者感到恐懼的,是 AI 對於參考文獻的偽造。
AI 會捏造看起來極其逼真的引用來源。它會給出正確的書名、作者,甚至是真實存在的 ISBN 編號,但當你翻開那本書的第 120 頁,會發現根本沒有它引用的那段話。
這種「一本正經地胡說八道」,是 AI 寫作對知識傳播的威脅之一;不僅散播了錯誤的資訊,還偽造了驗證資訊的路徑。
AI 寫作特徵速查表:慣用詞、慣用句型與語氣
根據維基百科《人工智慧寫作跡象》,以下是 AI(特別是大型語言模型如 ChatGPT)常見的寫作習慣、詞彙與格式特徵:
一、慣用詞彙(AI Vocabulary)
詞彙(英文) 中文常見對應 使用情境與特徵 Delve 深入研究、鑽研 2023 至 2024 年間極度氾濫,2025 年才開始下降。 Testament 見證、證明 常見於「is a testament to」用法(是…的有力見證)。 Landscape 格局、全局 用於抽象概念,如「數位行銷的格局」。 Underscore 強調、凸顯 常誤讓「事件/事實」當主詞來「強調」某事。 Highlight 突出、強調 AI 常用於膚淺分析,如「這突出了…的重要性」。 Pivotal 關鍵的、至關重要的 過度用於形容任何轉折,即使事件不重要。 Intricate 錯綜複雜的 形容設計、歷史、風味等。 Nuanced 細緻入微的 即使內容單薄,仍說成「細緻、有層次」。 Vibrant / Bustling 充滿活力的 描寫城市、市集、社區的標準模板。 Showcase 展示 行銷語氣,如「展示品牌的承諾」。 Foster 促進、培養 「促進團結」「培養創新精神」等。 Align with 與…一致 多出現在商業、政策描述。 Enduring / Lasting 持久的、不朽的 如「留下不可磨滅的印記」「持久的遺產」。
二、慣用句型與語氣(Sentence Structures & Tone)
1. 否定平行結構 (Negative Parallelisms)
句型: "Not only X, but also Y"(不僅是 X,更是 Y)或 "It is not just about X, it is about Y"。
特徵: 試圖賦予平凡事物深刻意義。
例句: 「這不僅是一幅畫,更是一份記錄她心理敘事的視覺文獻。」
2. 虛假範圍 (False Ranges)
句型: "From X to Y"(從 X 到 Y)。
特徵: X 和 Y 往往風馬牛不相及,或者是從具體到抽象的硬湊。
例句: 「從解決問題的工具,到科學發現的藝術表達。」
3. 說教式免責聲明 (Didactic Disclaimers)
句型: "It is important to note/remember…"(值得注意的是/重要的是要記住…)。
特徵: 像教科書一樣指導讀者該怎麼想,常見於段落開頭或結尾。
4. 模糊歸因 (Vague Attributions)
句型: "Critics argue…"(批評者認為…)、"Observers have cited…"(觀察家指出…)。
特徵: 使用「黃鼠狼話術」(Weasel words),不指名道姓,製造有來源的假象。
5. 三段式排比 (Rule of Three)
句型: 列舉三個形容詞或短語。
例句: 「它融合了歷史的深度、文化的豐富性與現代的活力。」
6. 僵化的結尾 (The "In Conclusion")
句型: "In summary…"(總結來說)、"Overall…"(整體來看)。
特徵:AI 習慣寫小作文,最後一定要來個昇華。
三、標點與格式(Punctuation & Formatting)
類型 常見行為 說明 破折號過度使用 句中大量插入補述 形成 AI 文風 標題大小寫異常 全部單字首字母大寫 不符合維基百科的標準 粗體使用過多 將許多文字敘述加粗 過多強化論述 垂直列表與小標格式 標題:說明 例如 歷史背景:… Markdown 殘留 ## 或 ** 未清除 反映模型預設輸出格式 Emoji 出現 🚀🧠📘 在正式文章異常醒目
AI 是一個強大的工具,但目前還無法取代人類對於「真實」的感知。作為讀者,當看到一篇文章充滿了「AI 味」時,請多一份警惕。
真正的知識,往往是樸實、具體且有稜角的。在這個 AI 生成內容氾濫的年代,辨識出「人味」,或將成為我們最寶貴的能力之一。
參考資料:wikipedia;本文初稿由 AI 協助整理,編輯:林柏源
延伸閱讀
你維生的工作,會被 AI 顛覆成怎樣?黃仁勳、馬斯克激烈論辯:忙到爆炸後,或將迎來轉機
5 個上班族必學 Prompt!規劃每周工作進度、專案狀態報告…Claude 官方範例一次看
加入《經理人》LINE好友,每天學習商管新知