AI 時代來臨,老師到底該怎麼幫學生打分數?
生成式人工智慧(Generative AI)的發展劇烈而迅速,回想起 2022 年 ChatGPT 問世時,我才剛進入大學,當時的我只會偶爾用它做語言校正。如今短短 3 年過去,隨著 AI 技術不斷迭代更新,大幅提升了資料處理能力、演算法效率,以及語言表達的精確度,我也開始學著運用它來彙總筆記、釐清複雜概念,甚至是進行專案和時間管理。
在讓 AI 逐步參與學習的過程中,我深刻感受到 AI 發展所牽動的不只是教學形式,而是整個知識生產系統的革新。
這讓我想起去(2024)年底,倫敦政治經濟學院(LSE)新任校長 Larry Kramer,也曾在就職演說中明確指出「生成式 AI」將徹底顛覆我們的社會實踐,尤其是知識產業,不只會改變大學本身的行政作業流程,更會重新定義我們教什麼、怎麼教,以及我們研究什麼、如何研究。
專精於社會科學研究的 LSE,在 AI 浪潮席捲高等教育之際,也必須因應這場科技革命所帶來的機遇與挑戰。本文將結合我在 LSE 就讀 3 年來的學習經驗,從學生的第一線觀察出發,探討英國大學的 AI 治理方法,並進一步反思未來的大學教育趨勢。
從禁止、開放 AI,再到全面導入「觀察式評量」
就在今年 6 月,LSE 更新了關於生成式 AI 的使用政策;延續上學年(2024/25)首次開放有條件使用 AI,這次的轉變在於進一步規定所有課程導入「觀察式評量」(Observed Assessment),這表示學生將面臨口試、閉卷考、編輯紀錄追蹤等新型評量方式,以確保大學教育的品質能在「維護學術誠信與學位價值」和「培養 AI 技能與素養」間取得平衡。
回顧上一學年,LSE 取消了對生成式 AI 的全面禁令,改由各系所決定是否允許學生在評量中使用 AI,並分為「禁止」、「有限使用」與「完全使用」這 3 種類型。允許使用 AI 的課程,教師需向學生說明引用與註明的規範,包含學生在評量中該如何標示使用 AI 的方式與範圍。
以我就讀的國際關係學系為例,課程評量多以申論題為主,篇幅通常落在 1,500 至 3,000 字之間,成績占比高達總成績的 80-100%。從大二開始,幾乎所有申論題作業都明文禁止使用 AI 工具。每次交作業前,我們都需要勾選一份「誠信聲明」,確認我們已清楚了解:除非系上另有規定,否則不得在評量的任何部分使用 AI 工具協助完成。
隨著 AI 在文獻搜尋、語言潤飾,甚至生成論點方面日益成熟,申論題型確實是最容易受到衝擊的評量形式之一。畢竟這類作業沒有標準答案,重點在於整合閱讀、批判分析,以及論證表達;又多為回家完成,準備時間從一週到數月不等,是深化知識必經的歷程。
然而,當 AI 能取代從摘要到寫作的各個環節,且難以驗證使用程度,不僅會造成評估學習成效的困難,也可能失去最初設計這種作業的用意。
值得一提的是,我的其中一門課雖然同樣以申論題為導向,期末需繳交一篇 2,500 字、佔學期成績 80% 的論文,教授卻採取了不同立場──允許學生「有限使用 AI」。該位教授告訴我們:「你可以用 AI 做很多事,只要不是直接讓它幫你寫文章再複製貼上繳交就好。」開學第一堂課,他甚至向我們介紹如何運用不同的工具與模型,來協助文獻整合和理論分析。
同時,教授也強調,經過他親自實驗,目前 AI 工具無法生成複雜且具有原創性的觀點,而這恰恰是這門課希望培養的核心能力。因此,AI 最適合的角色是思考的「輔助者」,而非「替代品」,更不應被拿來逃避學習任務。
教授提到,從短期來看,AI 對學術文獻的解讀、研究構想的提出,乃至論文撰寫,往往不夠精確,品質也有限;從長遠來看,若學生習慣用聊天機器人取代自己的學習歷程,實際上是在削弱自身的專業能力與競爭力。
此外,這門課也非常重視學生的參與,課堂表現佔總成績 20%,在以考試或論文為主的 LSE 評量制度中,算是相當高的比例。
課堂中,每位學生都會擔任一次「閱讀帶領者」,需批判性地指出指定閱讀的優勢與不足,並結合其他文獻或課程主題,思考其潛在的政策意涵或研究方向,引導全班進行深度討論,同時老師也會反問學生。
相較於其他 100% 以論文評分的課程,這樣的設計確實更強調學生的持續性投入──不只要讀懂文章內容,還需要理解其研究方法、分析其邏輯,並具備與他人進行對話的能力,而這些過程都不是 AI 能輕易取代的。
「如何評分」仍無標準方案,最佳解方待師生共同重塑
多數英國大學的作業通常分為不計分的練習(formative),以及計分的正式作業(summative)。
以前文這門課為例,練習作業要求學生提前交出正式論文的大綱,不列入成績。這屬於不計分的「觀察式評量」,一方面讓學生能分段完成任務,為後續的論文撰寫留下思考和編輯軌跡;另一方面,也避免了學生依賴單次 AI 生成,並在後續的回饋互動中,協助老師掌握學習進度與 AI 使用的合理程度,確保教學成果仍建立在真實的理解與參與之上。
由此可見,LSE 的 AI 治理新政,其實早在教學現場中落地實踐。不過,具體的實施方式因課程而異,學生的感受也不盡相同。
就讀數據科學學系的朋友分享,他們在期末小組報告即將完成時,才臨時收到通知:教授可能會對小組進行抽查口試,並將結果納入評分。這讓他們感到措手不及,也突顯出「觀察式評量」是否計分、如何與計分作業連動、實施順序為何,以及是否有事前明確公告等,都需經過更細緻的考慮和討論。
最後,引入「觀察式評量」也不一定能達到最佳的學習效果。以「閉卷考」為例,我在大學期間,每年都有至少一門課採取這種形式,要求學生在 3 小時內完成 3 篇約千字的申論題,佔整體成績 100%。
這類評量雖然強調學生在學期間的持續性積累,但在高壓、限時的情境下,我往往只會依循課堂上教授提供的思路作答,較難展現有創意的思考。雖然能透過記憶與反覆熟悉知識點應考,但我想對於培養獨立的學術探究能力,效果還是相對有限。
由於評量方式本身就是許多學生選課的重要依據,我身邊不少朋友會刻意避開以「閉卷考」為主的課程,轉而選擇可以「繳交論文作業」的課程,因為他們更擅長在充裕的時間中進行組織與表達,也相信那樣的評量方式更能反映自己的學習成果。當然,怎樣的評量形式最為合適,還是會因不同科系而異,以下我一樣將以自身就讀的國際關係學系,作為深入思考的案例。
以課堂參與而言,性格內向的同學可能相對處於弱勢。還記得大二的一門課程中,教授意識到這樣的評量方式會對部分學生造成壓力,因此提供了更多元的參與形式作為補充。除了可以在課後與老師預約面談(Office Hour),也開放學生選擇性提交課堂筆記或討論紀錄,作為評量表現的額外依據。
AI 為教學帶來的碰撞,為何值得期待?
在 LSE 的 3 年間,我見證了生成式 AI 與傳統大學教育的碰撞與融合──從最初的無規可依,到全面禁止,再到如今逐步開放、依課程特性彈性調整,並陸續導入「觀察式評量」作為應對機制。
作為學生,我體會到英國大學過去長期以單一次考試或論文,決定整個學期、甚至學年的努力成果,其實是存有缺陷與不足的。而當 AI 出現,促使教學模式出現更多元、具有積累性,又能增進師生交流的設計,對學生而言,其實是值得期待的發展。
正如 OpenAI 早期投資人、領英(LinkedIn)共同創辦人霍夫曼(Reid Hoffman)在 LSE 的一場公開演講中所提,像 AI 這樣的世代性科技,它的價值並不是與生俱來的。他指出,AI 不是單純中立的工具,也不是天生就帶有好或壞的傾向,因為科技的價值是兩者的融合,是人們透過使用、選擇與調整,一點一滴「雕塑」出來的。
就像雕刻大理石,我們不能隨意改變它的材質,但可以透過力道與技巧,慢慢形塑出想要的樣子。同樣地,我們也需要對科技本身有足夠的理解,帶著判斷去思考:這項技術該被怎麼使用?用以幫助誰?會不會帶來新的風險?透過這些思考,賦予它方向與意義。
思考 AI 在教育中的角色,我想改革的重點不在於「該不該」使用 AI 這樣的二元選擇,而在於我們想怎麼使用這些工具,更重要的是,如何培養學生「正確使用 AI 的動機」,將它視為深化思考的助手,從而培養出真正具備 AI 素養,也能應對未來世界、不斷變動挑戰的終身學習者。
※本文由換日線網站授權刊載,原標題為《AI 時代評分難,英國名校有新解方?一文看懂 LSE「觀察式評量」與實際應用》,未經同意禁止轉載。
【延伸閱讀】
●ChatGPT 之亂:學生用 AI 軟體寫作業,教育局祭禁令有用嗎?
●乖乖寫作業卻被打 0 分?從作弊疑雲到信任危機,生成式 AI 正改寫學術規則
※本文由換日線授權刊登,未經同意禁止轉載
顯示全部
留言 1