請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

國際

AI 時代來臨,老師到底該怎麼幫學生打分數?

換日線

更新於 08月20日03:41 • 發布於 07月16日06:42 • 李易庭 Joyce/有意思
AI 時代來臨,老師到底該怎麼幫學生打分數?

生成式人工智慧(Generative AI)的發展劇烈而迅速,回想起 2022 年 ChatGPT 問世時,我才剛進入大學,當時的我只會偶爾用它做語言校正。如今短短 3 年過去,隨著 AI 技術不斷迭代更新,大幅提升了資料處理能力、演算法效率,以及語言表達的精確度,我也開始學著運用它來彙總筆記、釐清複雜概念,甚至是進行專案和時間管理。

在讓 AI 逐步參與學習的過程中,我深刻感受到 AI 發展所牽動的不只是教學形式,而是整個知識生產系統的革新。

這讓我想起去(2024)年底,倫敦政治經濟學院(LSE)新任校長 Larry Kramer,也曾在就職演說中明確指出「生成式 AI」將徹底顛覆我們的社會實踐,尤其是知識產業,不只會改變大學本身的行政作業流程,更會重新定義我們教什麼、怎麼教,以及我們研究什麼、如何研究。

專精於社會科學研究的 LSE,在 AI 浪潮席捲高等教育之際,也必須因應這場科技革命所帶來的機遇與挑戰。本文將結合我在 LSE 就讀 3 年來的學習經驗,從學生的第一線觀察出發,探討英國大學的 AI 治理方法,並進一步反思未來的大學教育趨勢

從禁止、開放 AI,再到全面導入「觀察式評量」

就在今年 6 月,LSE 更新了關於生成式 AI 的使用政策;延續上學年(2024/25)首次開放有條件使用 AI,這次的轉變在於進一步規定所有課程導入「觀察式評量」(Observed Assessment),這表示學生將面臨口試、閉卷考、編輯紀錄追蹤等新型評量方式,以確保大學教育的品質能在「維護學術誠信與學位價值」和「培養 AI 技能與素養」間取得平衡。

回顧上一學年,LSE 取消了對生成式 AI 的全面禁令,改由各系所決定是否允許學生在評量中使用 AI,並分為「禁止」、「有限使用」與「完全使用」這 3 種類型。允許使用 AI 的課程,教師需向學生說明引用與註明的規範,包含學生在評量中該如何標示使用 AI 的方式與範圍。

以我就讀的國際關係學系為例,課程評量多以申論題為主,篇幅通常落在 1,500 至 3,000 字之間,成績占比高達總成績的 80-100%。從大二開始,幾乎所有申論題作業都明文禁止使用 AI 工具。每次交作業前,我們都需要勾選一份「誠信聲明」,確認我們已清楚了解:除非系上另有規定,否則不得在評量的任何部分使用 AI 工具協助完成。

隨著 AI 在文獻搜尋、語言潤飾,甚至生成論點方面日益成熟,申論題型確實是最容易受到衝擊的評量形式之一。畢竟這類作業沒有標準答案,重點在於整合閱讀、批判分析,以及論證表達;又多為回家完成,準備時間從一週到數月不等,是深化知識必經的歷程。

然而,當 AI 能取代從摘要到寫作的各個環節,且難以驗證使用程度,不僅會造成評估學習成效的困難,也可能失去最初設計這種作業的用意。

值得一提的是,我的其中一門課雖然同樣以申論題為導向,期末需繳交一篇 2,500 字、佔學期成績 80% 的論文,教授卻採取了不同立場──允許學生「有限使用 AI」。該位教授告訴我們:「你可以用 AI 做很多事,只要不是直接讓它幫你寫文章再複製貼上繳交就好。」開學第一堂課,他甚至向我們介紹如何運用不同的工具與模型,來協助文獻整合和理論分析。

同時,教授也強調,經過他親自實驗,目前 AI 工具無法生成複雜且具有原創性的觀點,而這恰恰是這門課希望培養的核心能力。因此,AI 最適合的角色是思考的「輔助者」,而非「替代品」,更不應被拿來逃避學習任務。

教授提到,從短期來看,AI 對學術文獻的解讀、研究構想的提出,乃至論文撰寫,往往不夠精確,品質也有限;從長遠來看,若學生習慣用聊天機器人取代自己的學習歷程,實際上是在削弱自身的專業能力與競爭力。

此外,這門課也非常重視學生的參與,課堂表現佔總成績 20%,在以考試或論文為主的 LSE 評量制度中,算是相當高的比例。

課堂中,每位學生都會擔任一次「閱讀帶領者」,需批判性地指出指定閱讀的優勢與不足,並結合其他文獻或課程主題,思考其潛在的政策意涵或研究方向,引導全班進行深度討論,同時老師也會反問學生。

相較於其他 100% 以論文評分的課程,這樣的設計確實更強調學生的持續性投入──不只要讀懂文章內容,還需要理解其研究方法、分析其邏輯,並具備與他人進行對話的能力,而這些過程都不是 AI 能輕易取代的。

「如何評分」仍無標準方案,最佳解方待師生共同重塑

多數英國大學的作業通常分為不計分的練習(formative),以及計分的正式作業(summative)

以前文這門課為例,練習作業要求學生提前交出正式論文的大綱,不列入成績。這屬於不計分的「觀察式評量」,一方面讓學生能分段完成任務,為後續的論文撰寫留下思考和編輯軌跡;另一方面,也避免了學生依賴單次 AI 生成,並在後續的回饋互動中,協助老師掌握學習進度與 AI 使用的合理程度,確保教學成果仍建立在真實的理解與參與之上。

由此可見,LSE 的 AI 治理新政,其實早在教學現場中落地實踐。不過,具體的實施方式因課程而異,學生的感受也不盡相同。

就讀數據科學學系的朋友分享,他們在期末小組報告即將完成時,才臨時收到通知:教授可能會對小組進行抽查口試,並將結果納入評分。這讓他們感到措手不及,也突顯出「觀察式評量」是否計分、如何與計分作業連動、實施順序為何,以及是否有事前明確公告等,都需經過更細緻的考慮和討論。

最後,引入「觀察式評量」也不一定能達到最佳的學習效果。以「閉卷考」為例,我在大學期間,每年都有至少一門課採取這種形式,要求學生在 3 小時內完成 3 篇約千字的申論題,佔整體成績 100%。

這類評量雖然強調學生在學期間的持續性積累,但在高壓、限時的情境下,我往往只會依循課堂上教授提供的思路作答,較難展現有創意的思考。雖然能透過記憶與反覆熟悉知識點應考,但我想對於培養獨立的學術探究能力,效果還是相對有限。

由於評量方式本身就是許多學生選課的重要依據,我身邊不少朋友會刻意避開以「閉卷考」為主的課程,轉而選擇可以「繳交論文作業」的課程,因為他們更擅長在充裕的時間中進行組織與表達,也相信那樣的評量方式更能反映自己的學習成果。當然,怎樣的評量形式最為合適,還是會因不同科系而異,以下我一樣將以自身就讀的國際關係學系,作為深入思考的案例。

以課堂參與而言,性格內向的同學可能相對處於弱勢。還記得大二的一門課程中,教授意識到這樣的評量方式會對部分學生造成壓力,因此提供了更多元的參與形式作為補充。除了可以在課後與老師預約面談(Office Hour),也開放學生選擇性提交課堂筆記或討論紀錄,作為評量表現的額外依據。

AI 為教學帶來的碰撞,為何值得期待?

在 LSE 的 3 年間,我見證了生成式 AI 與傳統大學教育的碰撞與融合──從最初的無規可依,到全面禁止,再到如今逐步開放、依課程特性彈性調整,並陸續導入「觀察式評量」作為應對機制。

作為學生,我體會到英國大學過去長期以單一次考試或論文,決定整個學期、甚至學年的努力成果,其實是存有缺陷與不足的。而當 AI 出現,促使教學模式出現更多元、具有積累性,又能增進師生交流的設計,對學生而言,其實是值得期待的發展。

正如 OpenAI 早期投資人、領英(LinkedIn)共同創辦人霍夫曼(Reid Hoffman)在 LSE 的一場公開演講中所提,像 AI 這樣的世代性科技,它的價值並不是與生俱來的。他指出,AI 不是單純中立的工具,也不是天生就帶有好或壞的傾向,因為科技的價值是兩者的融合,是人們透過使用、選擇與調整,一點一滴「雕塑」出來的。

就像雕刻大理石,我們不能隨意改變它的材質,但可以透過力道與技巧,慢慢形塑出想要的樣子。同樣地,我們也需要對科技本身有足夠的理解,帶著判斷去思考:這項技術該被怎麼使用?用以幫助誰?會不會帶來新的風險?透過這些思考,賦予它方向與意義。

思考 AI 在教育中的角色,我想改革的重點不在於「該不該」使用 AI 這樣的二元選擇,而在於我們想怎麼使用這些工具,更重要的是,如何培養學生「正確使用 AI 的動機」,將它視為深化思考的助手,從而培養出真正具備 AI 素養,也能應對未來世界、不斷變動挑戰的終身學習者。

※本文由換日線網站授權刊載,原標題為《AI 時代評分難,英國名校有新解方?一文看懂 LSE「觀察式評量」與實際應用》,未經同意禁止轉載。

【延伸閱讀】

●ChatGPT 之亂:學生用 AI 軟體寫作業,教育局祭禁令有用嗎?
●乖乖寫作業卻被打 0 分?從作弊疑雲到信任危機,生成式 AI 正改寫學術規則

※本文由換日線授權刊登,未經同意禁止轉載

加入換日線 LINE 好友,每日接收全球議題包

查看原始文章

更多國際相關文章

01

【敏迪獨家專欄】中日近年來最大外交衝突,雙方吵什麼,中國祭出哪些報復措施?

敏迪選讀Mindi World News
02

尪超熟睡叫不醒!母心碎目睹5月大女兒卡床縫窒息身亡 

鏡報
03

「東南亞第一深情大嫂」掏槍助6囚犯逃獄! 「長太美」慘遭記者公然性騷

鏡報
04

3萬分之1奇蹟!京都罕見白烏鴉曝光 百萬人朝聖

鏡週刊
05

中國男釣到「國寶」嚇壞! 連打3通電話給警察報備下場曝光

鏡報
06

大叔公車上看謎片被隔壁女生發現 下一秒動作超變態!

鏡報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 1

留言功能已停止提供服務。試試全新的「引用」功能來留下你的想法。

Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...