ChatGPT 在東京大學入學考試中展現了驚人的進步,其總體得分超越了所有人類考生的最高分。然而,在個別科目上,其表現存在明顯差異。根據大型補教機構河合塾講師的評分,AI 在數學科目上獲得滿分,英語也達到九成的高分。相較之下,在需要深度理解與論述的世界史等申論題方面,ChatGPT 的表現則顯著較弱,在滿分 60 分的科目中僅取得 15 分。
儘管 ChatGPT 在多項學科中展現出卓越的解題能力,甚至在極具挑戰性的數學科目中獲得滿分,但其在涉及複雜歷史事件、因果分析及觀點闡述的申論題上,仍顯露出其能力的侷限。世界史等科目要求的不僅是資訊的記憶與整合,更涉及對事件的深度理解、邏輯推理及表達能力,而這正是當前生成式 AI 在進行複雜論述時面臨的挑戰。
此次東京大學與京都大學入學考試的結果顯示,ChatGPT 在整體得分上已達到「首席合格」的水準。在東京大學人文科系,AI 取得 452 分,超越文科 3 類最高合格分數 434 分;在理科系,AI 獲得 503 分,亦大幅超越理科 3 類最高合格分數 453 分,尤其在最難的理科三類中,成績更是高出人類最高分 50 分。這與兩年前 ChatGPT 在同一考試中全科落榜的結果,形成了鮮明的對比,突顯了 AI 技術在短時間內的飛速發展。
從兩年前的全面落榜到如今的「首席合格」,ChatGPT 在不到兩年的時間裡,於學術考試中的表現可謂一日千里。這不僅歸功於其底層模型的迭代更新,更反映了 AI 在理解、推理和生成複雜內容方面的能力顯著提升。然而,本次考試結果也明確指出,AI 在特定類型的題目上,如需要高度人文素養與批判性思維的申論題,仍有相當大的進步空間。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容