考試評價改革作為教育改革的“牛鼻子工程”,直接影響教學導向、學習方式和人才培養質量。以新一代數智技術為杠桿,撬動考試評價改革,賦能人才培養,成為推進教育數字化轉型、深化教育評價改革和促進教育高質量發展的“關鍵齒輪”。
數智時代考試評價改革可在評價理念、評價工具、評價功能等方面實現系統性范式轉型。
從“統一標尺”向“多元融合”的評價理念轉型。技術快速迭代、產業形態重構和社會運行方式革新,要求人才具備技術素養和跨界復合能力、高階認知和創新能力、動態適應能力和人文價值判斷力等。標準化考試難以評估這些高階能力,因此要構建技術賦能、多元融合、動態反饋的新型多元評價體系,以適應未來社會對人才的要求。多元評價不是簡單增加考核形式,而是借助技術賦能的多元化工具,通過開展情境化表現評價、動態過程性評價和社會化參與評價等,使教育實現促進人的全面發展這一本質目標。
從“標準化量表”向“智能生態系統”的評價工具轉型。考試評價工具的數智化轉型是數智技術落地的核心載體,其演進路徑呈現出從單一工具向復合生態、從靜態測量向動態感知、從人工操作向智能協同的顯著特征。評價工具的轉向應包含三個層次:第一個層次是傳統評價工具的數智化升級,如深化人工智能在智能組卷系統和電子閱卷系統中的應用等。第二個層次是新型數智評價工具的突破,如研發自適應測評系統,構建“千人千卷”的個性化測評模式;探索虛擬現實測評場景,通過沉浸式任務解決評估學生的創新思維和實踐能力等。第三個層次是形成數智評價生態,借助數智技術推動考試評價與課程教學、教師考核深度銜接,建立覆蓋“教、學、評”全場景的數據采集網絡,形成可解釋、可追溯的智能評價算法體系,提升考試評價的科學性和系統性。
從“末端測量”向“過程賦能”的評價功能轉型。借助數智技術,推進多維素養建模、認知深度挖掘與情境化測評的深度融合,推動考試評價實現四大功能躍遷:一是突破傳統考試的“分數桎梏”,構建覆蓋價值觀、協作能力和批判性思維的立體化素養評估體系,借助自然語言處理、虛擬現實等技術生成動態“能力雷達圖”,實現對學生綜合能力的立體評估。二是依托認知診斷模型和學習行為追蹤,從“結果判定”轉向精準歸因和過程干預,定位學生思維盲區并推送個性化學習路徑,同時幫助教師實現精準教學。三是通過跨學科情境任務和真實問題模擬,檢驗學生在復雜場景中解決問題的能力,彌合考場與社會實踐間的鴻溝。四是基于大數據聚類分析和生涯關聯算法,從“統一標尺”轉向差異化成長導航,為個體提供多元發展適配方案。
數智技術為考試評價改革注入了創新活力,但技術賦能的同時也帶來了不可預測性和不可逆風險。因此,數智時代考試評價改革應辯證把握工具效能與教育規律、效率追求與教育公平、技術創新與制度供給三大關系的動態平衡,堅守教育本質。
始終把握工具效能與教育規律的辯證統一。智能技術賦能考試評價的核心在于數據資源的深度挖掘和科學應用,但不能將之窄化為精準計算的工程問題,而應始終服務于立德樹人根本任務。比如,利用算法模型解構知識能力圖譜時,需警惕“技術至上”對教育主體性的消解;智能系統替代教師進行診斷和反饋,可能導致教師主體性削弱。因此,教育工作者應具備技術敏感與人文定力的雙重自覺,構建“技術向善”的價值錨點,在技術研發時嵌入教育價值校準機制,在制度設計時構建風險預警響應系統,在文化認知中培育技術批判性思維,讓技術真正成為“點亮人”而非“定義人”的力量,實現從技術賦能走向教育增值。
始終把握效率提升與公平保障的動態平衡。教育公平是社會公平的重要基礎,數智技術雖然可以顯著提升評價效率,但若缺乏系統性制度設計,可能加劇資源分配失衡、算法偏見和數字鴻溝。要實現考試評價數智化改革的高效、公平,就要打好“技術+制度+文化”的組合拳。首先,在技術適配層,要以多模態終端支持系統開發跨平臺考試系統,使之像“變形金剛”那樣能適配各種設備,確保城鄉不同配置設備均可獲得標準化的交互體驗;要建立深度學習驅動的評卷糾偏機制,給智能評卷系統裝上“偏見過濾器”,防止算法因數據偏差產生不公平。其次,在制度保障層,實施“紙質—數字”雙軌并行機制,不讓跟不上技術腳步的孩子掉隊。再次,在文化認知層,實施數字素養培育工程,構建多元主體共治機制,建立數據共享但不泄密的聯防機制。
始終把握技術創新與制度供給的動態適配。數智化考試評價的健康發展,既需要保持技術創新的開拓性,又必須加強制度供給的前瞻性。例如,針對大規模教育數據采集與個人信息保護的制度沖突,需建立分級分類授權機制;針對評價模型可解釋性要求與技術復雜性的矛盾,應構建算法備案審查制度;針對落后于技術迭代速度的困境,需建立敏捷性制度響應機制等。在政策層面,推進“管辦評”分離改革,建立政府、學校、專業機構與家長協同治理的多元評價格局。如成立教育數據治理委員會,統籌政府、學校、專業機構、家長四方主體,建立數據確權、算法審計、倫理審查的協同機制。在標準層面,實施標準體系先行引領,教育部門應加快制定教育數據安全標準、算法倫理規范等制度。在機制層面,建立動態校準機制,通過人機協同、多方驗證確保評價的公平性和科學性,防范技術應用可能帶來的“算法偏見”等問題。通過建立技術標準與制度規范的雙向映射機制,構建風險可控的試錯容錯空間,確保技術賦能始終行駛在“教育規律”與“技術倫理”的雙軌之上,為改革提供持續動能。
(作者系福建省教育考試院科研與評價處副處長、副研究員。本文系2022年度福建省教育系統哲學社會科學研究項目[JDW22001]成果)
《中國教育報》2025年08月02日 第04版
工信部備案號:京ICP備05071141號
互聯網新聞信息服務許可證 10120170024
中國教育報刊社主辦 中國教育新聞網版權所有,未經書面授權禁止下載使用
Copyright@2000-2022 m.junhanjc.com All Rights Reserved.