度量是指用數字描述壹個事件或特征;雖然評價包括測量,但它比測量更廣泛,因為評價包括對學生的知識、技能和能力進行取樣和觀察的各種方式。
課堂評價是教師選擇和創造的壹種評價方式,它有許多不同的形式——單元測驗、小論文、檔案袋、項目完成、動手操作、口頭報告等等。評估包括對學生的知識、技能和能力進行抽樣和觀察的各種方式。
根據功能或用途,評價主要包括形成性評價和終結性評價兩種形式。形成性評估發生在教學之前或教學期間。形成性評價的目的是指導教師規劃和改進教學,幫助學生提高學習。終結性評估發生在教學之後,目的是讓教師和學生知道任務完成的水平。形成性評價和終結性評價的主要區別在於對評價結果的不同使用方式。任何評估類型都可以用於形成性或總結性的目的。如果評價的目的是提高教學水平,幫助學生指導自己的學習,那麽評價就是形成性的;如果目的是評價最後的成績,評價就是最終的。
信度、效度和公正性是在評價過程中形成測驗和解釋結果時必須考慮的三個重要因素。
可靠性是指測試結果的壹致性。有些測試比其他測試更可靠,可以做出更穩定和壹致的估計。測量的標準誤差需要考慮誤差的可能性,這是測試可靠性的壹個指標。
效度指的是測試測量妳想要測量的東西的程度。測試中需要考慮的壹個關鍵點是根據測試結果做出決策和判斷的有效性。有效性的證據與內容、標準和結構有關。結構效度的範圍最廣,包括內容效度和效標效度。
評價應該是公正的。當測試中包含的材料對某些群體,如不同性別、不同社會經濟地位、不同種族、不同宗教信仰的學生具有冒犯性或不公平時,偏見就會出現。文化公平測試並沒有解決評價偏差的問題。
?第二節課堂測試評估
學習由壹定頻率的測試來支持,這些測試使用累積的問題來使學生能夠使用和整合相關知識。通過記住這些測試的目的,教師可以更好地設計這些測試或評估教科書的支持測試。
兩種傳統的測試形式是客觀測試和論文測試。客觀題包括選擇題、是非題、填空題、連環題、簡答題等。老師需要記住寫這些問題的規則。論述題的寫作需要精心策劃,同時要擬定評分標準,避免評分出現偏差。
?第三部分?真實課堂評估
真實性評估要求學生在現實生活中應用技能和能力。傳統測試的批評者認為,教師應該使用真實性測試和其他真實的測試程序。真實性測試要求學生完成與真實校外生活場景相關的任務和問題解決。
檔案袋和成就展示是真實性評價的兩種形式,兩者都強調在有意義的情境中實施與現實生活相關的任務。
真實性評價不能保證可靠性、有效性和公平性。使用標準是使評估更加可信和有效的壹種方式。
非正式評價是壹種不需要評分的評價方式。主要用來收集各種信息,幫助老師做決策。非正式評估包括學生的觀察和清單、問題和學生的自我評價。
?第四節?等級
不管老師怎麽評價學生,最後都需要給分。評分可以是常模參照,也可以是標準參照。在常模參考分數中,分數主要受參加該課程的其他學生的表現影響。壹種流行的常模參照評分系統是根據曲線分布進行評分,將學生的成績與平均成績水平相比較進行排名。標準參考分數基於學生對課程目標的掌握程度。標準的參考成績報告單通常描述每個學生在每個科目上的表現。
學生在學習過程中難免會遇到挫折和失敗。學生需要面對失敗的經歷,老師要給學生定高標準,鼓勵他們努力學習。如果能提供適當的反饋,偶爾的失敗會有積極的意義。
如果成績與有意義的學習聯系在壹起,也能激發學生的學習動機。作為老師,我們可以用分數來激勵學生學習,幫助他們進步。
第五節標準化測試
平均值(算術平均值)、中值(中間分數)和眾數(最頻繁分數)都是濃度趨勢的量度。標準差反映的是分數與平均值的離散程度。正態分布是鐘形曲線的頻率分布。中間聚集了很多分數,越往兩邊分布的分數越少。
標準化考試分數有幾種不同的類型:百分比等級表示多少人的分數等於或低於個人的分數;年級等值表示學生成績與某壹年級平均分的匹配程度;標準分數基於標準差。
目前測試中客觀存在的問題有哪些?
關於標準化考試的矛盾主要集中在以下幾個方面:考試的功能和解釋,過多地通過考試評價學校,對考試分數和對教師的考試的不當解釋。教師應該利用測試結果來改進教學。
高質量的教學和高質量的評價遵循同樣的原則,適用於所有學生。為了達到良好的教學和測試效果,教師應該意識到並回應學生的差異;制定明確的學習結果;使用前測和形成性評價來監控學生的進步;采用多樣化的教學方法,確保每個學生都能進步;確保學生知道終結性測試成功的標準;提供不同形式的考核,讓學生有機會無障礙地展示所學。
如果學生有相應的考試經驗或受過考試技巧解題能力的訓練,他們在標準化考試中的成績可能會有所提高。許多學生可以從如何準備和如何參加考試的直接教學中受益。它還可以幫助學生參與設計測試。很多同學在接受了全面的備考訓練後,考試成績都有所提高,尤其是在考試技巧與具體題型、學習內容、考試內容緊密相關的情況下。