Tanketråder fra en lektors hverdag: Sensuren 2009

søndag 21. juni 2009

Sensuren 2009

Nå er siste skoledag avsluttet og elevene har fått tilbake resultatene på sine eksamener. Mange ble nok skuffet, for en god del av våre elever gikk ned i forhold til standpunkt, ikke bare i norsk, men også i andre fag. At man går ned en karakter er sjelden dramatisk, siden en standpunktkarakter gjenspeiler en bredere kompetanse enn det en eksamensoppgave kan vise, slik Leif kommenterer. Men litt for mange av våre elever gikk ned to karakterer, enkelte til og med tre! Da må vi se nærmere på hvorfor. Jeg har tenkt mye på ulike forklaringsmodeller de siste par dagene:

1. Elevene var så utslitte etter en hard russetid at de ikke klarte å prestere optimalt på eksamen. Dette er etter min mening en altfor enkel forklaring, men det kan nok ikke utelukkes at noen ble underytere av for lite søvn, sykdom og annet i måneden før eksamen. Uansett grad av effekt gjorde nok ikke russefeiringen saken bedre for dem.

2. Vi har en altfor “snill” vurderingspraksis ved skolen vår. Elevene blir ikke godt nok forberedt på den harde virkeligheten der strengere eksterne sensorer finnes. Dette kan heller ikke utelukkes, og vi kommer til å se på vår vurderingspraksis til høsten. Neste årskull kan ikke vente seg mildere vurdering enn den som det kullet som gikk ut nå fikk. Men vi har selvsagt hele året gjennom forsøkt å forholde oss til kompetansemål og vurderingsveiledninger på en fornuftig måte slik vi er pålagt, og vi har hatt mange og grundige diskusjoner om hvordan karakterskalaen skal praktiseres. Rapporter fra flere andre skoler tyder på at vi ikke er de eneste som er overrasket over at resultatet ble såpass svakt på egen skole. Dette indikerer at det ikke bare kan være oss som har vurdert for “snilt” i så fall.

3. Oppgavene er ikke entydig nok formulert, og dermed har for mange elever bommet på oppgaven. Det har vært mange diskusjoner i blogosfæren og på Twitter den siste tiden om ordlyden i oppgavene til årets norskeksamen. Jeg vil særlig trekke frem Maritas innlegg om årets oppgaver. Diskusjonene viser om ikke annet at det er mange som gjerne ser en dreining mot andre typer oppgaver, og at mange, også sensorene, ønsker at oppgavene bør knyttes tydeligere til de samme kompetansemål og vurderingskriterier som elevene har forholdt seg til gjennom sin skolegang. Det er rimelig å forvente at en ny læreplan gjenspeiles tydeligere i eksamensform og vurderingskriterier. Ellers blir det bare gammel vin på nye flasker, og vi får mange lærere som enkelt kan fortsette sin gamle praksis uten å ta hensyn til endringene i K06 og i siste ende få rett i at det var like greit.

4. Sensuren er for subjektiv og uforutsigbar. Dette punktet henger sammen med det forrige. Det kan se ut til at det er en tendens i årets oppgjør til at enkelte fylker viser et større avvik enn andre. Da er det nærliggende å tenke at det kan ha sammenheng med at man i noen fylker har vurdert strengere, og at elevene straffes hardere noen steder for formelle feil og språkfeil, men også for å ikke holde seg pinlig nøyaktig til oppgitt sjanger. Hvis dette har skjedd er det veldig betenkelig. Vi må kunne stole på at sensuren er rettferdig. Hvis ikke blir eksamen rene lottotrekningen.

Skriveopplæringen de siste årene har dreid mot et økt fokus på sjanger. Elevene må greie å skille mellom novelle, fortelling, eventyr, essay, kåseri, artikkel osv. Dette er vel og bra i teorien, men i virkeligheten er det vel ikke slik at det eksisterer vanntette skott mellom mange av disse ulike teksttypene? Jeg tror mange norsklærere er usikre på hvor strengt de skal tolke sjangerkravene, og at de derfor velger å være på den sikre siden og vurderer tekstene strengt. En slik praksis synes jeg er urimelig. Elever med godt språk, et rimelig formuftig innhold og et noenlunde bra svar på oppgaven bør ikke få lavere enn middels vurdering dersom de har skrevet en tekst som blir en krysning mellom to sjangere. Autentiske tekster er jo ofte det, så hvorfor skal elever avkreves noe annet? Er det ikke autentiske skrivere vi ønsker at de skal bli? Jeg er skuffet over årets resultater, men nekter å ta hele ansvaret for at mine elever fikk litt dårligere karaktererer enn forventet. Konsekvensen av dette er at jeg til neste år må se med et enda mer kritisk blikk på egen praksis, og finne ut om jeg i enda større grad enn nå skal praktisere “teaching for the test” for å sikre elevene mine bedre eksamenskarakterer. Men gjør jeg det, da mener jeg at jeg helt fundamentalt har feilet. Det er ikke evnen til å reprodusere innhold og form som er den viktigste egenskapen å ta med seg inn i voksenlivet.

Foto: CC-lisensiert av Sergi’s blog på Flickr.

15 kommentarer:

Anonym sa...: Hm. Dette er en viktig diskusjon, og en diskusjon som må nå inn i direktoratet. Jeg var veldig fornøyd med at sensorene fikk to dagers opplæring i år, i stedet for bare en, men det er vel fremdeles slik at det er frivillig å stille opp på disse dagene. Det syns jeg er feil, det bør være obligatorisk å møte opp og få justert seg i forhold til andre. Sensorene er jo helt vanlige norsklærere, som har tatt innover seg ny læreplan og nye krav i ulik grad. Noen har sensurert sammenhengende i 20 år, andre er helt ferske. Det er ikke bare bare for en ny sensor som kommer i par med en svært erfaren. Dersom det da er store forskjeller, kan det lett bli at man møtes på midten - i beste fall. Å si at "Nei, jeg har rett, og du tar feil" i en slik situasjon, er vanskelig.

En annen side, som du kommenterer, er årets oppgaver. Jeg var spesielt skuffet over sidemålsoppgavene, som jeg mener til forveksling lignet friskrivingsoppgaver fra R-94. Da er det lett å vurdere som man har gjort.

Uansett: Direktoratet bør studere statistikkene nøye. Er det slik at elever i noen deler av landet har fått spesielt store sprik mellom standpunkt og eksamen, bør man i det minste ta noen stikkprøver, rett og slett vurdere noen av disse på nytt. Elevene konkurrerer om studieplasser, det må være minst mulig tilfeldig hva som står på vitnemålet.; 21. juni 2009 kl. 12:27
Leif Harboe sa...: Viktig diskusjon, som du har sett har jeg gått litt inn i egen materie, og gjort meg noen tanker om dette. Vi må, mener jeg, uten å skjele til eksamen, sette de karakterene vi mener er riktige, vel vitende om at det kan bli avvik. Det er jo ingen konkurranse i å "treffe" eller forutsi hva elevene måtte prestere på eksamen.
Diskusjonen som er viktig, vil være i forkant av et skoleår, å diskutere hva en har tenkt å sette karakterer på grunnlag av. Hva slags type skrivesituasjon, hva slags type tekster, hvilke læringsmål trekker en inn (digital kompetanse, kreativitet, sammensatte tekster, kildebruk, sjangerkompetanse, ortografi, bokmål/nynorsk osv osv.) Jeg håper vi kan få til en levende diskusjon på Del og bruk, om dette.; 21. juni 2009 kl. 14:27
Eirik sa...: Jeg gikk faktisk ned to karakterer på min franskeksamen, fra 6 til 4. Jeg har hørt et rykte om at snittet på tyskeksamen ligger rundt 2, men dette tror jeg skal tas med en klype urban legende-salt. Jeg hadde følelsen av at det kan ha vært subjektivitet som avgjorde det, og jeg vet ikke om sensoren hadde riktige forventninger til elevers nivå - men jeg skal ikke syte, og jeg skal innrømme at jeg forventet en så høy standpunktkarakter. Det er sikkert ikke bare en årsak... men jeg tviler på at noen av dem er russetiden. Folk har ikke bakrus i en måned ;-); 22. juni 2009 kl. 01:39
Ingunn sa...: @Margreta: Jeg er helt sikker på at det er en vanskelig jobb å være sensor, særlig så lenge oppgavene åpner for såpass subjektiv tolkning som her. Men det burde være mulig å komme frem til noen generelle tekstkriterier som er mulig å kommunisere både til lærere og elever, slik at ikke noen dømmer veldig hardt for innslag av feil som andre tar mye lettere på. Jeg håper Udir tar den jobben til neste år. Jeg vil ha oppgaver med kompetansemål og mer konkrete vureringskriterier.

@Leif: Ja, det så jeg, og jeg er enig i at det ikke kan bli et mål å matche standpunktkarakteren epå ekamen. enkelte lærere mener det, og at eksamenskarakterene skal være med og justere egen vurderingspraksis. Vi får ta opp debatten på d&b når ferien er over og se hva som komer ut av det. Men mange er ikke på d&b, så jeg håper at det kan bli en større debatt som inkluderer Udir også.

@Eirik: Det var dumt med eksamenen din. Jeg er enig i at det neppe er bare en årsak. Kanskje vi på Sandvika vurderer elevenes kompetanse litt annerledes enn på andre skoler, på godt og vondt. Jeg synes uansett at vi har mange flinke elever! Nei, bakrus i en måned har ingen, men noen blir så syke at det tar tid å komme seg. Og norskeksamen er bare noen dager etter at russetiden er over.; 22. juni 2009 kl. 07:07
Marita sa...: Sensuren gikk ganske bra på vår skole, det var ikke så store sprik, men jeg snakket med en kollega ved min tidligere skole - og de hadde opplevd det samme som dere. Det rare er jo at jeg har hatt en Vg3-klasse i år, og jeg har hatt den ene Vg3-klassen som gikk ut i år på min forrige skole. Den ene klassen opplever store sprik, den andre ikke. Det kan selvsagt være tilfeldig, men likevel, det burde jo ikke være så store sprik. Dette var flinke elever jeg var sikker på kom til å gjøre det bra. Og som Margreta sier - sensorskoleringen burde være obligatorisk, hvordan skal man ellers få til et vurderingsfellesskap som man snakker så varmt om? Og det burde i alle fall vært det i år med ny læreplan og det hele. Forstå det den som kan. Jeg synes også at Utdanningsdirektoratet har en egen evne til å bagatallisere alt, for eksempel ble det jo sendt ut i en e-post at det var en normalsituasjon at man kunne finne svar på en av eksamensoppgavene i læreboka.; 22. juni 2009 kl. 09:46
Martin Aa sa...: Som alltid svært spennende å lese her. Godt innlegg og gode kommentarer! Et par ting som slår meg fra mitt utenfra-perspektiv :

1) Har sansen for Leifs poeng. Er det egentlig et mål at standpunktkarakterer og eksamenskarakterer skal være like? Det er jo et stykke på vei ganske forskjellige ferdigheter som testes..

2) Er det en tendens til å overfortolke få tall når man diskuterer standpunkt/eksamen? En klasse elever til eksamen er et relativt lite utvalg, statistisk sett må man vel forvente variasjon uten at det nødvendigvis er en klar forklaring? Synes jeg stadig hører om at dårlige eksamensresultater fører til store endringer i undervisningsopplegg, kunne man oftere klappet hesten litt og sett på tendensen over flere kull?; 22. juni 2009 kl. 10:37
Anonym sa...: Det kunne ha vært interessant og sett litt på forskjellen på å sette en standpunktkarakter og å sette en eksamenskarakter. Jeg mener ikke med dette å si at sensorer i norsk skriftlig ikke er profesjonelle, men derimot at det ligger en del rammebetingelser her som kan være med å gi en del av den helhetlige forklaringen på spriket de fleste lærerne opplever. Det har vært fokus på elevene, men har ikke dette med selve også med vurderingssituasjonen å gjøre:

1. Å sette eksamenskarakter er anonymt. Det er ingen relasjon mellom de som vurderer og den som blir vurdert. Ingen navn. Påvirker dette karaktersettingen?

2. Sensor leser ofte 40 til 50 like oppgaver. Ofte vil den såkalte plankeoppgaven føre til mye reptisjon og muligens irritasjon hos sensor. Dette er noe ikke faglærer vil oppleve.

3. Sensor vurderer i par. Er det en mulighet for at det gir "høyere status" å ligge lavere, at de som vil gi høyere karakter. Den som ligger høyest blir bedt om å forklare hvorfor, ikke motsatt.

Jeg vet dette er muligens lirr spekulative tanker, men det det kan jo være med på å forklare hvorfor man i de fleste tilfeller opplever sprik mellom standpunkt og eksamenskarakter.; 22. juni 2009 kl. 11:22
Knut Michelsen sa...: Jeg har skrevet dette før på en del blogginnlegg; men det kan sikkert gjentas:

Normalt sprik mellom standpunkt og sentralgitt eksamen er rundt en halv karakter (ned). Lokalgitt går motsatt vei - en halv opp. Jeg ser ingen grunn til å sperre øynene opp over dette. Statistisk sentralbyrå har likevel kommentert at noen få skoler har systematisk avvik over år mellom interne og eksterne karakterer. Vi får ikke vite hvem dette er, men dette må være et oppdrag for skolemyndighetene å ta tak i.

Det samme gjelder selvfølgelig forholdet mellom russetiden og eksamenperioden. Den er overmoden for revisjon. Tafatte politikere og skolebyråkrater tør rett og slett ikke utfordre elevene og elevorganisasjonene her - virker det som. Men hva hindrer dem egentlig?

Og en strikt gjennomføringen fra skolenes side av sluttvurderingsprinsippet i vurderingsforskriften med vurdering av faglige måloppnåelse i alle fag i russetiden - konsekvent - ville nok ta luven av festløvene (noen vil nok likevel stå imot her).

Ellers er det kanskje litt overraskende at både Sandvika, Nesodden og Frogn vgs. - de ultimate IKT-skolene i Akershus, gjør det såpass middels på de offentlige skolestatistikkene (fullført og bestått). To av dem er også relativt nye og har hatt anledning til å finsikte lærere ved ansettelse.

På den annen side: Hadde sentralgitt eksamen målt digital kompetanse etter læreplanmålene, hadde vi nok antakelig sett andre resultater fra den kanten.

www.knutmichelsen.no; 23. juni 2009 kl. 02:20
Simon sa...: @Ingunn / lektorboye: Det er klart at punkt 2 har noe for seg. Vi ser f. eks. i juss at både vanlig folk og de med jussstudiet dommer strengere i anonyme tilfeller enn i sak med ansikt og navn. Noen skoler har systemer for bytting av rettebunker og andre fellestiltak som kan gjøre at standpunkt og eksamenskarakter ligner mer på hverandre. Hvorfor har ikke alle det? Hvorfor har ikke naboskoler vurderingsfelleskap?

@Martin / Leif: Hæ? Måler ikke eksamen og standpunkt det samme? Er ikke poenget med eksamen å måle oppnådd kompetanse etter læreplanmål? Og, som svar til Ingunn, ja: når det er avvik mellom standpunkt og eksamen så er det absolutt grunn til å lure på hvorfor. Akseptere vi avvik, så hvorfor har vi eksamen?

Standpunktkarakter settes i mange skoler av kun en lærer. Disse karakterene brukes da til å sortere søkere inn i universitetene og høgskolene. Personlig mener jeg at dette systemet er galt, men så lenge vi har det er det klart at vi må ha en kvalitetssikring. Forløpig er eksamen det vi har. Siden det ikke er gode mulighet for tilbakemelding fra sensorgruppene til lærerne og skolene, er dette klart et dårlig system.

En annen svakhet er at vi har ikke helt funnet gode eksamensformer når alle hjelpemidler kan taes med. Vi ser det veldig tydelig i årets engelskeksamen i Vg2: sjansen for at elever har med seg tekster som kan være direkte relevante som oppgavebesvarelser er nesten 100%. Løsningen er å sette krav til bestemte sjangre, forlange et bestemte utgangspunkt, kreve bruk av et bestemet sitat, osv. Elevene er overraskende dårlige til å følge oppskriftene og sensuren blir dermed vanskelig, i verste fall tilfeldig.

@Knut: Interessant at du tar fram disse 3 skolene. Jeg kjenner ikke nok til Frogn, men når det gjelder Nesodden, så lurer jeg på hva du legger i 'ultimat IKT-skole' Det har vært en del snakk i år om Nesoddens pedagogikk, og den virker ikke veldig..ja, vi tar det et annet sted. Når det gjelder det høye 'ikke bestått' tallet på Sandvika, så tror jeg ikke eksamensordning har mye å si. Det er heller det lave statuset Helse og Sosial har (spesielt i Bærum) og samfunnets (og skolemyndighetenes) tendens til å 'dumpe' svake og umotiverte elever i linjer med lav prestisje.

@Ingunn: Jeg har nettop snakket med en lærer på vår skole som sa at hun ikke opplevde noe avvik mellom standpunkt og eksamenskarakter. Hun sa at hun hadde drevet med eksamenstrening hele året, men da blir det et spørsmål om hva det er som skal styre undervisningen...; 25. juni 2009 kl. 14:28
Ingunn sa...: @Marita: Enig. Det virker veldig enkelt å skylde på "snille" lærere. Jeg har lest gjennom flere av de besvarelsene som fikk 4, og jeg lurer jo på hvor flink man egentlig må være for å få 5 i norsk når såpass gode besvarelser settes til middels måloppnåelse uten at det egentlig er åpenbare mangler noe sted.

@Martin: At det er ulike ferdigheter som testes må vi vel si både ja og nei til. Det er fullt mulig å basere hele hovedmålskarakteren på oppgaver av samme type som eksamen. Mange gjør det. Da bør det også være samsvar. Men har du gitt mange andre oppgavetyper kan det nok bli større avvik. Jeg er også enig i at vi ikke må overfortolke statistikken her, men en tendens er det vel for det, og den kan diskuteres.

@Lektorboye og Simon: Jeg tror helt klart at vurderingssituasjonen har mye med saken å gjøre. Det er nok en god ide å utvikle enda bedre vurderingssamarbeid, bytte bunker etc. Som regel er det nok en opplevelse av tidsnød som gjør at vi ikke gjennomfører dette. Det tar for mye tid å gå gjennom mange bunker sammen.

@Knut: Jeg er enig med Simon her - vi har ikke mange som stryker eller ikke fullfører hos oss generelt. De andre skolene vet jeg ikke nok om til å uttale meg om dem. Russetiden håper jeg at vi kan få flyttet på til alles beste, det blir virkelig utrivelig å skulle være spydspiss for en "vurderingsaksjon" av typen du skisserer. Men at den er problematisk er vi helt enige om.

@Simon: Jeg vet godt at mange lærere "teaches for the test". Jeg mener at dette i verste fall er mangelfull undervisning, og at det er mange kompetansemål vi lett kan hoppe bukk over - ustraffet - ved å tenke sånn. Dagens eksamenssystem ser likevel ut til å favorisere denne typen undervisning. Kanskje jeg bare vil for mye?; 25. juni 2009 kl. 15:22
Anonym sa...: Jeg er ikke så sikker på at dere skal være strengere neste år. Dine elever får nå et snitt av de to, for eksempel 5 i standpunkt og 3 til eksamen. Så lander de på en 4 i snitt, og da er det vel der landet ligger. Som du selv sier: Til standpunkt får vi evaluert en mye større bredde av elevenes norskfaglige kompetanse, - og det er vel også bra.; 27. juni 2009 kl. 19:14
Ingunn sa...: Hege: Jeg er enig. Det er gode begrunnelser bak de karakterene vi har gitt, og jeg tror ikke vi har vært mye for rause. Mange flere enn meg synes det har vært en veldig streng sensur i år, så det er heller om det debatten må stå etter min mening.; 27. juni 2009 kl. 20:44
Simon sa...: Ikke helt enig med dine replikk til Knut, Ingunn. Interessant at 'harde' tall kan tolkes så forskellig, jeg synes 'ikke bestått' tallene på Sandvika er veldig høye, på alle linjene. Men, som sagt, jeg tror ikke at eksamen har noe med dette å gjøre. Vurderingspraksis generelt har kanskje noe å si, ja, spesielt karaktersystemet.

Når det gjelder eksamen: Jeg får mange klager om for streng karaktersetting og jeg driller elevene på eksamensoppgavene, men hver vår, så blir det slakt en gang til. Noe må da være galt?; 27. juni 2009 kl. 23:20
Martin Aa sa...: Så mange spennende linjer i diskusjonen her!

Ser jeg glemte å svare deg over, Simon. Målet både med eksamen og standpunkt er vel absolutt likt : Å måle oppnådd kompetanse etter læreplanmål.

Både Ingunn og livetleker nevner at til standpunkt kan det være mange flere evalueringsmetoder med.

Ved alle evalueringsformer er det nok biferdigheter som blir målt i tillegg til kompetansen man egentlig vil måle?

Skriftlige eksamener favoriserer dem som skriver godt. Multiple choice dem med multiple choice-ferdigheter.

(Selv om man baserer hele hovedmåleksamenen på samme oppgaver som eksamen er det fortsatt forskjell på å skrive til faglærer som kjent mottaker og til en ukjent sensor. Å være god til å skrive mottakertilpassa basert på hva du vet din egen lærer legger vekt på blir da en biferdighet som gir uttelling på standpunkt, ikke til eksamen.); 28. juni 2009 kl. 13:24
Anonym sa...: Hei

Interessant å se en lærers egne refleksjoner rundt nettopp sensur, eksamen og karakterer. Skal lese andre innlegg også etterhvet som jeg får tid. Men jeg lurer også litt på hva du tenker om eksamen som helhet, nettopp det at en ikke entydig eksamensoppgave, hvilken form du er i på eksamenstidspunkt og bare det å tallfeste en oppgave er i praksis. Er det lett? Er det riktig?; 15. juli 2009 kl. 21:43