Bruk av korpus
Språket tar aldri slutt, og det er alltid noe nytt å oppdage. Å lære et språk er som å dra på en spennende reise. Vi har et mål i sikte, men det finnes ulike måter å komme frem på. Og det kan alltid skje noe uventet, spesielt når vi tør å bruke omveier. Noen ganger er vi nødt til å stoppe for å se oss rundt eller finne den rette veien.
Kanskje støter vi på en kollokasjon eller et fast uttrykk vi ikke forstår, eller kanskje vi er usikre på hvilken preposisjon eller ord vi skal bruke i en bestemt kontekst. Og hva gjør vi da? Vi kan google eller slå opp ordet/uttrykket i ordboka, og det er nyttig og bra, men det er ikke alltid vi finner det vi er på jakt etter. Da kan det være fint å bruke korpus – spesielt for å se hvordan språket brukes i praksis.
Korpus er en strukturert database som inneholder tekster og er tilrettelagt for språkforskning. Det innebærer at tekstene i et korpus ofte er kategorisert etter sjanger, periode og/eller område, og ordene er tagget med ordklasser. Tagger er «merkelapper» som viser hvilken ordklasse ordene hører til. Mange korpuser har også et eget søkegrensesnitt som er godt egnet for språkforskning og språkstudier (jf. artikkel av Hilde Hasselgård).
Hvordan kan du som lærer bruke korpus i språkundervisningen? Jo, på samme måte som du bruker ordbøker og Google. Du søker på det du er ute etter, men resultatet er mye mer presist og nyansert og viser naturlig språkbruk.
Vil du f.eks. finne ut hvilken preposisjon som oftest kommer etter substantivet oppmerksomhet i bestemt form, er det på eller mot, eller kanskje noe annet? Dette finner vi svar på ved å søke i korpus.
La oss ta korpuset SketchEngine som eksempel. Her finner vi raskt ut at oppmerksomheten er brukt med preposisjon til sammen 20 267 ganger. Ca. en fjerdedel av alle eksemplene vi finner i dette korpuset, står med preposisjonen til, like mye som de brukes med preposisjonen mot (se skjermdump nedenfor). Andre preposisjoner er mindre frekvente, men fra, på, bort og rundt er også brukt i betydelig grad.
CQL [word=”oppmerksomheten”][tag=”prep”] ● 20,276
I tillegg kan du også søke og finne hvilke verb som fungerer som kjerne i bestemte fraser (se resultater lenger ned). Ved å søke etter frekvenser og eksempler i kontekst finner vi fort ut at vi fanger eller får oppmerksomheten til personer, og retter oppmerksomheten mot en sak. Slike oppdagelser er svært engasjerende, og plutselig har det gått et kvarter, og du befinner deg på en sti som du aldri tenkte å ta, men som har lært deg masse.
Andre spørsmål vi finne svar på med et korpussøk, kan for eksempel være:
Spørsmål: Kan jeg få en liste over alle adjektiv på norsk?
Svar: Vil du ha alle de 241,007,784 eksemplene?
Spørsmål: Hva kan vi være preget av?
Svar: Du kan være preget av stundens alvor, høyt tempo, krig og konflikt.
Spørsmål: Hva er de mest frekvente partikkelverbfrasene med ta som kjerneverb?
Svar: Ofte bruker vi kjerneverbet ta i frasene å ta en titt, å ta en tur og å ta en pause. Vi tar ofte kontakt med personer, og tar med oss barna/hunden/mat/familien eller kamera.
Med andre ord kan korpus brukes av alle for å søke opp konstruksjoner av forskjellige slag, blant annet hvis vi ønsker å finner ut
- hva enkelte ord/ordformer/fraser betyr i kontekst
- hvilke bøyningsformer de har
- hvor ofte disse er i bruk
Møte med språket → Undring → Lingvistisk omformulering → Korpus-vennlig søk
Konstruksjoner finnes overalt i språket, og søkemulighetene er uendelige. Man må bare øve seg på å undres, omformulere den generelle undringen til et lingvistisk spørsmål, og så kode om spørsmålet til noe vi kan søke opp i korpuset.
Eksempel 1
Oppdag partikkelverbet varme opp med Sketch Engine
Tenk deg at du som lærer snakker om matlaging og kommer over en oppskrift hvor det står varm opp oljen i panna. Du vil strekke på språket og spør elevene dine: «Hva kan vi egentlig varme opp?» Slike åpne spørsmål har imidlertid en tendens til å bli hengende i luften.
Du kan selvfølgelig bruke intuisjonen din og komme på eksempler selv. Det kan hende at du driver med sykkelsport og nettopp har drevet med å varme opp voks for å smøre kjedet på sykkelen din. (Veldig lurt, egentlig!) Selvsagt kommer du på dette først, og så begynner du med søk som varme opp voks sykkelkjede i Google for å få elevene til å henge med. Forhåpentligvis har elevene til slutt lært en del om hobbyen din, men har de lært seg uttrykket? Og er det egentlig lurt å trekke sære referanser inn i klasseromskontekst?
Prøv heller korpussøk. I Sketch Engine korpus blir dette spørsmålet omformulert til CQL (som står for corpus quiery language), slik:
[lemma=”varme”][word=”opp”][tag=”subst”]
Lemma | Grunnformen (oppslagsordet) vi bruker for å finne alle bøyningsformene. F.eks. står varme for alle formene av verbet varme, dvs. også varmer og varmet. |
Word | Den bøyde ordformen |
Tag | Ordklassen du er ute etter |
Topp! Nå har vi mange forskjellige eksempler som dekker flere typer brukssituasjoner.
Så hva gjør vi med denne informasjonen i fortsettelsen?
La oss starte med å prøve å finne noen generelle mønstre. For eksempel kan elevene legge merke til at vi både kan varme opp noe konkret som vannet/oljen/maten/melken. Så kan vi legge merke til at vi egentlig at vi varmer opp lufta i huset og vannet i bassenget når det står at vi varmer opp huset/boligen/lufta/bassenget. Dette er eksempler på bruk av metonymi i hverdagsspråket, altså når vi bruker en del av noe for å referere til helheten.
Utover den konkrete betydningen kan vi varme opp musklene, stemmen og kroppen, noe som har med selve kroppen å gjøre. I overført betydning kan vi varme opp publikum. Er denne betydningen knyttet mest til «bolig»-betydningen eller til «kroppen»? Hvordan kan vi tolke det å «varme opp publikum» ved å ta utgangspunkt i kroppen som metafor? Her kan vi la elevene fortsette reisen på egen hånd (les mer om metonymi og metaforer i språket i G. Lakoffs bok Hverdagslivets metaforer).
En annen måte du kan finne konstruksjoner i korpus på, er at du tar en tekst elevene dine skal jobbe med og finner eksempler på språkkonstruksjoner derfra (se eksempel i kapittel 1 konstruksjonsgrammatikk). Da kan du bruke søkeresultatene både for å illustrere bruk av konstruksjonen for elevene, og som eget faglig påfyll. Da har både du og elevene dine lært deg masse nytt.
Innlærere i norsk som andrespråk er avhengig av lærerens innputt for å kunne teste hypotesene sine om språket på en trygg og idiomatisk måte. Det er derfor viktig at læreren forbereder seg i forkant.
Du kan eventuelt forberede søkene i forkant eller la innlærerne selv bestemme hva de vil finne ut ved hjelp av korpus. Den siste metoden heter data driven learning som du kan lese mer om for engelskundervisning her.
Eksempel 2
Begynn en samtale om fest med Nasjonalbibliotekets N-gram
Tenk deg også at du begynner en samtale om fest, og du stiller kanskje spørsmålet «Hva betyr fest?» eller «Hva tenker dere på når dere tenker på ordet fest?». Med to korte svar begynner du å jobbe videre og kommer med egne assosiasjoner som forslag. Hvis du har sovet dårlig eller ikke er helt kjent med konseptet selv, kan denne innputten være nokså begrenset.
Søk heller opp ordet i Nasjonalbibliotekets N-gram, og trykk på Galakser som grafisk fremstilling. Du får et levende interaktivt univers med synonymer og kollokasjoner som kan brukes til å aktivere forkunnskaper hos elevene på en morsom og effektiv måte.
Du oppdager at fest kan være dans og jubel – og skjermbildet under viser en enkel kontekst for ordet jubel (som du får frem ved å dra musepekeren over ordet jubel):
Du kan fremheve antonymer hverdag og helligdag:
Korpussøk kan brukes både av lærere og elever. Så lenge man vet hvordan og hva man kan søke, er det mulig å oppdage språket på egen hånd eller ved hjelp av små oppgaver som læreren har forberedt på forhånd.
Oppsummering
Husk dette når du bruker korpus
- Bli kjent med korpustekstene.
- Ulike korpuser passer til ulike formål. Ulike perioder/sjangrer/områder kan påvirke søket. Du finner f.eks. ikke mange gode eksempler på muntlig tale i et korpus som består av akademiske tekster.
- Ingen korpuser er normative. Du finner ikke svar på hva som er «rett eller gal» språkbruk, bare hvor mye eller lite ulike ord og fraser er i bruk.
- Hvis noe ikke finnes i korpuset, betyr det ikke at det ikke finnes i språket. Dels endres språket fort, dels kan språkvariasjonen som du er ute etter, passe dårlig til sjangrene korpuset består av.
- Husk at undring og selvstendig utforskning er et gode!
Språket kan oppdages både selvstendig eller mediert. Når elevene arbeider med korpussøk på egen hånd, stiller elevene de riktige spørsmålene selv og øker den metaspråklige bevisstheten samtidig som de fremhever det komparative aspektet ved språklæring. Mediert korpusbruk innebærer at elevene løser oppgaver formulert av læreren. Et godt eksempel på dette er Threasure hunt-activity av Laura Janda basert på SmartTool.
Husk å begrense inntaket! Bestem deg for et mål om en «daglig dose» av oppdagelser (som i Constructicon av Laura Janda). Husk også å få med deg de små konklusjonene: bruk ta med-konseptet (som i take away). Formuler og ta med generaliseringene, konklusjonene og tankene du får mens du er på oppdagelsesferd.
Eksempler på oppdagelsesreiser
- Oppdagelser gjennomført på egen hånd
- Planlegg reisen. Hva lurer du på? Hvilke situasjoner har du bruk for frasene du er nysgjerrig på? Hvilke andre språk er det som kan belyse fenomenet kontrastivt?
- Formuler søket, gi den en kode, gjør søket ditt abstrakt. Bruk enkelt søk / CQL-søk i et korpus. Tenk på hvilket korpus som passer. Bruk ordbøker, ChatGPT, Wikipedia, eller få innspill fra andre. Kildene kan også kombineres!
- Søk på flere måter.
- Ta med konklusjonene videre.
- En mediert reise
- Få oppgave/reiseplan av læreren.
- Formuler søket, gi den en kode.
- Søk.
- Ta med konklusjonene videre.
Lykke til på reisen!