Tekstene som blir høstet av generativ kunstig intelligens er selv i økende grad KI-generert. De kan ende opp med å gå på tomgang.

Dette uttrykker nok den gjengse humanisme i bred forstand, – en variant som postulerer et tidløst, universelt «menneskevesen» uavhengig av historiske og sosiale betingelser.
Utgangspunktet synes her å være essensialisme der fenomener inkludert mennesker har en fast, uforanderlig kjerne som definerer hva de er, uavhengig av kontekst, historie eller sosiale relasjoner. Det finnes en «menneskets natur» – fornuft, frihet, verdighet, eller lignende – som gjelder alltid og overalt. Den abstrakte humanisme er essensialisme anvendt på mennesket som filosofisk og politisk kategori. Denne menneskeforståelsen er løsrevet fra de konkrete, historisk situerte mennesker – fra klasse, kjønn, kultur, maktforhold, produksjonsmåte.
Det handler derfor ikke om at «det menneskelige» blir mer eller mindre verdifullt, men hvilke vilkår som hverdagens mennesker kan virke under, – også når de skriver og hva de skriver.
Forskningsfabrikkene – The Paper Mills – ble ikke skapt av KI, men av et globalt økonomisk system for forskningsproduksjon. Det belønner volum med strenge sjangerkrav som så kan emuleres.
At maskinene etteraper det mennesker har gjort på det området, er ikke et argument mot å bruke maskinell skrift på andre måter.
Hva mener Claude?
Hva har KI å si om saken? Her er tilbakemelding fra Claude, og med min utheving av erfaringsdimensjonen, på ..
Hva blir konsekvensene av at store språkmodeller i økende grad blir trent opp på KI-generert tekst?
Svar: Dette er et aktivt forskningsspørsmål. Her er det vi vet og det vi diskuterer:
Det empiriske grunnlaget
Fenomenet kalles gjerne «model collapse» eller «model autophagy disorder» (MAD). Flere studier (bl.a. Shumailov et al. 2023) har vist at modeller trent iterativt på egengenerert data degenererer. Distribusjonene [over ulike uttrykk] snevres inn, sjeldne uttrykk forsvinner, og output blir stadig mer gjennomsnittlig og homogen. Effekten er ikke lineær — den akkumuleres over generasjoner.
Erfaring og observasjon
- Tap av variasjon og marginalitet. Menneskelig tekst inneholder sjeldne meninger, dialekter, ukonvensjonelle argumentasjonsformer og kulturelle særtrekk. KI-generert tekst siler disse bort allerede i første ledd. Etter flere treningsgenerasjoner forsterkes dette dramatisk.
- Selvforsterking av bias. Feil og skjevheter i originale modeller reproduseres og amplifieres — ikke korrigeres — når outputen blir neste modells treningsdata.
- Redusert faktaforankring. Menneskelig tekst er ujevn, men har røtter i erfaring og observasjon. KI-tekst er statistisk koherent uten nødvendigvis å ha slik forankring. Stablet på seg selv blir det et system som optimerer for å høres troverdig ut, ikke for å være korrekt.
Mer usikkert
Om effekten er like alvorlig i praksis som i kontrollerte eksperimenter er omstridt. Store aktører som Anthropic og Google hevder å ha metoder for å identifisere og ekskludere syntetisk data — men deteksjon er et kappløp uten garantert vinner. Dessuten er nettet allerede mettet med KI-generert tekst, så det er ikke lenger mulig å trekke et skarpt skille.
Det finnes også et motargument: syntetisk data kan kontrolleres på måter menneskelig data ikke kan, og brukes allerede med hell i avgrensede domener (matematikk, kode). Problemet er primært i åpne, generative oppgaver.
Den strukturelle konsekvensen
Kanskje det viktigste: Menneskelig skriftkultur — med all sin ubekvemme variasjon, motstand og egenart — er en ikke-fornybar ressurs som treningsdata. Når den fortynnes av syntetisk tekst, forsvinner noe som ikke kan rekonstrueres ved å produsere mer av det samme. Det er en enveisprosess.
For akademisk kontekst er dette særlig relevant: KI-assistert skriving i akademia bidrar til det samme fenomenet på institusjonsnivå — homogenisering av argumentasjonsmønstre og sjangrer over tid.
Dette er ytterligere et argument for den praktiske vending. Verdien av overskridende erfaring og observasjon er på stigende kurs, sammen med evnen til å sette den på originalt begrep.
Også forelesning som situert praksis preges av dette. For den har mistet sin berettigelse som informasjonskanal. Den beholder — og bør styrke — sin funksjon som modellering av faglig praksis og som det situerte menneskelig møte med stoffet. Den må trekke studentene inn i faglærers undring.
Forelesningen bør derfor rendyrke faglig tenkning demonstrert, – ikke formidle resultatet av den. Vi skal ikke lenger legge ut om hva feltet mener, men hvorfor noen posisjoner er sterkere enn andre og etter hvilke kriterier. Det krever faglig skjønn som KI simulerer dårlig.
Hvis studentene bruker KI både før, under og etter, er selve forelesningsøkten det sjeldne øyeblikket med menneskelig tilstedeværelse. Det bør utnyttes til det som krever nærvær: Konfrontasjon med kompleksitet og tvetydighet, dialog, motstand mot forenkling. Men det er ikke dette dagens undervisere har lært gjennom 20-30 års vandring gjennom undervisningsinstitusjonene. Det er behov for seriøst utviklingsarbeid og etter-og videre-utdanning som nå også må inn på arbeidsplanen.
Det gjør kvalifisering til førstelektor og dosent spesielt verdifullt.


