De alminnelige domstolene i Norge er organisert i tre instanser. Tingrettene er første instans. Det er til sammen 60 domstoler i første instans. Størrelse på tingrettene varierer ut fra befolkningsmengde i rettskretsen (kommunene som sogner til tingretten). Sorenskriver er dommeren som også er øverste administrative leder av domstolen. Organiseringen for øvrig varierer ut fra størrelse på tingrettene. Store og mellomstore tingretter har egne administrative ledere (administrasjonssjefer, avdelingsledere, o.l.). Bemanningen kan deles inn i dømmende årsverk (dommere) og administrative årsverk (saksbehandlere).
Tingrettene behandler både sivile og straffesaker. Sivile saker kan starte i forliksrådet, mens straffesaker starter alltid i tingretten (Domstoladministrasjonen u.å.).
En kan dele inn straffesaker i enedommersaker og meddomsrett. Enedommersaker krever ikke meddommere. Det er kun en fagdommer som avgjør saken. Varetektsfengsling er en slik sakstype.
Varetektsfengslinger er et av flere tvangsmidler som kan benyttes av påtalemyndigheten i straffeprosesslovens fjerde del når en person har begått kriminelle handlinger. Avgjørelsen tas i tingretten. Varetektsfengsling betyr at siktede i en sak fengsles i en kort periode før straffesaken mot vedkommende starter. Påtalemyndigheten må argumentere for at det er mer sannsynlig at siktede har begått lovbruddet enn det motsatte. Og i tillegg må en av følgende grunner være tilstede: fare for at siktede rømmer og ikke møter til rettssaken, fare for at siktede ødelegger bevis (for eksempel ved å kontakte og påvirke vitner, truer vitner eller tilpasser sin forklaring til andres forklaringer), sterk fare for gjentakelse av straffbare handlinger eller siktede selv ber om å bli varetektsfengslet (Domstoladministrasjonen u.å.). Disse er de såkalte spesielle vilkårene for varetektsfengsling vi finner i straffeprosessloven § 171.
Varetektsfengslinger behandles i dag i tingrettene ved hjelp av papir-dokumenter, elektroniske dokumenter og saksbehandlingssystemet LOVISA.
Domstolene har siden 2016-2017 satt fart på digitaliseringen. I januar 2017 ble prosjektet Digitale domstoler opprettet. Prosjektet jobber med blant annet nytt teknisk utstyr, regelverksendringer som tillater bruk av ny teknologi og utvikling av ny saksbehandlingsløsning for elektronisk samarbeid i justissektoren i samarbeid med Politidirektoratet og Kriminalomsorgen. I styringsgruppen sitter representanter fra både domstolsadministrasjonen og domstolene.
Den første delen av digitaliseringen i domstolene har vært knyttet til teknisk utstyr (nye dommer-PC’er, teknisk løsning for store vedlegg, nytt PDF-verktøy, m.m.), regelverksendringer (ELSAM-forskriften, forskrift meddommerportalen, m.m.) og plattformer for brukerkontakt med de profesjonelle aktørene (Aktørportalen, meddommerportal) slik som advokater og meddommere (Domstoladministrasjonen 2017).
Bakgrunnen for denne satsningen på digitalisering er forankret i virksomhetens gjeldende strategi (Domstolene 2025), hvor særlig to av fire prioriterte områder er relevante. Det ene er «samsvar mellom ressurser og oppgaver», som brytes ned i flere innsatsområder. Hvor de det ene er «bedre ressursutnyttelse». Bakgrunnen for dette er den generelle kostnadseffektiviseringen i offentlig sektor med mer begrensede budsjettildelinger de siste årene. Det andre prioriterte området, «digitalt rettsliv» brytes ned i blant annet følgende innsatsområder: «digital rettsprosess og brukerkommunikasjon» og «økt fokus på bruk av ny teknologi» (Domstoladministrasjonen 2018).
Domstoladministrasjonen utarbeidet i februar 2018 en utredning om praktisk bruk av AI, VR og automatisk oversettelse i norske domstoler i samarbeid med Computas AS og Fagråd IKT (Domstoladministrasjon 2018). I utredningen skilles mellom tre områder for anvendelse av AI-teknologi i domstolene: det materielle området (selve avgjørelsen av saker), det prosessuelle området (hvordan saker behandles i prosesskjeden) og det teknisk-administrative området (effektiviserende tiltak som ikke direkte angår saksbehandling eller saksavgjørelser (Domstoladministrasjon 2018:13–14).
Beslutningsprosessen knyttet til å treffe avgjørelsen i forbindelsen med en varetektsfengsling og vurdering av de spesielle vilkårene i § 171 vil da være i det materielle området.
Utredningen gir noen forslag til anvendelsesområder, men utreder ikke nærmere det enkelte området. Så langt jeg har klart å undersøke ut fra empirien brukt i denne artikkelen, har det ikke blitt utredet eller satt i gang prosjekter om bruk av kunstig intelligens i forbindelse med avgjørelsen av saker.
Hvilke muligheter og begrensninger finnes i AI-basert beslutningsstøtte i forbindelse med vurderingen av de spesielle vilkårene for varetektsfengsling i straffeloven § 171 i norske domstoler i 1. instans?
I avsnitt 3 avgrenses fenomenet ytterligere ved at jeg beskriver den aktuelle arbeidsprosessen som kan digitaliseres/automatiseres, og dekomponerer beslutningene som må tas for å løse arbeidsprosessen. I avsnitt 4 går jeg gjennom noe relevant litteratur som belyser eksisterende kunnskap om automatisering av relevante beslutningsprosesser. I avsnitt 5 forklarer jeg kort hvordan jeg har gått frem i undersøkelsen (metode). I avsnitt 6 presenteres et løsningsforslag til redesignet beslutningsprosess etter automatisering. Artikkelen avsluttes i avsnitt 7 med en kort drøfting av temaet og forslag til videre undersøkelser.
Fenomenet avgrenses til å omfatte kun varetektsfengslinger etter straffeprosessloven § 171. Dette gjelder lovbrudd som kan gi høyere straff en 6 måneder, og utelukker fengslinger etter § 172 som gjelder lovbrudd som kan gi høyere straff enn 10 år. Jeg forutsetter også at siktede er over 18 år.
Behandling av spørsmål om varetektsfengsling i en tingrett starter med at politiet (påtalemyndighet) sender en begjæring om varetektsfengsling til tingretten. Denne overføres elektronisk, sammen med alle saksdokumentene fra politiet via respektive saksbehandlingssystemer. Saksbehandler forbereder saken ved å flette inn politiets opplysninger i tingrettens saksdokumenter. Dommeren setter deretter seg inn i saken, før fengslingsmøtet gjennomføres. I fengslingsmøtet får politiadvokaten og forsvarer mulighet til å forklare seg og argumentere for hvorfor de mener vilkårene for varetektsfengsling er eller ikke er tilstede. Disse argumentasjonene utdyper saksdokumenter som er sendt inn på forhånd. Dommeren samler inn all denne informasjonen og trekker seg tilbake for å vurdere de ulike forholdene før han/hun treffer sin avgjørelse. Denne siste prosessen er en beslutningsprosess, og defineres som den aktuelle arbeidsprosessen som kan digitaliseres/automatiseres i denne artikkelen.
Forholdene som dommeren må vurdere i beslutningsprosessen kan da illustreres i følgende beslutningstre:
I figuren illustrerer jeg prosessen med bare et av de fire mulige spesielle vilkårene i straffeloven § 171m nemlig gjentakelsesfare. Men beslutningstreet vil kunne brukes tilsvarende med resten av vilkårene. Her finner vi at det er fem nivåer av beslutninger som må tas, før en endelig avgjørelse om varetektsfengsling kan treffes. Med unntak av delvis den øverste (gir lovbruddet høyere straff enn 6 mnd?), krever den enkelte beslutning komplekse vurderinger av sammensatte forhold. Det vil si at det ikke fins enkle, entydige og fullstendig objektive kriterier som kan legges til grunn for beslutningene i praksis.
Utredningen som jeg omtalte innledningsvis peker på mulige anvendelsesområder for AI-teknologi i domstolene, og skiller mellom to kategorier: 1) ressurskrevende arbeidsoppgaver slik som blant annet beramming av rettsmøter, domskriving og håndtering av meddommere og tolker. Og 2) «radikal bruk av AI i domstolene». I denne siste kategorien pekes følgende områder ut: virtuelle rettsmøter, selvbetjening, prognostisering (prediktive algoritmer) og dommer-robot (Domstoladministrasjon 2018:15–19). De to siste anvendelsesområder er direkte relevante for temaet i denne artikkelen.
Dommer-robot begrenses i utredningen, av prinsipielle årsaker til «AI-basert dommerstøtte i form av en robot-utreder eller en dommer-assistent – Dette anser vi for å være noe mindre radikale anvendelser – snarere en effektivisering av dommerens arbeidssituasjon innenfor dagens organisering» (Domstoladministrasjon 2018:19).
Prognostisering (prediktive algoritmer) illustreres med et eksempel på vurdering som en dommer må gjøre i forbindelse med sitt arbeid. Nemlig å vurdere faren for at en person skal begå nye straffbare handlinger. Dette er et av de spesielle vilkårene som kan legges til grunn i begjæringer om varetektsfengsling. Og dermed direkte relevant for problemstillingen og avgrensningen i denne artikkelen.
Utredningen viser til et eksempel på AI-basert verktøy som har blitt benyttet av politiet i Durham (Storbritannia) – HART (Harm Assesment Tool) som klarer, ved hjelp av maskinlæring å predikere sannsynlighet for at en person begår nye straffbare handlinger. «HART benytter maskinlæring, og er trent på fem års tilfang av lokale erfaringsdata. Systemet kan med overraskende høy treffsikkerhet (dog uklart hvordan verifiseringen er utført) kategorisere nye tilfeller i tre risikogrupper: lav, middels og høy» (Domstoladministrasjon 2018:17). Høy risiko betyr at personen har sannsynlighet for å begå alvorlige kriminelle handler, slik de defineres i Durham politidistrikt i en tidsperiode på to år. Middels risiko betyr sannsynlighet for å begå mindre alvorlige (non-serious) kriminelle handlinger. Og lav risiko betyr at det ikke er sannsynlig at siktede skal begå kriminelle handlinger innen to år (Oswald mfl. 2018).
Maskin-læring-teknikken som benyttes kalles «random decision forests» som er et gren innen «ensemble learning». Det benyttes flere sett av læringsalgoritmer som gir bedre prediksjoner enn den enkelte algoritme hadde gitt hver for seg. Disse «beslutningstrærne» klassifiserer dataene og analyserer dem ved hjelp av regresjonsanalyser. Vilkårlige «decision forests» settes inn for å korrigere for algoritmenes tendens til å overtilpasse seg sine egne treningssett (Bergsaker 2018).
HART-modellen bruker omlag 104 000 hendelser om forvaring over en periode på 5 år (2008-2012). Og benytter 34 ulike prediktorer for å komme frem til en prediksjon. Disse prediktorer fokuserer på den siktedes historikk av kriminell atferd. Modellen bygges med 509 separate «klassifisserings- og regresjonstrær», som så kombineres til en fullstendig prediksjonsmodell. I grunn er hvert tre en egen prediksjonsmodell som gir en stemme (vote) av de totalt 509 stemmer. Stemmene telles, og prediksjonen med flest stemmer blir utfallet (output) i modellen (Oswald mfl. 2018). Validiteten av modellen har blitt testet og resultatene viser at en forutsetning for treffsikkerhet er bruk av samme type data som brukes for trening av algoritmene. Når en testet validiteten med et annerledes datasett falt treffsikkerheten fra 68,5 % til 62,8 % samlet. Men for høyrisikogruppen falt treffsikkerheten fra 72,6 % til hele 52, 7 % (Oswald mfl. 2018:229).
Jeg oppfatter beslutningsprosessen i forbindelse med avgjørelse av en varetektsfengsling som et sosialt fenomen som skjer i interaksjon mellom påtalemyndighet, forsvarer, siktede og tingrettsdommer. Fenomenet er også påvirket av organisatoriske og kulturelle rammer i en tingrett. Jeg legger derfor til grunn et sosialkonstruktivistisk syn på fenomenet jeg undersøker.
Jeg velger en abduktiv tilnærming til undersøkelsen fordi et slikt syn på sosiale fenomener egner seg godt for denne tilnærmingen. Jeg starter innsamlingen med åpent syn uten å avgrense fenomenet for mye. Og etter hvert som jeg undersøker og danner meg noen hypoteser, finer jeg nye kilder til empiri og undersøker videre (Blaikie 2010:19). Innsamling av empiri skjer ved hjelp av både observasjoner, intervjuer og dokumentanalyse. Alle intervjuede ga informert samtykke.
Jeg begynner med observasjon av saksbehandlingsprosessen i varetektsfengslinger i min daglige jobb i en tingrett. Dette gir meg bedre innsikt om hvordan beslutningsprosessen foregår og hjelper meg å gjøre noen avgrensninger. Jeg gjør deretter et første intervju med en strategisk respondent som kan fortelle meg mer om digitalisering i norske domstoler (Olsen 2020), for å skaffe meg mer kunnskap og noen ledetråder å utforske nærmere. Her får jeg blant annet informasjon om en utredning som forteller om aktuelle bruksområder for ny teknologi. Blant annet kunstig intelligens. I utredningen henvises det til et svært relevant AI-basert verktøy som benyttes i Storbritannia (HART – Harm Assessment Risk Tool). Dette gir meg en ny ledetråd å undersøke nærmere, og leder meg til ytterligere litteratur om fenomenet. Det gir meg også nye arbeidshypoteser, slik som at beslutningsprosessen
en tingrettsdommer utfører i forbindelse med en fengsling ikke er annerledes enn hvilken som helst beslutningsprosess i kognitiv psykologi, og er dermed utsatt for kognitive «biases». Dette gjør at jeg bestemmer meg for å intervjue også en erfaren tingrettsdommer (strategisk utvalg).
Intervjuet gir meg flere nye datakilder, da jeg får høre at dommerne i norske domstoler har tilgang til et såkalt «Dommerhåndbok» som gir retningslinjer og anbefalinger om hvordan de kan behandle ulike sakstyper, slik som varetektsfengsling. I tillegg blir jeg tipset om et kompendium om varetektsfengslinger som er utarbeidet av en anerkjent høyesterettsdommer.
Jeg jobber selv i en tingrett og i den forbindelsen utfører jeg blant annet saksbehandling av varetektsfengslinger. Min subjektive oppfatning av hvordan beslutningsprosessen utføres, og den organisatoriske/kulturelle konteksten kan påvirke mine betraktninger i denne artikkelen. Det er ikke sikkert at fenomenet dette notatet studerer skjer på samme måten i andre tingretter, som er av forskjellig størrelse i andre byer og hvor det jobber andre mennesker.
Antall intervjuobjekter er svært begrenset. Dette vil kunne åpne for at beskrivelsen av beslutningsprosessen ikke har overføringsverdi utenom den aktuelle tingretten. I tillegg, har jeg selv en arbeidsrelatert relasjon til de intervjuede, noe som kan forsterke forskningseffekten i svarene.
Med bakgrunn i eksisterende litteratur og erfaringene fra politiet i Durham kan en tenke seg å foreslå en delautomatisering av beslutningsprosessen i tilknytning til vurdering av det ene fengslingsvilkåret som gjøres av dommeren i varetektsfengslinger. Nemlig det steget som handler om å risikovurdere gjentakelsesfaren i beslutningstreet (merket i blå i figuren under).
Dette steget i beslutningsprosessen er nøyaktig den samme vurderingen hvor HART-modellen benyttes i dag. Og en kan da tenke seg at den samme modellen kunne ha blitt benyttet i norske domstoler, men med noen tilpasninger. Ut fra resultatene i validitetstestene omtalt i avsnitt 4 må en forutsette at trening av algoritmene må baseres på lokale erfaringsdata fra rettskretsen i den enkelte domstol. I tillegg må skalaen benyttet i modellen tilpasses norsk rett, slik at alvorlighetsgraden av lovbruddene som kategoriserer risikoen samsvarer med definisjonene i Norge.
Den praktiske bruken av modellen kan en tenke seg skjer i det eksisterende saksbehandlingssystemet Lovisa, slik at dommeren fikk modellens utfall (lav – middels – høy risiko) i det aktuelle steget i saksflyten. På den måten ville dommeren kunne sammenstille modellen, saksdokumenter, påtale sin argumentasjon og forsvarer sin argumentasjon i sin vurdering av om det foreligger gjentakelsesfare for nye lovbrudd eller ikke.
Når det gjelder spørsmål om effektivisering av dommernes arbeidssituasjon, legger jeg til grunn produktivitetsbegrepet slik den defineres i statlig sektor. Produktivitet defineres som «sammenhengen mellom ressursbruken som settes inn målt i kroner eller volum og mengden av tjenesten som virksomheten leverer» (Direktoratet for økonomistyring 2013:7). Der skilles mellom kostnadseffektivitet og formålseffektivitet, der den første handler om besparelse av innsatsfaktorer, og den andre handler om å oppnå bedre bruker-/samfunnseffekter av tjenestene som produseres.
Kostnadsdriveren (innsatsfaktorer) i en domstol er årsverk og bygningsmasse.
En slik redesignet arbeidsprosess som foreslås i denne artikkelen vil kunne betraktes som et supplement til eksisterende kilder (saksdokumenter, påtale, forsvarer, m.m.) i dommerens vurdering av gjentakelsesfaren, og komme i tillegg til disse. Skulle slik automatisering føre til kostnadseffektivisering, må en da forutsette at tidsbesparelser for dommerarbeidet hadde blitt så pass store at de hadde klart å redusere behov for minimum et årsverk. Dommere har ikke regulert arbeidstid på samme måten som ordinære statsansatte, slik at de kan i praksis jobbe lengre dager der det er behov for det uten at det utløser større lønnskostnader for virksomheten. Dette forsterker kravet om at bruk av modellen må føre til store tidsbesparelser, før en kan se kostnadsreduksjoner.
Når det gjelder bruker- og samfunnseffekter kan en definere siktede som brukeren av domstolen i forbindelse med varetektsfengsling, der brukereffekten vil være knyttet til rettssikkerheten og at personen kan være trygg på at fengslingskjennelsen er riktig vurdert.
Samfunnseffekten kan umiddelbart knyttes til trygghet om at personer som utfører kriminelle handlinger etterforskes og dømmes ut fra grundige prosesser og i trygge rammer for seg selv og for tredje parter (for eksempel, fornærmede og vitner).
Den delen av bruk av AI-basert beslutningsstøtte som kan knyttes til bruker-/samfunnseffekter vil da være treffsikkerheten i modellen og i hvor stor grad dommeren bruker modellen som grunnlag for beslutning til ulempe for de tradisjonelle kildene og egen dømmekraft.
Mittelstadt et al. (i Oswald mfl. 2018:231–32) peker på fem etiske utfordringer ved bruk av algoritmer: «(1) inconclusive evidence leading to unjustified actions; (2) inscrutable evidence leading to opacity; (3) misguided evidence leading to bias; (4) unfair outcomes leading to discrimination; and (5) transformative effects leading to challenges for autonomy and informational privacy”. Og her kan vi tenke oss situasjoner hvor manglende treffsikkerhet i modellen kombinert med for mye tillitt til modellen kunne føre til at personer som ikke burde ha blitt varetektsfengslet blir det, eller at det skjer en eller annen form for diskriminering på grunn av skjevheter i modellen og/eller datasettet.
Noe som kan være interessant å belyse i videre undersøkelser, men som omfanget av denne artikkelen ikke tillater er forekomst av opphevelser av fengslingskjennelser i andre instans. Hensikten kan være å drøfte spørsmålet om treffsikkerhet av menneskelig beslutningstaking i forbindelse med varetektsfengslinger, sammenlignet med treffsikkerheten til den foreslåtte modellen. Menneskelig dømmekraft kunne i denne forbindelse belyses ut fra nevro- og/eller atferdsøkonomisk teori som behandler en rekke kognitive «biases» i forbindelse med beslutningstaking.
Referanser
Agrawal, Ajay, Joshua Gans, og Avi Goldfarb. 2018. Prediction Machines. The simple economics of artificial intelligence. Boston, Massachusetts: Harvard Business Review Press.
Bergsaker, Anne S. 2018.«Maskinlæring og anvendt dataanalyse», november 29, Universitetet i Oslo.
Blaikie, Norman. 2010. Designing social research. 2nd edition. Cambridge: Polity Press.
Direktoratet for økonomistyring. 2013. Bruk av informasjon om produktivitet i styringen – et praktisk eksempel fra SI.
Domstoladministrasjon. 2018. Praktisk bruk av AI, VR og automatisk Oversettelse i norske domstoler. 1/2018. Trondheim.
Domstoladministrasjonen. 2017. «www.digitaledomstoler.no». Digitale domstoler. Hentet 10. april 2020 (http://www.digitaledomstoler.no).
Domstoladministrasjonen. 2018. «Virksomhetsstrategi ‘Domstolene 2025’». Hentet 10. april 2020 (https://www.domstol.no/2025/).
Domstoladministrasjonen. u.å. «Varetektsfengsling». Norges domstoler. Hentet 1. april 2020a (https://www.domstol.no/straffesak/sakstyper/varetektsfengsling/).
Domstoladministrasjonen. u.å. «www.domstol.no». Norges domstoler. Hentet 15. mars 2020b.
Olsen, 2020. «Intervju med avdelingsdirektør Innovasjon og Domtolsutvikling i Domstolsadministrasjonen».
Oswald, Marion, Jamie Grace, Sheena Urwin, og Geoffrey C. Barnes. 2018. «Algorithmic risk assessment policing models: lessons from the Durham HART model and ‘Experimental’ proportionality». Information & Communications Technology Law 27(2):223–50.