Science in court

Wetenschap in rechte

Monday 3 November 2003 by Hildebrandt, Mireille

In this text I again explore the relationship between the inherently controversial nature of expert-knowledge and the judge that has to decide on the facts of a case. Briefly referring to the position of Marres and De Vries as to expertise and the sciences of public policy, I emphasise - also in reference to Jasanoff’s ’Science at the Bar’the importance of the role of the judge in giving voice to controversy and I reject the idea that judges should defer to scientists. In relation to specific cases I question the validity, reliance and relevance of statistical evidence.
Article published in a special issue of the Dutch Journal for the Judiciary on expertise in court

Provisional version, not for quotation. Do only refer to the final published version: Hildebrandt, M.,Wetenschap in rechte, TREMA 2005 (april): 187-196

Inleiding

Het is fascinerend de snelle veranderingen te bezien die zich voordoen in de verhouding tussen wetenschappers en juristen in het kader van individuele rechtszaken. In een boeiende analyse van de publieke dimensie van kennis, spreken Marres en De Vries over de inherent problematische positie van het begrip ’expertise’ en concluderen zij dat expertise aan het eind van de 20e eeuw een ’essentially contested concept’ is geworden. De vraag wie op grond waarvan expert is en welke de gevolgen zijn van die kwalificatie ligt open, en wordt feitelijk steeds opnieuw onderhandeld en/of gezaghebbend beantwoord. In deze bijdrage zal ik bepleiten dat de erkenning van de controversele aard van de kennis van experts een aantal schijnproblemen kan oplossen die een verlammende werking kunnen hebben op de verhouding rechter-expert. Zo veronderstelt de Catch 22 waar de rechter zich volgens Crombag en Van Kampen voor gesteld ziet, een onproblematische vorm van expertise en het is dan ook juist die vooronderstelling die het dilemma in het leven roept. Genoemde Catch 22 zou inhouden dat de rechter bij twijfel inzake feitelijke kwesties de hulp inroept van een expert, die kennelijk over kennis of ervaring beschikt waar het de rechter aan ontbreekt. Na advies van de deskundige is het echter weer aan de rechter de relevantie en betrouwbaarheid van de expertise te beoordelen en mee te nemen in haar eindoordeel. Aangezien zij de deskundige juist inhuurde omdat het haar aan de betreffende kennis en ervaring ontbrak, ziet zij zich voor een zogenaamde Catch 22 gesteld: om de betrouwbaarheid te beoordelen zou ze zelf deskundig moeten zijn op het betreffende gebied, maar als ze dat was had ze het advies niet nodig gehad.

Een dergelijke Catch 22 stelt de controversele aard van wetenschappelijk en andere vormen van professioneel weten helder in het licht. Zolang de kennis van de expert als onproblematisch wordt gezien, kan de representatie van de feiten aan haar worden overgelaten, waarna de rechter zijn oordeel velt. Pas als experts elkaar blijken tegen te spreken en de rechter dwingen zich met de inhoud van de controverse bezig te houden en zich daarin - met betrekking tot de voorliggende zaak - ook nog een gezaghebbend oordeel aan te meten, doemt een Catch 22 op. Als wij echter het uitgangspunt verlaten dat experten toegang hebben tot wat in de strafrechtelijke dogmatiek de materiele waarheid heet, kan de verhouding tussen rechter en expert op veel directere wijze worden geobserveerd en genormeerd.

Hieronder zal de verhouding tussen wetenschap(er) en recht(er) worden bezien vanuit de controverses die zich in de rechtszaal afspelen. Om te beginnen wordt kort aandacht besteed aan de voortzetting van de zogenaamde ’science wars’ in de rechtszaal, waarbij wetenschappers elkaar over en weer beschuldigen zich met scientisme dan wel pseudowetenschap bezig te houden. De vraag wordt gesteld of en in hoeverre een expert objectief, onafhankelijk en onpartijdig kan zijn en if so, wat we daar dan onder moeten verstaan. Het antwoord op die vraag leidt tot onderzoek naar de verhouding tussen (on)zekerheid van wetenschappelijke kennis en de betekenis van de rechtszekerheid. Vervolgens komt de onschuldpresumptie aan de orde als uitgangspunt voor de inschakeling van experts door de rechter in strafzaken, waarbij wordt voorgesteld het zoeken naar een materiele waarheid te relativeren althans te erkennen dat de door de rechter in zijn bewijsbeslissing vastgestelde materiele waarheid zo formeel en performatief is als maar zijn kan. In de afsluitende paragraaf wordt de probabilistische aard van bewijsvoering in strafzaken nog eens nader bekeken vanuit de opgedane inzichten in de verhouding tussen recht en wetenschap ’in court’.

Forensische wetenschappen en pseudowetenschap

In zijn geruchtmakende Galileo’s’ Revenge. Junk Science in the Court Room analyseert Peter Huber in 1991 de stand van de wetenschap in de Amerikaanse rechtszaal. Hij beschrijft hoe het leerstuk van de tort (onrechtmatige daad) zich binnen de common law ontwikkelde. Zoals gebruikelijk in de common law benadering traden algemene leerstukken veel minder op de voorgrond dan binnen het continentale recht. Tort law viel uiteen in specifieke torts die ge?nt waren op concrete gevallen die aan de rechter waren voorgelegd; het recht ontwikkelde zich van case to case zonder de continentale drang tot het formuleren van algemene regels waar liefst alle toekomstige gevallen ondergebracht kunnen worden. Het Engelse spreekwoord ’let’s cross our bridges when we get there’ comes to mind. In de jaren ’70 komt hier echter verandering in. Scherp samengevat door Guido Calabresi in zijn The Costs of Accidents: A Legal and Economic Analysis van 1970, begeeft de tort law zich met name in de VS in de richting van een aansprakelijkheidsrecht dat in de eerste plaats gericht is op het verplaatsen van kosten naar degene die de schade zo goedkoop mogelijk had kunnen voorkomen. De taak van de rechter lijkt vooral te bestaan uit het localiseren van deze cheapest cost avoider en de advocaten in het adversarial jury trial gaan zich dan ook richten op het aanwijzen van de tegenpartij als cheapest cost avoider. Dit alles verloopt over de band van de causaliteit: uit de veelheid van mogelijke oorzaken van een bepaalde vorm van schade moet de handeling (eventueel nagelaten handelingen) van de cheapest cost avoider worden uitgelicht zodat de geleden schade daaraan kan worden toegerekend. In dat civielrechtelijke kader is volgens Huber het circus van pseudo-experts de rechtszaal binnengetrokken die de jury wisten te overtuigen van de meest uitzinnige oorzaken van allerlei tragische vormen van schade, die echter volgens Huber vaak geen duidelijk vast te stellen oorzaak kenden of toch eerder in de risicosfeer van de eiser lagen (volgens Huber). Zijn betoog komt erop neer dat charlatans en kwakzalvers zich in rijen van zes bij de ingang van de rechtszaal opstelden om tegen adequate vergoeding door partijen te worden ingehuurd ter onderbouwing van dubieuze standpunten.

Huber’s aanval op junk science vindt een parallel in de strijd die in de wetenschapsfilosofie, -sociologie en -antropologie wordt uitgevochten. Het is interessant om nog eens goed te bekijken waar de controverse nu eigenlijk over gaat, nu ook in de Nederlandse discussie over de verhouding rechter-expert regelmatig geluiden kunnen worden vernomen als zouden bepaalde vormen van expertise niet mee mogen tellen omdat zij geen weerlegbare uitspraken zouden produceren. Ten aanzien van wetenschap kunnen drie posities worden onderscheiden. Ten eerste zij die een voorgegeven werkelijkheid veronderstellen die door het ontdekken van steeds meer en betere natuurwetten blootgelegd en onderworpen kan worden. Ten tweede zij die menen dat kennis over de werkelijkheid altijd bepaald wordt door sociale oorzaken en effecten en dus in essentie een sociale constructie is (waarmee niet gezegd is dat de werkelijkheid zelf een sociale constructie is). Ten derde zij die menen dat de tegenstelling tussen een voorgegeven te ontdekken werkelijkheid enerzijds en de sociale constructie van kennis over de werkelijkheid anderzijds een vruchteloze voortzetting is van achterhaald cartesiaans dualisme. Met name Bruno Latour bepleit een pragmatische positie, waarin het produceren van wetenschappelijke feiten - op grond van intensieve veldstudies - wordt beschreven als een interactie tussen mensen en niet-mensen die onder dwang van intersubjectieve toetsing constructen bouwen die als zodanig (als gen, als atoom, als scheikundig element) de experimentele situatie overleven. Feiten zoals bijvoorbeeld een DNA-profiel zijn geen exclusief sociale constructie, maar ook zeker geen onafhankelijke van de onderzoeker in de werkelijkheid terug te vinden verschijnselen. Het feit dat een feit gemaakt wordt (les faits sont faits) betekent dus niet dat feiten om het even hoe kunnen worden gefabriceerd (kwakzalvers vallen vroeg of laat door de mand), maar betekent wel dat feiten in zekere zin een voorlopig karakter houden - ook al maken ze op een bepaald moment deel uit van onze common sense.

Wetenschappers of andere experten hebben dus niet zonder meer een onbemiddelde toegang tot de enige echte werkelijkheid, en zij horen dan ook geen monopoliepositie te krijgen bij het representeren van de feiten. Dat neemt niet weg dat de expert in onze samenleving een bevoorrechte positie heeft voorzover hij direct of indirect betrokken is bij de constructie van wetenschappelijke of andere feiten die binnen professionele netwerken worden geproduceerd en vervolgens onze wereld bevolken. Ik denk hierbij niet alleen aan DNA-profielen (een typisch product van wetenschappers), maar evenzeer aan dactyloscopisch bewijs, handschrift analyse of geuridentificatie (die wetenschappelijk gezien nauwelijks zijn onderbouwd maar wel degelijk professionele kennis veronderstellen) en aan bijvoorbeeld resultaten van psychiatrisch onderzoek op basis van psychoanalytische inzichten (waarvan de wetenschappelijke status betwist is, maar die eveneens professionele kennis veronderstellen). Bij het inroepen van de hulp van een forensisch expert zal de rechter zich een oordeel moeten aanmeten omtrent de kwaliteit van de betreffende deskundige, diens methode en de uitvoering ervan. Dit roept de vraag op of er zoiets is als een onderscheid tussen good science en bad science, en welke criteria voor dat onderscheid (moeten) gelden. Zijn bijvoorbeeld de door het Amerikaanse Supreme Court in Daubert vastgestelde - en in de Nederlandse literatuur steeds weer aangehaalde - aandachtspunten noodzakelijk en voldoende om goede van slechte wetenschap te scheiden? Het gaat dan om de volgende vraagpunten:
1. is de onderliggende theorie, methodologie, techniek of redenering empirisch te testen en ook daadwerkelijk getest;
2. is de betreffende theorie of techniek onderworpen aan peer review en publicatie;
3. wat is de bekende of mogelijke foutmarge van de betreffende techniek;
4. zijn er standaarden waaraan de uitvoering van de techniek moet voldoen en zijn die in casus gevolgd;
5. passeert deze methode of techniek de test van algemene aanvaardbaarheid in het relevante wetenschapsdomein?

Misschien is het in dit verband verhelderend om pejoratieve termen als junk science of pseudowetenschap terzijde te laten en een onderscheid te maken tussen enerzijds wetenschap in het laboratorium, waaraan strenge methodologische eisen kunnen worden gesteld in het kader van experimenten die herhaalbare, intersubjectief toetsbare resultaten kunnen opleveren, en anderzijds wetenschap in het veld, waaraan om meerdere redenen andere eisen gesteld moeten worden. Daarmee ondervangen we direct ook de problematische onderscheiding tussen fundamenteel onderzoek en toegepaste wetenschap, een onderscheid dat wederom lijkt te veronderstellen dat fundamenteel onderzoek onbetwijfelbare resultaten oplevert (quod non) waarmee toegepaste wetenschap en technologie vervolgens aan de slag kunnen. Als we ons bepalen bij het onderscheid tussen onderzoek onder volledig te controleren laboratoriumomstandigheden en onderzoek in situaties die gekenmerkt worden door onvoorspelbare complexiteit, mag duidelijk zijn dat de eisen die Daubert stelt de forensische wetenschappen voor onoverkomelijke problemen zou stellen. De forensische wetenschapper verricht zijn onderzoek wellicht in labo, maar hij heeft niet de controle over (de beschikbaarheid van) het materiaal, noch kan hij enige invloed uitoefenen op de parameters van het gebeuren dat aanleiding is tot zijn onderzoek: het vermeende strafbare feit. Het is dan ook niet verwonderlijk dat het Supreme Court niet-wetenschappelijke expertise wel toelaat en wel op grond van de praktische kennis en ervaring van de deskundige (in casu een handschriftdeskundige, wiens kennis en ervaring werd vergeleken met die van een havenloods) .

De vraag naar goede en slechte wetenschap is daarmee echter nog niet beantwoord. De hierboven opgesomde Daubert-criteria zijn desondanks relevant. De eerste drie refereren aan de toetsbare betrouwbaarheid van de gebruikte methode, het vierde criterium verwijst naar de wijze waarop deze methode in casu is toegepast en het vijfde criterium ziet op de mate van consensus onder experts binnen het betreffende kennisdomein. Hieronder zullen ten aanzien van de toetsbare betrouwbaarheid van methoden van onderzoek een aantal noten gekraakt worden inzake de aard van probabilistisch bewijs, in het bijzonder de noodzaak om steeds opnieuw de relevantie van foutmarges in het oordeel te betrekken en bij iedere zaak te werken met relevante alternatieve hypotheses om te voorkomen dat alleen de incriminerende hypothese van het OM wordt geverificeerd. Zoals hierboven al opgemerkt werken veel experts echter om een veelheid van redenen niet met in kwantitatieve zin toetsbaar betrouwbare methodieken, in het bijzonder als het gaat om handschrift- en geuridentificaties en om onderzoeken naar de psychische gesteldheid van verdachten, daders of getuigen. Dit type deskundigheid vergroot enerzijds het belang van het vierde en vijfde critierium (is de binnen het professionele netwerk ontwikkelde methode zorgvuldig uitgevoerd en bestaat binnen dit netwerk overeenstemming over de validiteit en de betrouwbaarheid van de methode) . Anderzijds zal de rechter de niet met cijfers te beantwoorden vraagpunten van de eerste drie criteria in het voorhoofd moeten houden en zich moeten realiseren dat consensus binnen het professionele netwerk fout positieven en fout negatieven niet uitsluit. Het laatste criterium is echter in meedere opzichten, ook wanneer sprake is van toetsbare methodieken, van primordiaal belang. Het is namelijk heel goed mogelijk dat meerdere professionele en/of wetenschappelijke netwerken kennis produceren ten aanzien van een zelfde domein. Binnen de psychologie heerst bijvoorbeeld een scholenstrijd over de vraag of dissociatieve amnesie en dissociatieve identificatie een indicatie zijn van verdrongen traumatische ervaringen. Consultatie van een psycholoog uit de ene school zal aldus tot geheel andere bevindingen kunnen leiden dan consultatie uit een andere school. De verplichte dubbelrapportage uit art. 37 lid 2 en 37 lid 3 Sr zou dit probleem kunnen ondervangen, ware het niet dat gebruik is dat de aangewezen deskundigen hun rapportage in goed overleg vaststellen, dan wel samenwerken binnen het Pieter Baan Centrum. Anders dan sommige auteurs lijkt het mij niet zinvol om de andere school van pseudowetenschap dan wel scientisme te beschuldigen of te streven naar het buitensluiten van de ene of de andere vorm van bewijs. Interessanter is om dit soort scholenstrijd te erkennen en de verschillende vormen van weten inzake hetzelfde kennisdomein stem te geven binnen het proces(recht).

Schijnzekerheid en rechtszekerheid

Zelfs wetenschap levert geen onbemiddelde toegang tot een op onze waarneming afgestemde wereld. Voor zover expertise wordt ingeroepen om een gebeuren in het verleden te reconstrueren moet worden erkend dat daarin altijd speculatieve momenten zijn aan te wijzen (de aannames waarop statistische berekeningen of andersoortige inferenties zijn gebaseerd). Deze aannames hangen samen met het perspectief van de onderzoeker/waarnemer, dat nu eenmaal niet in de lucht hangt: er is - ook in de natuurwetenschappen - geen archimedisch punt, geen view from nowhere. Ook wetenschappelijke kennis is in die zin altijd onzekere kennis. Back to court rijst de vraagt wat dan nog de betekenis kan zijn van begrippen als objectiviteit, onafhankelijkheid en onpartijdigheid. Hoe moeten wij art. 343 en 344 Sv verstaan die spreken van het ’gevoelen’ van de deskundige ’betreffende hetgeen zijne wetenschap hem leert omtrent datgene wat aan zijn oordeel onderworpen is’? Veronderstelt objectiviteit niet eo ipse objectivering, een birds-eye view, een onvindbaar archimedisch punt dat onbetwijfelbare kennis oplevert, hetgeen dus eigenlijk een illusie is?

Onbetwijfelbare kennis is ongetwijfeld een illusie, maar objectiviteit verwijst daar niet noodzakelijk naar. Integendeel zelfs, objectiviteit staat principieel open voor het betere argument. Het objectiveren van misschien voor de hand liggende zaken impliceert het cre?ren van afstand, het in eerste instantie opschorten van het oordeel en erkenning van het ’intrinsieke niet-finale karakter van het wetenschappelijk onderzoek, waarvan de resultaten per definitie een voorlopig karakter hebben en waarbij derhalve nooit geheel is uit te sluiten dat nieuw onderzoek tot gewijzigde inzichten kan leiden in ’oude zaken’ ’. Dat betekent in feite dat objectiviteit conceptueel verbonden is met onafhankelijkheid en onpartijdigheid: om uit te leggen wat wij onder objectiviteit verstaan hebben we begrippen als onafhankelijkheid en onpartijdigheid nodig. Ook absolute onafhankelijkheid is natuurlijk een illusie. Het Pieter Baan Centrum en het Nederlands Forensisch Instituut zijn in beginsel instituten waar in alle rust onafhankelijk onderzoek kan worden verricht ten behoeve van de strafrechtspleging. Men zou kunnen stellen dat die onafhankelijkheid - net als bij de rechter - gewaarborgd is doordat geselecteerde professionals hun expertise kunnen beoefenen, zonder dat enig persoonlijk, rechtspositioneel of commercieel belang de bevindingen kleurt. Met evenveel recht zou men kunnen stellen dat rechtspositionele zekerheid en/of het verzekerd zijn van onderzoeksopdrachten juist een grote mate van afhankelijkheid cre?ert ten aanzien van de opdrachtgevers en een risicoloze beoefening van het vak in de hand werken. De beschermde positie van dit type instituten kan gemakkelijk leiden tot een gerichtheid op verificatie die in feite neerkomt op partijdigheid. Juist als het gaat om de productie van kennis met vaak ingrijpend (rechts)gevolg is een veel kritischer houding gewenst, waarin het ontwikkelen en toetsen van alternatieve hypotheses deel uitmaakt van de professionele habitus van de expert - ook als de rechter daar niet om vraagt.

Objectiviteit, onafhankelijkheid en onpartijdigheid hangen dus intern samen en objectieve kennis is vooral niet-finale kennis. Objectiviteit levert geen waarheid op maar waarheidsaanspraken, die in laboratoria, veldonderzoek en/of andere professionele praktijken, peer-reviewed publicaties en congressen getest en getoetst worden aan de weerstandige werkelijkheid.

De rechter kan de vraag naar de feiten dus niet delegeren naar de wetenschap of andere vormen van expertise, die slechts voorlopige oordelen kunnen geven ten aanzien van aan hen voorgelegde vragen met - als het goed is - vermelding van de aannames die zij gebruikt hebben om tot hun bevindingen te komen. De taak van de rechter is niet om vast te stellen wat de waarheid is, maar wat - gezien alle omstandigheden en de op het spel staande belangen - de relevante feiten zijn. Dit oordeel is materieel in de zin dat het strafrecht een zo uitputtend mogelijk onderzoek vereist en dat consensus tussen vervolgende instantie en verdediging noch noodzakelijk noch voldoende is voor het intreden van strafrechtelijke rechtsgevolgen. Het oordeel is formeel in de zin dat het geen afbeelding van een voorgegeven werkelijkheid pretendeert, hetgeen een schijnzekerheid zou introduceren, maar integendeel in het volle besef van de onzekerheden op het vlak van de feiten deze feiten als zodanig vaststelt, met het oog op het min of meer ingrijpende karakter van de (rechts)gevolgen daarvan. In het kader van de rechtszekerheid (litis finiri oportet) be?indigt de rechter de onzekerheid inzake de feiten, zodat partijen en samenleving weer verder kunnen. Zoals Radbruch het zo mooi verwoordde toen hij het belang van de positiviteit van het recht benadrukte: ’wenn nicht festgestellt werden kann, was gerecht ist, so muss festgestetzt werden, was rechtens sein soll und zwar von einer Stelle, die, was sie festsetzt, auch durchzusetzen in der Lage ist’. De rechter kan een zekerheid cre?ren die de expert niet gegeven is en precies dat aspect van het rechterlijk oordeel stelt de fragiliteit van het oordeel over de feiten in het licht. Het is fragiel omdat de feiten door de rechter als zodanig gemaakt worden zonder dat dit impliceert dat de rechter dus maar om het even welke feiten zou kunnen maken.

De schijnzekerheid die ontstaat wanneer waarheidsaanspraken ten onrechte verkocht worden als waarheid moet vermeden worden, maar dit verlegt de nadruk van de controversele aard van expertise naar de verantwoordelijkheid van de rechter voor het vaststellen van de feiten in een situatie van onzekerheid. Dat die onzekerheid in veel gevallen maar heel klein is doet niets af aan deze verantwoordelijkheid, want ook geringe onzekerheden kunnen bij nader inzien aanleiding zijn tot grote controverses en wanneer dat het geval is kan nu juist niet bij voorbaat worden vastgesteld. Vari?rend op het gedachtegoed van de grondlegger van het Amerikaanse pragmatisme zou men kunnen stellen: ’we cannot doubt everything but we should doubt anything’, een in het Nederlands onvertaalbare stelling die de Scylla en Charibdis van absolute waarheidsaanspraken en radicaal relativisme met gemak omzeilt. De rechter vervult bij dit alles een cruciale taak. Door gezaghebbend vast te stellen welke representaties als feit worden toegelaten kunnen partijen en anderen hun handelen daar verder op afstemmen en is de samenleving verlost van de slepende vraag wat er nu echt gebeurd is.

Onschuldpresumptie en waarheidsvinding

Het oordeel inzake de feiten ligt dus bij de rechter en dit leidt niet tot een moeizaam dilemma maar lost een probleem op dat met de steeds controverseler inhoud en positie van expertise almaar prangerder wordt. Wil de rechter zijn gezag echter niet verliezen dan zal zij bij dit oordeel uiteraard niet willekeurig te werk kunnen gaan. Erkenning van de performatieve aard van het rechterlijk oordeel betekent niet - het zij herhaald - dat de rechter om het even hoe kan beslissen. Een eerste aanzet om het oordeel inzake de feiten goed voor te bereiden kan liggen in stringente procedurele voorschriften, die door middel van een grotere nadruk op adversarial evidence het controversele karakter van expertise in concreto stem kunnen geven. Daarmee bedoel ik niet dat expertise gedeconstrueerd moet worden als ware het ook maar een verhaal dat evengoed anders verteld kan worden. Het gaat erom dat andere verhalen ofwel alternatieve hypotheses de zwakke plekken van het verhaal van de vervolgende instantie belichten en/of de relevantie van de incriminerende hypotheses relativeren. Een voorbeeld van dat laatste is dat de match van schoenmaat 44, sportschoen van bekend merk, tussen spoor en schoenen in het bezit van verdachte weinig zegt zolang niet duidelijk hoe courant dit type schoen is, dan wel of anderen in de directe omgeving van het slachtoffer een zelfde schoen/maat hebben. De procedurele inkadering van de beslissing inzake de feiten is in common law stelsels veel meer ontwikkeld in verband met de eigen aard van het jury trial, en het is evident dat wij daar veel van zouden kunnen leren. Interessant is vooral dat de problematiek van de monopoliepositie van sommige experts (zoals het PBC en het NFI) beter niet ingeruild kan worden voor die van de partij-deskundige. De VS worden geplaagd door de bloei van commerci?le expertise die wordt ingehuurd op grond van de bereidheid in lijn met het partijstandpunt te verklaren, terwijl binnen een adversarial system expertise die het eigen standpunt weerlegt niet zal worden ingebracht. Sommige transatlatische schrijvers zien dan ook reikhalzend uit naar de benoeming van gerechtelijke deskundigen of onafhankelijke commissies die de rechter voorzien van ’objectieve’ adviezen. Dat daar dan weer monopolieposities mee worden gecre?erd die vragen inzake onafhankelijkheid oproepen mag duidelijk zijn. Het ei van Columbus ligt niet aan deze of gene zijde van de oceaan.

Waarheidsvinding veronderstelt een perspectief of gerichtheid. Het perspectief van de strafrechter bij de waarheidsvinding is niet de ontdekking van universele natuurwetten of mathematische zekerheden maar de mogelijke veroordeling en bestraffing van een verdachte. Het ingrijpende karakter van de straf vraagt om strenge eisen aan de waarheidsvinding, oftewel een zorgvuldig en prudent onderzoek. Het opgeven van de illusie dat dit onderzoek onfeilbare zekerheden kan opleveren versterkt de eis dat de rechter het voordeel van de twijfel aan de verdachte geeft en haar oordeel opschort ondanks de uit het dossier opdoemende waarheidsaanspraak inzake hetgeen zich in het verleden heeft afgespeeld of van hetgeen zich in de toekomst nog af zal spelen (criteria voor oplegging TBS). De onschuldpresumptie is er niet ten dienste van de waarheidsvinding maar omgekeerd: de waarheidsvinding in het strafproces staat in het perspectief van normhandhaving en onschuldpresumptie. Bij het vinden van de waarheid gaat het om de vaststelling of in casu een strafrechtelijk beschermde norm is geschonden. Op het moment dat de rechter specifieke waarheidsaanspraken ten aanzien van bewezenverklaring of toerekeningsvatbaarheid in haar oordeel al dan niet positiveert ’hangt’ de verdachte (of juist niet). Die cruciale bevoegdheid is haar gegeven met het oog op de handhaving van de onschuldpresumptie zonder welke normhandhaving een hachelijke zaak wordt.

Probabilistische aard van expertise

Op 23 januari 2002 schreef de voorzitter van de Royal Statistical Society een brief aan de Lord Chancellor waarin hij zijn zorg uitsprak over de wijze waarop in de zaak Sally Clark gebruik was gemaakt van deskundigenadvies. Sally Clark verloor kort na elkaar twee zeer jonge kinderen ten gevolge van wiegendood. Tijdens het proces waarin zij wegens moord op haar beide kinderen werd aangeklaagd, verklaarde een medische expert dat de kans dat zich in soortgelijke gevallen twee maal wiegendood voor zou doen 1 op de 73 miljoen was. De Royal Statistical Society (RSS) wijst er bij monde van de voorzitter op dat deze uitspraak niet door de beugel kan en dat de gevolgtrekkingen die het Court of Appeal vervolgens trekt eveneens ongeldig zijn. Het gaat er ten eerste om dat de kansberekening in casu gebaseerd was op onhoudbare aannames, in het bijzonder de aanname dat de beide gevallen onafhankelijk zijn, dus niet beide door dezelfde genetische of omgevingsfactoren worden be?vloed. Tweede punt is dat in dit soort gevallen gewerkt zou moeten worden met twee elkaar uitsluitende hypotheses om de relevantie van het ’toevalsargument’ te bepalen. Naast de waarschijnlijkheid dat de dood van beide kinderen door wiegendood is veroorzaakt moet de waarschijnlijkheid dat de dood van beide kinderen door verstikking (moord) is veroorzaakt worden onderzocht. De RSS wijst op de ’prosecutor’s fallacy’ die in dit type zaken het zicht op de relevantie van de berekende correlaties beneemt:
Aside from its invalidity, figures such as the 1 in 73 million are very easily misinterpreted. Some press reports at the time stated that this was the chance that the deaths of Sally Clark’s two children were accidental. This (mis-)interpretation is a serious error of logic known as the Prosecutor’s Fallacy. The jury needs to weigh up two competing explanations for the babies’ deaths: SIDS or murder. Two deaths by SIDS or two murders are each quite unlikely, but one has apparently happened in this case. What matters is the relative likelihood of the deaths under each explanation, not just how unlikely they are under one explanation (in this case SIDS, according to the evidence as presented).

Ten aanzien van wat Elffers het statistisch argument noemt zou ik in het licht van het voorgaande drie aandachtspunten naar voren willen brengen, die overigens in beginsel voor alle vormen van deskundigenadvies van cruciaal belang zijn. Ten eerste berusten de berekeningen waar het statistisch argument zich op baseert altijd op specifieke aannames, die empirische toetsing vragen die om pragmatische of andere redenen vaak niet tot de mogelijkheden behoort. Op zichzelf is dat geen probleem, maar die aannames bepalen in vergaande mate het resultaat: het argument staat of valt dus met het al dan niet aannemelijk zijn van deze aannames. In de zaak Bianca K. kwamen deskundigen tot kansen die varieerden tussen 1 op de 2.5 miljoen en 1 op de 50 miljoen. Het ging daarbij om de kans dat een bepaalde cr?cheleidster telkens weer in de buurt is als zich levensbedreigende ademhalingsmoeilijkheden voordoen, te kwalificeren als Apparent Life Threatening Event (ALTE). Hoewel gezegd kan worden de gevonden kansen beide tot de conclusie leiden dat het zeer onwaarschijnlijk is dat dit soort incidenten zich steeds weer in aanwezigheid van Biance K. voordeden, is het verschil toch wel van dien aard dat de vraag is wat kwantificering van de onwaarschijnlijkheid toevoegt aan de verdenking dat er een verband moet zijn tussen de aanwezigheid van Bianca K. en de betreffende incidenten. De verschillen gaan terug op verschillende methoden van onderzoek: statisticus Elffers van het Nederlands Studiecentrum Criminaliteit en Rechtshandhaving maakte een vergelijking met de aanwezigheid van andere verpleegsters op basis van dienstroosters, hoogleraar biostatistiek Zwinderman maakte een vergelijking met het voorkomen van ALTE’s in het algemeen, op basis van bestaand wetenschappelijk onderzoek naar de frequentie van ALTE’s in bepaalde populaties.

Ten tweede horen bij statistische bewerkingen van onderzoeksgegevens altijd foutmarges, die onder meer aangeven wat de kans is op een foute positieve dan wel een foute negatieve voorspelling. Broeders merkt in een voetnoot op dat er een tradeoff bestaat tussen het aantal foutpositieven en het aantal foutnegatieven, hetgeen strafrechtelijk gezien neerkomt op het feit dat wie de lat wat lager legt om aldus meer verdachten als dader te kunnen identificeren, waarschijnlijk niet alleen meer schuldigen veroordeelt maar ook meer onschuldigen. Bij de presentatie van DNA-identificaties worden dit soort mogelijke fouten inmiddels standaard meegenomen, maar in feite gelden foutmarges voor iedere vorm van identificatie. Ook als de bevindingen niet als zodanig worden gepresenteerd omdat geen gegevens bekend zijn over foutmarges of omdat het type onderzoek zich daar minder voor leent, zijn foutmarges aan de orde. In feite is het misleidend in termen van categorische identificatie te spreken of het nu gaat om sporenonderzoek, getuigenverklaringen of psychologisch onderzoek.

Als duidelijk is op grond van welke aannames de berekeningen zijn verricht en als een indicatie bestaat van foutpositieven en foutnegatieven komt het derde punt in zicht: wat betekent het resultaat nu eigenlijk in het licht van de voorliggende casus. Dat wil zeggen: wat is de validiteit van de berekening (zegt die iets over waar die iets over zou moeten zeggen) en wat is de relevantie ervan? De validiteit zal nauw samenhangen met de eerder genoemde aannames waarop de berekening berust. Als die aannames twijfelachtig en/of onvolledig zijn, zal de validiteit van de bevindingen even twijfelachtig zijn. Vermenigvuldiging van de kans op een wiegendood met de kans op een wiegendood is in casu geen valide methode als genetische of omgevingsfactoren de kans vergroten of verkleinen. De relevantie van de bevindingen hangt direct samen met het belang van het formuleren, onderzoeken, testen of doorrekenen van alternatieve - elkaar uitsluitende - hypotheses. De (on)waarschijnlijkheid van dubbele wiegendood binnen een gezin moet - volgens de RSS - worden vergeleken met de (on)waarschijnlijkheid van dubbele moord binnen een gezin. Op het moment dat men zich realiseert dat deze alternatieve hypothese de relevantie van de bevindingen kan belichten wordt de onwaarschijnlijkheid van de dubbele wiegendood al gerelativeerd. Twee punten zijn daarbij nog van belang. Ten eerste betekent het feit dat iets onwaarschijnlijk is niet dat het zich dus niet heeft voorgedaan. Dit lijkt een open deur maar open deuren staan vaak maar op een kier. Volgens de medisch expert die tot een kans van 1 op de 73 miljoen kwam, was de kans op wiegendood 1 op 8.543. Wiegendood is dus - gelukkig - zeer onwaarschijnlijk. Maar doet zich wel voor. Ten tweede is de absurditeit van het berekenen van de kans dat zich binnen een gezin een dubbele baby-moord voordoet niet noodzakelijk groter dan de absurditeit van het berekenen van om de kans dat zich binnen een gezin een dubbele wiegendood voordoet. De stap van het niveau waarop statistische berekeningen betekenis hebben naar individuele identificatie is altijd een sprong in het diepe. Voorts kan een statistische berekening nooit tot verklaring van een individueel verschijnsel leiden: statistiek verklaart niets, geeft alleen een indicatie van mogelijke verbanden.

Gezien deze overwegingen ten slotte aandacht voor de uitspraak van het hof in de zaak Bianca K. en de uitspraak van de rechtbank in de zaak Lucy de B. In beide gevallen worden deskundigen geconsulteerd die antwoord zouden moeten geven op de vraag of de aanwezigheid van verdachte bij een aantal incidenten door toeval verklaard kan worden. Zoals Elffers in zijn artikel in het NJB aangeeft, kan die vraag niet categorisch beantwoord worden. Het ware beter in dit verband niet van toeval te spreken, want toeval verklaart niets: het zou in dit geval alleen aangeven dat wij niet in staat zijn er achter te komen welke de oorzaak of de oorzaken is of zijn van de betreffende incidenten. Statistici kunnen antwoord geven op de vraag of en in welke mate de aanwezigheid van verdachte bij zoveel incidenten (on)waarschijnlijk is - gegeven specifieke aannames, meer mag van hen niet worden verwacht. Wel mag van hen worden verwacht dat zij de rechter voorzien van mogelijke alternatieve hypotheses indien de rechter daar zelf niet toe is gekomen, althans aangeven dat de relevantie van de onderzochte (on)waarschijnlijkheid pas kan blijken in vergelijking met die van alternatieve hypotheses.

Nadat de rechtbank in de zaak Lucy de B. in r.o. 11 heeft vastgesteld dat ’de uitkomsten van statistische berekeningen zoals verricht door dr. H. Elffers (..) op zichzelf beschouwd geen wettig en overtuigend bewijs voor dit laatste op [kunnen, mh] leveren’, vervolgt zij in r.o. 12 ten aanzien van de vraag of statistisch bewijs mee kan werken bij de bewijsvoering: ’Daartoe is echter wel vereist dat, cumulatief, aan een aantal nadere voorwaarden is voldaan. Allereerst zal buiten redelijke twijfel moeten zijn dat voor het statistische verband tussen verdachte en de in de telastlegging genoemde ernstige incidenten, geen alternatieve verklaring bestaat. Voorts zal in elke individuele zaak tevens buiten redelijke twijfel moeten zijn dat het ernstige incident bij de betreffende pati?nt niet verklaard kan worden door een buiten verdachte gelegen medische oorzaak. Bovendien zullen er in elke individuele zaak ook concrete andere bewijsmiddelen voorhanden moeten zijn die wijzen op een causaal verband tussen verdachte en het zich voordoen van ernstige incidenten’. Ten aanzien van een deel van de incidenten komt de rechtbank na uitgebreide bespreking van de medische expertise tot bewezenverklaring (vier gevallen van moord en drie pogingen daartoe) en tot de oplegging van een levenslange gevangenisstraf.

In de zaak Bianca K. overweegt het hof aan het slot van r.o. 5: ’Willen de uitkomsten van de statistische berekeningen als onderhavige - gelet op de daarbij gebruikte aannames - in casu bijdragen tot de bewijsvoering, dan is daartoe vereist dat buiten redelijke twijfel zal moeten zijn dat voor het statistische verband tussen verdachte en de op de telastlegging genoemde incidenten, geen alternatieve verklaring bestaat (a). Voorts zal in elke individuele zaak tevens buiten redelijke twijfel moeten zijn dat het ernstige incident bij het betreffende kind niet verklaard kan worden door een buiten verdachte gelegen medische oorzaak (b). Daarnaast zullen er in elke individuele zaak ook concrete andere bewijsmiddelen voorhanden moeten zijn die wijzen op een causaal verband tussen het handelen en/of nalaten van verdachte en het zich voordoen van de incidenten (c)’. Het hof concludeert uiteindelijk dat in casu een medische verklaring voor de betreffende incidenten niet kan worden uitgesloten en meent dat om die reden niet is voldaan aan hetgeen onder (b) is gesteld. Op grond daarvan moeten de statistische berekeningen volgens het hof buiten beschouwing worden gelaten. Omdat overigens geen wettig bewijsmiddel is gevonden dat causaal verband vestigt, spreekt het hof de verdachte vervolgens vrij.

Rechtbank Den Haag en Hof Amsterdam zitten evident op dezelfde lijn ten aanzien van de verhouding tussen het statistisch argument en overig bewijsmateriaal. De nadere precisering - ik volg het hof - is om meerdere redenen interessant: ten eerste suggereert de formulering onder (a) dat een statistisch verband een verklaring zou zijn, die weerlegd zou kunnen worden door een alternatieve verklaring. Dit is - ook volgens het hof - evident niet het geval: een statistisch verband verklaart helemaal niets en om die reden spreken wij dan ook van ’toeval’ als verklaringen voor het verband ons niet bekend zijn. Zoals hierboven al opgemerkt bestaat toeval wetenschappelijk gezien natuurlijk niet, althans niet in die zin dat zich hier gebeurtenissen voordoen zonder oorzaak. Tweede interessante punt is dat het hof meent dat ten aanzien van ieder individueel incident uitgesloten moet worden (buiten redelijke twijfel moet zijn) dat er een buiten de verdachte gelegen medische oorzaak is (b). De bewijslast ligt hier duidelijk niet bij de verdachte: het is niet zo dat een combinatie van statistisch verband en het niet bekend zijn van een medische oorzaak tot bewezenverklaring zou kunnen leiden. Integendeel, het hof stelt vast dat zolang die medische oorzaak niet kan worden uitgesloten het statistisch argument niet aan de orde is. Derde punt is dat het hof vaststelt dat statistisch bewijs uitsluitend als aanvullend bewijs kan gelden, hetgeen nog eens bevestigt dat statistisch verband nog niets zegt over een eventueel causaal verband dat dan ook op andere gronden zal moeten worden vastgesteld.

Statistisch ’bewijs’ (in de zin van proof, bewezen hebben) is kortom eigenlijk een contradictio in terminus: de stap van kansberekening naar identificatie zou eo ipse een spagaat opleveren doordat zekerheid gesuggereerd zou worden waar waarschijnlijkheid aan de orde is. Nu zou daar op grond van het voorgaande tegen in kunnen worden gebracht dat bewijs - in de zin van evidence - sowieso onzeker is en dat waarheidsaanspraken nooit voorbij waarschijnlijkheid kunnen reiken. De vaststelling van de bewezenverklaring, de overgang van evidence naar proof, van bewijsmiddelen naar bewezenverklaring, van vermoeden van schuld naar vaststelling van schuld, die overgang is evenals het rechtsoordeel een sprong, een (taal)handeling waarbij iets wordt vastgesteld dat nooit helemaal logisch of inductief kan worden afgeleid. Het statistisch argument zou dan niet wezenlijk verschillen van andere bewijsmiddelen, afgezien van het feit dat de waarschijnlijkheid hier wordt gekwantificeerd. Dit lijkt mij enerzijds een juiste conclusie, die - zoals hierboven al aangegeven - tot prudentie noopt in verband met het belang van de onschuldpresumptie. Anderzijds mag niet worden onderschat dat de kwantificering van waarschijnlijkheidsoordelen een stelligheid suggereert die in strijd is met de eigen aard van de statistiek. Voor een statisticus is dat geen probleem want die weet precies waar haar getallen wel en niet naar verwijzen, maar voor burger en jurist ligt dat toch anders.

Kranten kopten daags na het vonnis inzake Lucy de B. dat zij is veroordeeld ’na kansberekening’ of dat zij ’vooral de statistieken tegen zich heeft’. Hoe zorgvuldig rechtbank en hof in deze gevallen de validiteit, betrouwbaarheid en relevantie van het statistisch argument ook hebben afgewogen, men kan zich de vraag stellen of het verlenen van dit type opdrachten aan experts iets toevoegt aan de oplossing van de zaak. Zou het niet verstandiger zijn onderzoeksopdrachten te verlenen inzake forensische expertise die een (belastende dan wel ontlastende) verklaring kan bieden voor wat zich heeft afgespeeld?

Afsluitend

Niet alleen in de beleidswetenschappen maar ook en juist in het kader van individuele rechtszaken is expertise een inherent controversele vorm van kennis. Precies het feit dat de expert op basis van haar professionele praktijk kennis produceert die niet zomaar toegankelijk is voor leken stelt de rechter voor het onoverzichtelijke probleem hoe te beslissen inzake de feiten. Het probleem is onoverzichtelijk omdat de kennis van de expert zowel binnen de eigen professie als tussen verschillende professies betwist kan worden. Bovendien maakt het feit dat een deskundigenadvies de facto niet wordt betwist de zaak er niet gemakkelijker op, omdat de rechter nu zelf zou moeten bedenken waar de betwistbare aannames liggen en hoe de relevantie van de bevindingen getoetst kan worden. Dat forensische expertise in omvang en complexiteit toeneemt mag niet vewonderen, gezien de dagelijkse toestroom van nieuwe feiten uit de hoek van wetenschappen en technologie. Genoemde onoverzichtelijkheid en de ermee samenhangende complexiteit van de feiten kunnen dan ook niet gereduceerd worden zonder mogelijk relevante verbanden over het hoofd te zien. In de opleiding van juristen (zowel aan de universiteit als binnen de beroepsopleidingen) is aandacht voor de controversele en tegelijk onmisbare kennis van experts hoogst noodzakelijk, wil de jurist zijn werk kunnen doen. Het inzicht dat de expert geen onbemiddelde toegang heeft tot een voorgegeven werkelijkheid plaatst de verhouding tussen expert en jurist intussen in een ander perspectief, hetgeen de taakverdeling tussen beiden verheldert en de kwaliteit van het oordeel inzake de feiten ten goede kan komen.