Grenzeloze Transparantie voor nrc.next, draft DREI
Het moet nog steeds korter, en vele commenters en Twitteraars suggereren om de eerste vier alinea's over Roosevelt in te korten naar 150. Zit wat in, maar vind het ergens ook erg zonde. Achja, kill your darlings. Over de inhoudelijke weergave ben ik steeds zekerder. Zit nog te twijfelen over de technische termen 'gestructureerde data', 'gestandaardiseerde data'. Nerds snappen dat, maar de rest van de nrc.next-lezers ook? Daarnaast zoek ik nog mooie voorbeelden voor in het kader. Uw commentaar is nog steeds welkom!
Toen Franklin Roosevelt in 1933 tot president gekozen werd, gingen de Verenigde Staten gebukt onder de grootse economische crisis die het land ooit gekend had. Ondernemers en bankiers hadden zich in de periode voorafgaand aan de crisis gedragen als een stel ongecontroleerde cowboys. Doordat er geen transparantie was over het handelen van de heren kon de overheid niet ingrijpen bij misstanden, en stortte de economie in elkaar. Schrijver Daniel Roth beschrijft in Wired magazine hoe Roosevelt een citaat las dat luidde: "Sunlight is said to be the best of disinfectants. Electric lights the most efficient policeman". De vers ingezworen president was geïnspireerd om een revolutionair wetsvoorstel te doen dat één belangrijk doel had: transparantie. Beursgenoteerde bedrijven en banken werden voor het eerst verplicht om gedetailleerde rapporten in te leveren die de financiële gezondheid en activiteiten van de onderneming moesten beschrijven. Deze data werd gecontroleerd door een instantie die de Securities and Exchange Commission zou gaan heten. Voor het eerst lag er een last op bankiers en grote bedrijven om de waarheid te vertellen.
Nog geen honderd jaar later zitten we weer in een financiële crisis, maar inmiddels is er geen gebrek aan data meer. Sterker nog, de SEC slaat nu elk jaar zo'n 15.000 jaarverslagen op die gemiddeld 1000 pagina's per stuk zijn. Tot voor kort was niet de hoeveelheid data het probleem, maar dat er geen enkele structuur in de 15 miljoen pagina's feiten en cijfers zat. Er worden geen vaste 'sleutels' gehanteerd bij het rapporteren: accountants gebruikten allen een meetmethode die hen op dat moment het beste uitkwam.
Waar data geen gestandaardiseerde labels heeft, kan niemand het vergelijken of interpreteren. En waar bedrijven en banken zich ongecontroleerd voelen, ontstaan schandalen die economieën doen klappen. Als iedereen één duidelijke standaard hanteert met betrekking tot data verandert alles.
Sindskort moeten banken en beursgenoteerde bedrijven in de Verenigde Staten hun cijfers op een gestandaardiseerde manier -- iedereen dezelfde meetmethoden -- aanleveren waardoor de SEC opeens in véél korter tijdsbestek grote hoeveelheden informatie kan vergelijken en verwerken. Maar niet alleen de overheid, ook journalisten, bloggers, burgers en andere zelf-verklaarde waakhonden kunnen door de hernieuwde transparantie opeens kritische vragen stellen die anders onbeantwoord zouden blijven. In een klap is het aantal ogen dat speurt naar onregelmatigheden in de boekhouding verveelvoudigd.
Dit truukje werkt echter niet alleen op de financiële markten. De Nederlandse overheid produceert jaarlijks duizelingwekkende hoeveelheden niet-persoonlijke data. Gegevens over het openbaar vervoer (welke tram rijdt waar?), gegevens over basisscholen (welke school presteert het beste?), gegevens over misdaad (welke buurt is het veiligst?); alles is kwantificeerbaar gemaakt om beleidsresultaten te kunnen meten. Maar wat de SEC ondervond in Amerika, ondervinden burgers en journalisten in Nederland: data is niet op basis van standaarden gestructureerd. Net als Amerikaanse bankiers schrijven Nederlandse ambtenaren ingewikkelde rapporten met verschillende meetmethoden, waardoor gegevens niet eenvoudig te interpreteren, te vergelijken of te hergebruiken is. Concreet betekent dat dat bijvoorbeeld een website-ontwikkelaar eerst moeilijk moet doen om de juiste data uit een rapport te vissen, vervolgens een sleutel moet verzinnen en dan pas de gegevens in een mooie grafiek kan gieten of op een Google Map kan plotten.
Daarnaast (semi)overheidsinstellingen lang niet alle rauwe meetresultaten gratis openbaar. Gegevens die iets zeggen over je directe leefomgeving worden achtergehouden. Actuele file-informatie van de KLPD, openbaar vervoerinformatie van 9292OV, weersmetingen van het KNMI, kaartmateriaal, vliegbewegingen, pandregistraties van het kadaster, gezondheidsgegevens, de rauwe data van het CBS, zelfs Nederlandse postcodes zijn niet vrij opvraagbaar, hooguit wanneer je bereid en in staat bent fors te betalen. Terwijl de gegevens tot stand zijn gekomen met belastinggeld.
In het buitenland houden overheden zich veel vaker aan open standaarden. Vooral Groot Britannië, Australië, de VS en IJsland zijn goed op weg. Een rondgang bij websitemakers levert talloze voorbeelden op van toepassingen die burgers en stichtingen gemaakt hebben met behulp van overheidsdata. Findtoilet.dk is een kaart van alle openbare toiletten in Denemarken gemaakt voor en door mensen met blaasproblemen, die eerder eigenlijk niet de stad in durfden omdat ze niet wisten waar ze met hoge nood terecht konden. Bij WhereDoesMyMoneyGo.org kunnen Britten in één oogopslag zien hoe hun regering hun belastinggeld uitgeeft. Sites voor Londen en Washington DC laten fietsers een veilige route kiezen op basis van ongeluk- en criminaliteitsdata.
Daarnaast is makkelijk vergelijkbare data een goudmijn voor journalisten. In Duitsland zijn Europese landbouwsubsidies doorzoekbaar gemaakt. Daardoor werd opeens duidelijk dat luchtvaartcateraar Skychefs en Nestle ook ontvangers waren. Ze kunnen speciale sites aanbieden waar ziekenhuizen, universiteiten of stemgedrag van Tweede Kamerfracties met elkaar vergeleken kunnen worden. Waar recent verkochte huizen op een Google Map geplot kunnen worden, gecombineerd met misdaadcijfers of andere gegevens.
Ondertussen zitten we in Nederland met het online handelsregister van de Kamer van Koophandel dat exact om 00:00 sluit -- dat leest u goed, de website sluit om middernacht. Reizigers met het openbaar vervoer moeten nog steeds hun reis boeken met het achterhaalde fossiel dat 9292ov.nl heet. En kan een websitemaker niet vrijelijk postcodes gebruiken om bezoekers de dichtstbijzijnde ziekenhuis of apotheek te laten vinden. Alleen al de absolute basisfunctionaliteit ontbreekt. In de hackersscene moeten jonge nerds allerlei toeren uithalen om bruikbare alternatieven te maken. De makers van openkvk.nl (slogan: "Ook 's nachts!") moesten het gegevensbestand van de KvK leegslurpen en de maker van de fijne Trein reisplanner voor iPhone heeft advocaten van de Nederlandse Spoorwegen op zijn dak.
Balkenende had acht jaar lang de mond vol over Nederland als innovatieland, maar de bestuurderscultuur is juist weer geslotener geworden. Vragen om informatie en het vrijelijk hergebruiken ervan wordt vaak weggezet als 'misbruik' van de Wet openbaarheid van bestuur, in plaats van een recht van de burger. Het is onbegrijpelijk dat politieke partijen hier niet meer werk van gemaakt hebben. Gestructureerde data is een cruciale grondstof van de kenniseconomie, en we zitten met z'n allen op een enorm onbenut reservoir aan gegevens waar we met als belastingbetalers al voor betaald hebben. Actief beschikbaar stellen van overheidsdata kan de kenniseconomie van Nederland een geweldige impuls geven.
Er moet zo snel mogelijk een centrale plek komen (data.overheid.nl bijvoorbeeld) waar alle overheden hun openbare datasets online kunnen aanleveren, en waar programmeurs kunnen zien welke al data openbaar gemaakt is. Overheden moeten alle data direct aanbieden, en het vervolgens zo goed mogelijk structureren voor vrijelijk hergebruik. Ambtenaren moeten niet gaan nadenken over doelgroepen en mogelijke toepassingen want echte innovatie komt altijd uit onverwachte hoek. Alle data moet online zodat ontwikkelaars en creatieve mensen er zelf mee aan de slag kunnen. Zij veranderen kale, ambtelijke data in rijke, zinvolle informatie.
Als deze faciliteiten er zijn is er al een flinke slag geleverd. Vervolgens is het zaak dat er een helder overheidsstandpunt komt met betrekking tot openbaarheid van gegevens. Nu zijn we afhankelijk van de grillen van individuele ambtenaren. Op dit moment zijn het Ministerie van OC&W en de gemeentes Rotterdam en Delft aardig bezig, maar er zijn nog genoeg lokale en landelijke overheden burgers zo ver mogelijk bij echte inhoud weg te houden en waar het maar kan informatie te maskeren. In veel gevallen krijgen bedenkers van zinvolle projecten te maken met juridisch gehakketak over gegevens die eigenlijk van ons allemaal zijn.
Rauwe, gestructureerde data is het begin. De ware uitdaging ligt bij websitemakers, journalisten, stichtingen en enthousiastelingen. Ik kan niet wachten totdat zij toepassingen voor de data kunnen verzinnen die burgers zelfredzamer maken, de economie stimuleren en journalisten in staat stellen haar rol als waakhond te kunnen spelen.
Aan dit artikel hebben vele Twitteraars meegewerkt, met extra dank aan Alper Çuğun, Brenno de Winter, Edial Dekker, Reinder Rustema en Ton Zijlstra.
Inzetje:
Mooie voorbeelden:
- OpenKvK.nl - een betere en completere zoekservice dan de KvK aanbiedt op het bij wet openbare Handelsregister. Bovendien gaat OpenKvK niet 's-nachts dicht, zoals de KvK site zelf.
- OpenCongres.org - alle facetten van het Amerikaanse Congres worden hier inzichtelijk gemaakt op alle mogelijke manieren
- data.worldbank.org - 2000 statistieken over financien, zaken, gezondheid, economische en maatschappelijke ontwikkeling van de Wereldbank.
