Ahti Connect – ‘Data & Zorg: het CBS als (ont)koppelpunt voor ontsluiting van zorgdata – binnen de regels van de privacy’
Op donderdag 8 oktober hebben wij onze eerste ahti Connect webinar gehouden. Deze stond in het teken van data & zorg en de rol die het CBS als (ont)koppelpunt hierin kan spelen.
De waarde van data én de prijs die we daarvoor betalen
Afgelopen jaren hebben we kunnen zien hoe ingrijpend data onze levens veranderd hebben. Dat heeft voordelen: Zo is ons leven gemakkelijker geworden en zijn veel services beschikbaar met een simpele klik. Al die services krijgen we “gratis”, maar in feite betalen we hiervoor met onze data. We zien de ongelooflijke waarde die data kunnen genereren, maar de prijs die we daarvoor betalen is niet altijd duidelijk. De twee zijden, van enerzijds een grote waarde, en anderzijds een hoge prijs, zien we ook terug in publieke markten. De waarde van deze data komt echter momenteel niet het publiek maar private partijen ten goede. Er is veel potentie om dit te optimaliseren. We zien veel initiatieven die hier aandacht aan besteden. Hoe dit op de beste manier is in te vullen, blijft een vraag. Deze ahti Connect richt zich op hoe het CBS hier een primaire rol in kan spelen, een structuur voor kan bieden en daardoor een perfect koppelpunt is. Een eerste stap hierin is het CBS als voorbeeld te nemen en te kijken op welke manier zij de data die zij genereren utiliseren en er waarde uit halen. Ruben Dood, directeur Beleidsstatistiek en Data services bij het CBS, vertelde hier meer over. Daarnaast is de juridische kant van data driven healthcare belicht door Lokke Moerel, Senior of Counsel bij Morrison & Foerster LLP en Professor Global ICT Law bij de Universiteit van Tilburg. Tot slot, heeft Marcel Geurts, partner bij Health Venture Partners, een vertaalslag gemaakt van CBS-data naar waardevolle inzichten voor de zorg. De introductie werd verzorgd door Michiel Heidenrijk, oprichter van ahti, en de moderator van het event was Rachel van Beem, Head of Projects bij ahti.
De rol van het CBS
De missie van het CBS is het publiceren van betrouwbare en samenhangende statistische informatie die inspeelt op de behoefte van de samenleving. Het CBS is het dataknooppunt van Nederland. Zij verzamelen data-informatie op een breed scala van gebieden. Hiervoor maken ze gebruik van een systeem waarin de personen over wie zij data verzamelen gespeudonimiseerd zijn en een bepaald nummer krijgen, het RIN-nummer. Daar hangt vervolgens alle data van deze persoon gepseudonimiseerd aan vast. Deze bestanden zijn onderling koppelbaar. Hierdoor kun je zowel langs de lijn van verschillende variabelen (zoals inkomen, opleiding, gezondheid, wijk/buurt), als langs de lijn van tijd (2019, 2020 etc.) data opzoeken en vergelijken. Vanwege de privacy gevoelige informatie is een goede beveiliging van groot belang. In eerste plaats worden data geanonimiseerd gepubliceerd via de eigen kanalen van het CBS: Statline en Open Data. Voor sommige nieuwe toepassingen is het echter nodig om terug te gaan naar de microdata. Hiervoor zijn de Microdata Services opgericht, waartoe externe onderzoekers (na uitvoerige clearance checks) toegang kunnen krijgen. Momenteel zijn er 1150 actieve gebruikers die gebruik kunnen maken van 4500 beschikbare datasets aan microdata. Daarnaast is het mogelijk om in deze omgeving eigen datasets te importeren, datasets van derden te gebruiken, eigen modellen te laten draaien en ook gebruik te maken van de specialistische software en experts van het CBS.
Gezondheidszorg data en CBS data koppelen – mag dat wel?
Lokke Moerel nam ons mee in de juridische grondslag voor het koppelen van patiëntgegevens aan CBS-data. Hoe optimaliseren we de beschikbare patiëntdata en hoe trekken we daar real world conclusies uit? Als voorbeeld worden de data van COVID-patiënten genomen, wat allemaal verzameld is volgens de opgestelde WHO standaarden. Al snel na uitbreken van de pandemie bleek dat er verschillen waren tussen bevolkingsgroepen in de sterftecijfers. Een koppeling met SES-data (Sociaal Economische Status) kan hierbij helpen om te begrijpen welke factoren hier een rol spelen. Hieruit kan blijken dat er sociaal-economische oorzaken aan ten grondslag liggen, zoals armoede, toegang tot de gezondheidszorg en nazorg. Hiervoor is een doorgifte van de Covid Predict database (van het VUmc) aan het CBS nodig, wat tot veel oproer leidde. Was het allemaal wel AVG-proof? Zo zou er geen juridische grondslag zijn voor de verwerking van patiëntgegevens voor medisch wetenschappelijk onderzoek. De opties die er momenteel voor zijn, zoals anonimisering en toestemming vragen, zouden niet werken. Door anonimisering is de data minder goed bruikbaar. Bij toestemming kan er sprake zijn van een selectiebias doordat niet iedereen toestemming geeft. Om die reden zou er een nieuwe wettelijke grondslag nodig. Het is echter een mythe, betoogt Moerel, dat de AVG-gezondheidsonderzoek onmogelijk maakt. Lokke Moerel scheen licht op deze zaken aan de hand van verschillende wetten en regels. Zo geeft de AVG wel een wettelijke grondslag voor onderzoek in het publiek belang van de gezondheidszorg. Daarbij is volgens de AVG toestemming niet nodig en zelfs niet geschikt.
Daarnaast is het CBS niet zomaar een derde waaraan data doorgegeven wordt: Het CBS is een streng gereguleerde organisatie. De AVG vereist zelfs dat instellingen zoals het CBS ingezet worden om data te ontsluiten voor onderzoek in het algemeen belang (privacy-by-design). Momenteel is er in de gezondheidszorg weinig innovatie om aan de eisen van privacy-by-design te voldoen. Organisaties denken te veel in silo’s en houden zich vast aan hun eigen onderzoeksdatabases, die tevens ook minder goed beveiligd zijn dan de CBS-omgeving. Kortom, er is een groot belang om de ontsluiting van zorgdata te optimaliseren. Het CBS is daarvoor juist een uitstekend vehikel om goede koppelingen te maken en geen hindering. Het is op zichzelf al ingericht als een AVG-safe platform. Als voorbeeld illustreerde Lokke Moerel hoe we bijvoorbeeld de Covid Predict data van het VUmc kunnen koppelen met het CBS-platform. Ten eerste heeft zij onderbouwd dat de upload van de COVID-patiëntdata en de IC-data intern naar het VUmc wettelijk is toegestaan. Vervolgens is ook de doorgifte naar het CBS wettelijk toegestaan. Daarmee wordt bedoeld dat het zowel voldoet aan de eisen van de AVG, als aan de eisen van de WGBO (Wet op de Geneeskundige Behandelovereenkomst). Wel is het van belang dat bij een directe upload van de COVID-patiëntdata er een opt-out mogelijkheid geboden wordt. Kortom: Lokke Moerel demonstreerde dat het koppelen van zorgdata en CBS-data in de CBS-omgeving niet alleen mogelijk en wettelijk toegestaan is, maar ook wenselijk is gezien de veiligheid en de privacy-by-design principes die inherent zijn aan de opzet van het CBS zelf.
Van CBS-microdata naar waardevolle inzichten in de zorg
Marcel Geurts, partner bij Health Venture Partners en betrokken bij ahti, demonstreerde tot slot wat er aan zorgdata beschikbaar is in de CBS-omgeving, onder welke voorwaarden daarmee gewerkt mag worden en tot wat voor inzichten dit kan leiden aan de hand van enkele voorbeelden. De microdata van het CBS is ontzettend rijk. Het kent een brede set aan achtergrondkenmerken, zowel op demografisch en sociaal-economisch niveau. Daarnaast is van alle zorg- en welzijnsregelingen data beschikbaar over gebruik en kosten, maar met een verschillend detailniveau per regeling. Wel is er een wisselende actualiteit. De achtergrondkenmerken zijn actueel. Het zorggebruik kan echter 2 tot 3 jaar vertraging hebben in het systeem.
Met deze data kan op verschillende manieren waarde worden gecreëerd. Zo kan het gebruik en de kosten van individuele regelingen en de samenloop van regelingen worden geduid. Maar dezelfde data kan ook worden ingezet om voorspellingen te doen over het ontwikkelen van aandoeningen, het toekomstige zorggebruik en de toekomstige zorgkosten. Om de observaties in de data goed te kunnen duiden is het belangrijk om voldoende ver in te kunnen zoomen. De CBS-microdata lenen zich hiertoe. Zo kan binnen de huidige modellen van ahti worden ingezoomd langs drie assen:
- Langs de as van burgerprofielen (o.b.v. van demografische en sociaal-economische kenmerken)
- Langs de as van geografie (gemeente, stadsdeel, wijk, buurt)
- Langs de as van het zorggebruik (bijv. het type zorgverlener of het type zorg).
Vanuit privacy overwegingen mag je niet inzoomen op het individu. Wel kan langs verschillende assen tegelijkertijd worden ingezoomd, zolang er maar voldoende data beschikbaar is in het resulterende zoekgebied. Eén van de voorbeelden die Marcel Geurts illustreerde was dat er grote verschillen zijn in zorgkosten tussen regio’s. Dit roept vragen op. Zijn de hogere zorgkosten bijvoorbeeld te wijten aan meer zorggebruikers of aan meer kosten per gebruiker? Afhankelijk van hoe je naar het probleem kijkt (en dus: langs welke as je inzoomt op het probleem), kun je een oplossingsgerichte aanpak vaststellen en de juiste actoren aanspreken om het probleem aan te pakken.
Op basis van de huidige CBS omgeving kan al veel waarde worden gegenereerd. Deze waarde kan nog verder toenemen als de bestaande CBS-omgeving doorontwikkeld kan worden tot de verzamelplaats van alle zorggerelateerde data, bijvoorbeeld door ook datasets toe te voegen met de uitkomstdata van de DICA (Dutch Institute for Clinical Auditing) of de verwijsdata van huisartsen. Daarmee zou een wereldwijd unieke publieke infrastructuur ontstaan met een hoog gewaardeerd potentieel.
Het CBS als koppelpunt van alle zorg gerelateerde data
Het CBS ontluikt als ideaal koppelpunt voor alle zorg gerelateerde data. De interne structuur van de omgeving is op dit moment het meest veilige. De AVG valt moeiteloos te verenigen met het democratisch model van het CBS. Sterker nog, het is juist bedoeld om ontsloten te kunnen worden voor onderzoek in het algemeen belang. Door zorgdata te koppelen aan CBS-data kunnen rijke inzichten verkregen worden en kunnen er gepaste oplossingen gevonden worden voor problemen door in te zoomen op specifieke variabelen.