Bron: ArsTechnica.com (https://tinyurl.com/7kslxwl)
Datafabricatie. Wel eens van gehoord? Of p-hacking? Beide zijn vormen van wetenschappelijke zwendel. In het eerste geval tik je à la Diederik Stapel je data zelf in. Je doet dat net zo lang tot de analyse van die data laat zien wat je hoopte aan te tonen. Bij p-hacking gebruik je wel echte data. Je analyseert een eind weg, verwijdert ‘cases die niet zo goed in het algemene beeld passen’, net zo lang tot je iets interessants tegenkomt. Wetenschappelijke tijdschriften, zeker de meest prestigieuze, zijn namelijk dol op ‘nieuwe inzichten’. Ze publiceren niet snel onderzoek dat, in jargon, de nulhypothese ondersteunt, oftewel geen statistisch significant effect laat zien.
Gelukkig heeft de wetenschap een immuunsysteem om ziektes als deze te lijf te gaan. Om de haverklap verschijnen er thans studies die met statistische methoden op zoek gaan naar datafabricatie en p-hacking. Zulk onderzoek wordt eenvoudiger doordat grote aantallen wetenschappelijke papers digitaal beschikbaar zijn. Althans: zouden moeten zijn. Het is helaas nog niet algemeen bekend dat open access meer is dan gratis toegang alleen. Je moet ook een lokale kopie kunnen maken van grote hoeveelheden artikelen om er de relevante data uit te kunnen halen. En dat moet auteursrechtelijk zijn toegestaan.
Het is helaas nog niet algemeen bekend dat open access meer is dan gratis toegang alleen.
Publicatieplatforms als PeerJ en PLOS doen niet moeilijk. Alles verschijnt daar onder een Creative Commons-licentie (cc-by) die content mining (ook wel text and data mining, TDM) mogelijk maakt. Bovendien zetten ze op aanvraag een dump van de benodigde artikelen voor je klaar. Maar mik je op een goede afspiegeling van een wetenschappelijke discipline, dan ben je óók aangewezen op grote uitgevers die ‘hun’ copyrighted content niet zo makkelijk vrijgeven. Via een API kun je soms wel bij dat materiaal. Daarvoor moet je dan wel licentieovereenkomsten aangaan die een combinatie van data uit verschillende bronnen weer onmogelijk maken. De universiteitsbibliotheken zijn hier kritisch over en de Europese Commissie lijkt een oplossing te gaan aandragen. Brussel creëert echter nieuwe mist door dit alleen toe te staan voor onderzoeksorganisaties die ‘in het publieke belang’ werken. Wat dat zijn? Daar mogen advocaten, rechters en het Europese Hof weer jaren over gaan stoeien.
Open access heeft de wind mee. Zo is er per 1 juli een artikel in de auteurswet terecht gekomen dat het mogelijk maakt je werk binnen redelijke termijn online te zetten. Vanaf december moeten ontvangers van NWO-subsidies ervoor zorgen dat hun publicaties per direct voor iedereen beschikbaar zijn. Jammer genoeg lijkt open access tegelijkertijd te verwateren tot toegang alleen en wordt hergebruik niet genoemd. Zo schrijft de NWO-richtlijn geen licenties voor die ook content mining mogelijk maken. Navraag leert dat dit uiteindelijk wel onderdeel van het NWO-beleid zal worden.
Content mining heeft grote potentie voor de wetenschap. Om fraude op te sporen en om nieuwe vragen te beantwoorden. Maar dan moet het wel mogen.
Deze column verscheen in Vakblad IP, jaargang 19 nummer 9, 17 december 2015.
Posted by Frank Huysmans on 21 december 2015 | Posted in beleid, columns, onderzoek, opinie, vakpublicaties | Tagged auteursrecht, content mining, datafraude, open access, p-hacking, text and data mining
|
Commercialisering en digitalisering raken niet alleen bibliotheken en archieven, maar ook de lokale en regionale informatievoorziening. In een essay schets ik hoe deze informatievoorziening zich de afgelopen decennia heeft ontwikkeld. Aan het slot breng ik journalistiek, bibliotheken en archieven samen: één beleid op lokaal en regionaal niveau zou wel eens heel verfrissend kunnen zijn.
Redactie regionaal dagblad (bron: www.gahetna.nl)
Het is nooit aangenaam vertoeven in een kerk in de maand januari. Maar de hemel was wolkeloos, het centrum van Maarssen bleek een openluchtmuseum en de zon scheen warm door het glas in lood. De vader van een goede vriend, net gepensioneerd, was plotseling overleden. In de houten bank achter ons zaten oud-collega’s van het Utrechts Nieuwsblad. Eigenlijk het AD Utrechts Nieuwsblad, maar vloeken mag niet in de kerk. Ze waren allemaal halverwege de vijftig of ouder. Hun omfloerste commentaar op de toespraken verried kameraadschap en nostalgie. Mannen, vooral mannen, die een groot deel van hun werkzame leven met elkaar waren opgetrokken, deadlines hadden getrotseerd en hun stress afgebouwd met potjes voetbal, anekdotes, bier en tabak.
Nostalgie, want de professie van lokale en regionale journalisten is op de terugtocht. In 1980 hadden de Nederlandse dagbladen gezamenlijk een betaalde oplage van ruim 4,5 miljoen exemplaren. Zo’n 60 procent daarvan betrof regionale kranten. Tot 2000 bleef die oplage ongeveer gelijk en werd het aandeel landelijk op het totaal al wat groter. Daarna zette een stevige oplagedaling in, waarbij vooral de regionale kranten het zwaarder te verduren kregen.
De in het openbaar vervoer verspreide gratis kranten hebben daar ongetwijfeld aan bijgedragen. En de laatste jaren zijn het vooral de regiokranten die de klappen krijgen. Eind 2014 bedroeg de gezamenlijke betaalde oplage van de Nederlandse dagbladen nog maar zo’n 2,5 miljoen op papier, aangevuld met een dikke 250.000 digitale abonnementen. En het aandeel regiokranten? Dat is teruggelopen tot minder dan de helft.
Illustratief is ook de dekkingsgraad. In 1980 werden per 100 huishoudens 87 betaalde kranten verspreid. Nu zijn het er minder dan de helft daarvan. En dan is er nog het aantal daadwerkelijke lezers – want een verspreide krant is nog geen gelezen krant. Ook hier zit de klad in: het percentage mensen dat zegt (bijna) dagelijks een krant te lezen neemt al geruime tijd af. De trouwe lezers van weleer hoor je klagen dat hun regiokrant door reorganisaties en schaalvergroting inmiddels te ver van hun woonplaats afstaat en dat de kwaliteit van de berichtgeving achteruit is gegaan. En journalisten geven aan dat er minder ruimte is dan voorheen voor gedegen onderzoek.
Zijn we niet meer geïnteresseerd in wat er in de meest directe omgeving gebeurt? En is er nog wel een onafhankelijk, wakend oog op wat er politiek en bestuurlijk in de regio gebeurt?
Hoe komt dit? Zijn we niet meer geïnteresseerd in wat er in de meest directe omgeving gebeurt? En is er nog wel een onafhankelijk, wakend oog op wat er politiek en bestuurlijk in de regio gebeurt? In grove penseelstreken probeer ik te schetsen hoe de lokale en regionale informatievoorziening zich de afgelopen decennia heeft ontwikkeld met de komst van commercialisering en digitalisering. Tot slot betoog ik dat het wel eens verfrissend kan zijn na te denken over een beleid voor journalistiek, bibliotheken en archieven op lokaal en regionaal niveau.
Lees verder »
Posted by Frank Huysmans on 18 december 2015 | Posted in beleid, essay, geen, opinie, vakpublicaties, WareKennis | Tagged crossmediaal, digitalisering, hyperlokaal, informatie, informatiesamenleving, internet, lokaal, lokale media, nieuwsvoorziening, openbaarheid, openbare bibliotheken, publieke sfeer, regionaal, regionale media
|
Bron: www.screwydecimal.com (2012)
Komt een vrouw in de openbare bibliotheek (of een man, doet er niet toe). Hoe noem je zo’n dame? Een bezoeker? Kan. Maar wat als die bezoeker aan de leestafel plaatsneemt en een tijdschrift gaat doorbladeren? Dan is zij meer dan een bezoeker, want ze maakt gebruik van een van de diensten. Ze wordt een gebruiker. Hoewel: voor sommigen is de associatie met geestverruimende middelen te sterk. Goed, laten we er dan een bibliotheekgebruiker van maken. Dat is weer zo’n lang woord en bekt niet lekker. Maar we zijn er nog niet. Wat als onze bezoeker-gebruiker een bibliotheekpasje op zak blijkt te hebben? Dan is ze naast bezoeker en gebruiker ook nog lid en kan ze, als ze wil, boeken en andere materialen mee naar huis nemen.
Het onderscheid tussen bezoekers, gebruikers en leden is niet alleen maar semantisch. Openbare bibliotheken onderscheiden zich van andere bibliotheken doordat ze er zijn voor de gehele bevolking, momenteel 16,9 miljoen mensen. Of exacter, in de woorden van artikel 1 van de Grondwet: voor allen die zich in Nederland bevinden (immers: ook de toerist is op het Oosterdokseiland welkom om, wel tegen betaling inmiddels, zijn Facebook te komen checken).
Vijf en een halve euro
Bibliotheekvestigingen bedienen dus uitdrukkelijk niet alleen hun leden. Dat wordt wel eens vergeten door mensen die prestatieindicatoren als ‘kosten per uitlening’ gaan uitrekenen. Zij delen het totale subsidiebedrag dat gemeenten, provincies en het Rijk in de openbare bibliotheken steken door het aantal uitleningen. In 2014 was het totale subsidiebedrag 431,6 miljoen euro. Deel dit bedrag door het aantal uitleningen, 78,4 miljoen, en je komt uit op een bedrag van 5,50 euro per uitlening (bron: CBS Statline).
Bibliotheekvestigingen bedienen dus uitdrukkelijk niet alleen hun leden.
Daarbij wordt dan wel vergeten dat de huur van het gebouw, het salaris van de medewerkers en de kosten van de collectie óók worden gemaakt om de binnenwandelende niet-leden van dienst te zijn. De voor tentamens blokkende studenten, de werklozen die vacaturesites en -pagina’s komen raadplegen en de ouderen die de kranten van vandaag doorbladeren. En niet te vergeten de schoolkinderen die in hun eigen Bibliotheek op School lessen mediawijsheid krijgen of aan hun boekpresentatie komen werken.
Lees verder »
Posted by Frank Huysmans on 6 december 2015 | Posted in beleid, essay, opinie, vakpublicaties, WareKennis | Tagged burger, economie, functiesysteem, klant, maatschappelijke opdracht, openbare bibliotheken, sociologie
|