De KB wil niet dat commerciële bedrijven zonder toestemming digitale bronnen gebruiken voor het trainen van AI. Dit past niet bij de AI-principes die de nationale bibliotheek heeft opgesteld. De KB heeft inmiddels maatregelen genomen om dit gebruik te beperken en hierover een statement naar buiten gebracht.
Generatieve artificial intelligence is een vorm van AI die automatisch nieuw materiaal kan genereren. Zo’n AI-model wordt getraind met bestaande data zoals tekst of afbeeldingen. Hieruit haalt het model veel voorkomende patronen zoals bepaalde woordcombinaties. Een chatbot als ChatGPT gebruikt dit vervolgens om op basis van een prompt een nieuwe tekst te schrijven. Hoe meer trainingsdata zijn gebruikt, hoe beter de resultaten van het AI-model.
De KB maakt veel werk van schrijvers, illustratoren en uitgevers online toegankelijk. Deze digitale bronnen worden door commerciële AI-bedrijven op grote schaal binnengehaald om AI-modellen te trainen. ‘Wij vinden dat AI-toepassingen op een ethisch verantwoorde manier tot stand moeten komen. Zo vinden wij het belangrijk dat het auteursrecht wordt gerespecteerd, dat er aan bronvermelding wordt gedaan en dat persoonsgegevens worden beschermd’, licht KB-directieteamlid Martijn Kleppe toe. ‘Dat is bij veel commerciële AI-bedrijven niet het geval. Zij vragen geen toestemming voor het binnenhalen van deze data en zijn niet transparant over de manier waarop deze data worden gebruikt.’
Toegang zo open mogelijk
Om het gebruik van digitale bronnen door commerciële AI-bedrijven te beperken heeft de KB de gebruiksvoorwaarden voor de websites Delpher en DBNL aangepast en technische maatregelen genomen. Kleppe: ‘We zullen er uiteraard voor zorgen dat regulier gebruik van onze digitale bronnen niet zal worden gehinderd.’ Het KB-beleid blijft volgens hem om zo open mogelijk toegang te bieden tot informatie. ‘Een belangrijk doel van de KB is om onderzoek op basis van onze collecties zo veel mogelijk te stimuleren. Daarbij omarmen we digitale ontwikkelingen en de mogelijkheden van AI, maar wel op een manier die past bij de AI-principes die we in 2020 hebben opgesteld.’
De KB draagt ook bij aan de ontwikkeling van het Nederlandse open taalmodel GPT-NL. Daarmee wordt een belangrijke stap gezet richting transparant, eerlijk en toetsbaar gebruik, aldus de nationale bibliotheek.
Gerelateerde berichten
Noord-Hollandse bibliotheken starten Leesoffensief
(Video onder dit bericht) Door corona zijn de leesachterstanden bij kinderen nog verder vergroot. De Noord-Hollandse bibliotheken vinden…
Webinar eindrapport PLEK 3: 8 maart
Op 8 maart 2021 organiseert de KB in samenwerking met Bibliotheek Lek & IJssel, Bibliotheek Venlo en Regioplan…
Babel Den Bosch heet voortaan Huis73
Babel, de organisatie voor bibliotheken, amateurkunst en cultuureducatie in Den Bosch en omstreken, heet voortaan Huis73. Dit is…
Techyoga en De Kleinste Privacyshow op Data Detox Dag (22 januari)
Op zaterdag 22 januari organiseert Huis73 in samenwerking met Fers en SETUP de Data Detox Dag. Paradoxaal genoeg…
13 januari 2022