KB beperkt toegang collecties voor trainen commerciële AI

Foto: Shutterstock

De KB wil niet dat commerciële bedrijven zonder toestemming digitale bronnen gebruiken voor het trainen van AI. Dit past niet bij de AI-principes die de nationale bibliotheek heeft opgesteld. De KB heeft inmiddels maatregelen genomen om dit gebruik te beperken en hierover een statement naar buiten gebracht.

Generatieve artificial intelligence is een vorm van AI die automatisch nieuw materiaal kan genereren. Zo’n AI-model wordt getraind met bestaande data zoals tekst of afbeeldingen. Hieruit haalt het model veel voorkomende patronen zoals bepaalde woordcombinaties. Een chatbot als ChatGPT gebruikt dit vervolgens om op basis van een prompt een nieuwe tekst te schrijven. Hoe meer trainingsdata zijn gebruikt, hoe beter de resultaten van het AI-model.

De KB maakt veel werk van schrijvers, illustratoren en uitgevers online toegankelijk. Deze digitale bronnen worden door commerciële AI-bedrijven op grote schaal binnengehaald om AI-modellen te trainen. ‘Wij vinden dat AI-toepassingen op een ethisch verantwoorde manier tot stand moeten komen. Zo vinden wij het belangrijk dat het auteursrecht wordt gerespecteerd, dat er aan bronvermelding wordt gedaan en dat persoonsgegevens worden beschermd’, licht KB-directieteamlid Martijn Kleppe toe. ‘Dat is bij veel commerciële AI-bedrijven niet het geval. Zij vragen geen toestemming voor het binnenhalen van deze data en zijn niet transparant over de manier waarop deze data worden gebruikt.’

Toegang zo open mogelijk
Om het gebruik van digitale bronnen door commerciële AI-bedrijven te beperken heeft de KB de gebruiksvoorwaarden voor de websites Delpher en DBNL aangepast en technische maatregelen genomen. Kleppe: ‘We zullen er uiteraard voor zorgen dat regulier gebruik van onze digitale bronnen niet zal worden gehinderd.’ Het KB-beleid blijft volgens hem om zo open mogelijk toegang te bieden tot informatie. ‘Een belangrijk doel van de KB is om onderzoek op basis van onze collecties zo veel mogelijk te stimuleren. Daarbij omarmen we digitale ontwikkelingen en de mogelijkheden van AI, maar wel op een manier die past bij de AI-principes die we in 2020 hebben opgesteld.’

De KB draagt ook bij aan de ontwikkeling van het Nederlandse open taalmodel GPT-NL. Daarmee wordt een belangrijke stap gezet richting transparant, eerlijk en toetsbaar gebruik, aldus de nationale bibliotheek.




Gerelateerde berichten
Lees meer

Blog: Sonny Boy

(Video onder bericht) Tekst: Janneke Krommendijk werkte ruim 46 jaar in de bibliotheekwereld. 25 jaar als assistent-bibliothecaresse bij…