Wat een bibliothecaris moet weten over Generatieve AI
De essentie is dat AI-modellen een onderwerp niet begrijpen zoals mensen dat doen, maar woorden aan elkaar weven op basis van ingewikkelde statistische berekeningen. Om dit te doen, gebruiken AI-modellen enorme datasets die verzameld zijn uit verschillende bronnen, waaronder sommige met foutieve data. Dit maakt hun antwoorden niet transparant en soms helemaal fout (dit wordt ook wel hallucinaties genoemd). Academische bibliotheken kunnen de antwoorden echter transparanter en betrouwbaarder maken door de commerciële AI-chatbots te dwingen gevalideerde gegevens te gebruiken voor hun antwoorden met Retrieval Augmented Generative AI-applicaties (RAG). Dit werkt als volgt: de vraag van de gebruiker wordt ingevoerd in een database van de bibliotheek met gevalideerde en betrouwbare informatie en de voor die vraag relevante documenten worden opgehaald. Deze documenten worden vervolgens samen met de vraag van de gebruiker naar de commerciële AI-chatbot gestuurd met de instructie om het antwoord te vinden in de documenten van de bibliotheek. De applicatie geeft dan het antwoord op de specifieke vraag die door de chatbot is gegenereerd, samen met de relevante documenten.
AI-effecten op de omgeving van de academische bibliotheek
Vervolgens kijken we naar de impact van AI op de wetenschap en op het gedrag van bibliotheekgebruikers:
- AI zal de wetenschap transformeren door de inzet van AI-modellen voor complexe systemen, die data van meerdere disciplines samenbrengen. Ook zal het tempo van wetenschappelijk onderzoek versnellen. Met als gevolg meer wetenschappelijke publicaties en een verdere versnippering van het scholarly record (naast een artikel ook bijvoorbeeld data, software code, protocollen, audiovisuele bestanden e.d.; the atomisation of the scholarly record).
- Het gedrag van bibliotheekgebruikers zal volgens ons drastisch veranderen omdat de interactie met internet een dialoog wordt (‘conversational discovery’). Op de langere termijn wordt voorspeld dat op AI-gebaseerde personal assistants softwareapplicaties zullen gebruiken als een proxy voor de eindgebruiker, rekening houdend met de persoonlijke voorkeuren van de eindgebruiker.
Paradigma shift in discovery
Deze veranderde interactie met de digitale wereld veroorzaakt een paradigma shift in discovery. De overgang naar conversational discovery met AI-chatbots, die direct antwoord geven op de vraag van de gebruiker, zal leiden tot (veel) minder gebruik van bibliotheekcollecties en mogelijk resulteren in de behoefte aan een nieuw type gebruikscijfers: gebruik door de AI-chatbot namens de eindgebruiker.
Metadata en erfgoedcollecties
De potentiële toepassingen van AI in metadataproductie en erfgoedcollecties zullen ook grote gevolgen hebben voor bibliotheken. Er zijn veelbelovende mogelijkheden om (delen van) de metadataproductie te automatiseren, waardoor digitale erfgoedcollecties beter vindbaar worden. Een andere toepassing is het gebruik van RAG-achtige applicaties om erfgoedcollecties open te stellen voor vraag-en-antwoord interacties.
Toegang tot bibliotheekcollecties, AI-literacy, Open Science en de bibliotheekorganisatie
Tot slot gaan we in op vier andere kwesties die relevant zijn voor academische bibliotheken en die tot nu toe weinig aandacht hebben gekregen in de literatuur, maar die de komende jaren zeker een rol gaan spelen:
- De omstreden kwestie van het toestaan van toegang door commerciële AI-chatbots tot bibliotheekcollecties
- De noodzaak om de cursussen over informatievaardigheden te herontwikkelen
- De potentiële bedreigingen voor Open Science-praktijken in AI-gedreven wetenschap door de dominantie van enkele Big Tech-bedrijven
- De effecten van AI-tools voor bedrijven op bibliotheekorganisaties.
In totaal voorspellen we 24 verschillende effecten van generatieve AI op academische bibliotheken. Zie voor een uitgebreide beschrijving onze White Paper.