itinfinance.nl

Waarom GPT niet kan denken zoals wij

Nieuws
21-02-2025
Martha Lewis
Kunstmatige intelligentie (AI) wordt steeds beter in het oplossen van complexe problemen, maar hoe goed begrijpt een AI-model eigenlijk de logica achter zijn antwoorden? Nieuw onderzoek testte de ‘analogievaardigheden’ van GPT-modellen—oftewel hun vermogen om patronen en verbanden te herkennen en toe te passen op nieuwe situaties.

GPT-modellen schieten tekort als de problemen worden aangepast, wat belangrijke zwakheden in hun redeneercapaciteiten blootlegt.

Analogisch redeneren is het vermogen om een ​​vergelijking te trekken tussen twee verschillende dingen op basis van hun overeenkomsten in bepaalde aspecten. Het is een van de meest voorkomende methoden waarmee mensen proberen de wereld te begrijpen en beslissingen te nemen. Een voorbeeld van analoog redeneren: een kopje is tot koffie wat soep is tot ??? (het antwoord is: kom).

Kunnen AI-modellen echt redeneren?

Grote taalmodellen zoals GPT-4 presteren goed op allerlei tests, waaronder die waarbij analoog redeneren belangrijk is. Maar kunnen deze AI-modellen écht redeneren, of herkennen ze simpelweg patronen uit hun trainingsdata? Zijn ze net zo flexibel en robuust als mensen bij het maken van analogieën?

[....]

Lees verder op: uva.nl

Gerelateerde vacatures

Geïnteresseerd in een carrière bij organisaties in ditzelfde vakgebied? Bekijk hieronder de gerelateerde vacatures en vind de perfecte match voor jou!
Instituut Mijnbouwschade Groningen
4.024 - 6.110
Medior
Groningen
Als MLOps Engineer bij Instituut Mijnbouwschade Groningen (IMG) breng je ML- en AI-modellen naar productie op Azure, bouw en beheer je CI/CD in Azure DevOps, modelregistratie/monitoring/versiebeheer en API’s, en borg...
Instituut Mijnbouwschade Groningen
4.024 - 6.110
Medior
Groningen
Als LLM-ontwikkelaar bij Instituut Mijnbouwschade Groningen (IMG) ontwikkel, integreer en optimaliseer je LLM-oplossingen zoals ChatBob en kennisbank-chatbots. Je bouwt architectuur en pipelines en borgt performance, veiligheid, beheer en monitoring in...
Top vacature
De Nederlandsche Bank
4.800 - 6.800
Medior, Senior
Amsterdam
Als Strategisch Cyber Threat Intelligence Analist bij DNB onderzoek je cyberdreigingen en geopolitieke ontwikkelingen, bouw je CTI-producten voor TIBER-TLPT, verbind je incidenten tot patronen en vertaal je inzichten naar adviezen...
ARAG
4.318 - 6.167
Medior
Leusden
Als Architect IT-Infrastructuur bij ARAG ben je de cruciale schakel tussen visie en techniek. Je ontwikkelt een veilige en toekomstbestendige IT-omgeving, vertaalt architectuurvisies naar roadmaps, stelt doelarchitecturen op, en balanceert...