itinfinance.nl

Waarom GPT niet kan denken zoals wij

Nieuws
21-02-2025
Martha Lewis
Kunstmatige intelligentie (AI) wordt steeds beter in het oplossen van complexe problemen, maar hoe goed begrijpt een AI-model eigenlijk de logica achter zijn antwoorden? Nieuw onderzoek testte de ‘analogievaardigheden’ van GPT-modellen—oftewel hun vermogen om patronen en verbanden te herkennen en toe te passen op nieuwe situaties.

GPT-modellen schieten tekort als de problemen worden aangepast, wat belangrijke zwakheden in hun redeneercapaciteiten blootlegt.

Analogisch redeneren is het vermogen om een ​​vergelijking te trekken tussen twee verschillende dingen op basis van hun overeenkomsten in bepaalde aspecten. Het is een van de meest voorkomende methoden waarmee mensen proberen de wereld te begrijpen en beslissingen te nemen. Een voorbeeld van analoog redeneren: een kopje is tot koffie wat soep is tot ??? (het antwoord is: kom).

Kunnen AI-modellen echt redeneren?

Grote taalmodellen zoals GPT-4 presteren goed op allerlei tests, waaronder die waarbij analoog redeneren belangrijk is. Maar kunnen deze AI-modellen écht redeneren, of herkennen ze simpelweg patronen uit hun trainingsdata? Zijn ze net zo flexibel en robuust als mensen bij het maken van analogieën?

[....]

Lees verder op: uva.nl

Gerelateerde vacatures

Geïnteresseerd in een carrière bij organisaties in ditzelfde vakgebied? Bekijk hieronder de gerelateerde vacatures en vind de perfecte match voor jou!
Univé
64.830 - 93.155
Medior
Zwolle
Als Product Owner Cloud Competence Center bij Univé stuur je de doorontwikkeling van het cloudplatform: je vertaalt visie naar platformdiensten, bewaakt standaarden en guardrails met architectuur, security en MSP, en...
Algemene Rekenkamer
4.691 - 7.747
Medior
Den Haag
Als Business analist bij de Algemene Rekenkamer vertaal je digitaliseringswensen naar business requirements en functionele specificaties, analyseer en verbeter je processen, en stuur je veranderingen van concept tot implementatie aan,...
Blue Sky Group
In overleg
Medior
Amstelveen
Als Testmanager (interim) bij Blue Sky Group professionaliseer je de teststrategie, plan en coördineer je testactiviteiten binnen Wtp/IT-projecten, stuur je testteams aan, bewaak je kwaliteit en risico’s en lever je...
Douane
6.640 - 9.310
Senior, Medior
Rotterdam
Als Afdelingshoofd CIO Office, Douane bij Ministerie van Financiën stuur je het CIO Office aan en versterk je digitaliseringsbeleid, enterprise-architectuur en het meerjarig IV/IT-portfolio, met regie op security, privacy, data...