Transformers: Indrukwekkend, maar echt de toekomst?
π§ Transformers zijn indrukwekkend β maar zijn ze echt de toekomst?
Het onderstaande diagram (uit het mechanistic interpretability-onderzoek) is een van de beste voorbeelden van waarom de Transformer-architectuur tegen haar grenzen aanloopt.
π De opgave: 36 + 59
Wat voor ons triviaal is, wordt in de Transformer een labyrintisch proces met twee parallelle paden β het ene schat ruwweg, het andere probeert het laatste cijfer correct te krijgen.
π Het resultaat? Het werkt β op de een of andere manier.
Maar niet omdat de Transformer het begrijpt. Wel omdat we hem met miljarden FLOPs in de juiste richting hebben geduwd.
Wat het diagram duidelijk maakt
- β Transformers kunnen rekenopgaven oplossen
- β Maar ze willen het niet β de architectuur verzet zich er ronduit tegen
π₯ Een paradigmaverschuiving is nodig
Dit is een sterk bewijs dat we een paradigmaverschuiving nodig hebben. Wiskunde is niet optioneel voor intelligente systemen. En als een architectuur zoveel energie nodig heeft om eenvoudige rekenregels te βsimuleren", dan is dat een waarschuwingssignaal.
π Mechanistic Interpretability
Mechanistic interpretability laat ons hier niet alleen zien hoe Transformers βdenken" β maar ook hoe weinig ze werkelijk begrijpen. Meer hierover is te vinden op mechinterp.com.
Het is tijd om na te denken over nieuwe architecturen. Echt nieuwe. Niet alleen grotere modellen.
Klaar voor de volgende stap?
Vertel ons over uw project β samen vinden we de juiste AI-oplossing voor uw bedrijf.
Adviesgesprek aanvragen