Google geeft bijgewerkte experimentele versie van Gemini 2.0 Flash Thinking vrij om te testen

Bijgewerkt: 22.01.2025, 13:47

In december kondigde Google het Gemini 2.0 Flash Thinking-model aan als de eerste voor logisch redeneren, en nu is de bijgewerkte experimentele versie beschikbaar om te testen.

Dit is wat we weten

Dit model is gebaseerd op Flash 2.0, dat eerder die maand werd geïntroduceerd, en stelt je in staat om "je redenering duidelijk te laten zien" (zoals in AI Studio). Dit verbetert de prestaties bij het oplossen van complexere problemen. Het is een aanvulling op andere modellen zoals gemini-2.0-flash-exp en gemini-exp-1206.

We hebben ook code-uitvoering als hulpmiddel ingeschakeld, zodat het model kan beslissen om code te schrijven en uit te voeren tijdens zijn reactie. Je kunt dit inschakelen in de zijbalk in AI Studio!

Hier is een leuk voorbeeld waarbij het model de oplossing ballparkeert met een formule, maar wat pythoncode schrijft om te komen tot... pic.twitter.com/j8wNp8Yn27
- Jack Rae (@jack_w_rae) 21 januari 2025

Belangrijkste kenmerken van Gemini 2.0 Flash Thinking Experimental (januari 2025)

Contextueel venster van 1 miljoen tokens (van 32k): dit is handig voor degenen die "een codebase willen inpluggen of een set artikelen met complexere redeneringen willen opvragen".
Ondersteuning voor on-site code-uitvoering: voor een beter gebruik van de tool.
Hogere output token generatie.
Lagere frequentie van model discrepanties ("verminderde waarschijnlijkheid van tegenstrijdigheid tussen advies en antwoord").
Vergeleken met Exp 1219 laat de nieuwe versie "betere prestaties zien op wiskunde, wetenschap en multimodale tests", waaronder 73,3% op de AIME2024-test (wiskunde) en 74,2% op de GPQA Diamond-test (wetenschap).

Volgende versie van onze denkmodel reeks + Code uitvoering + 1M token context! De vooruitgang in het schalen van denkmodellen is ongelooflijk en zal blijven itereren - beschikbaar op Google AI Studio! Er komt nog meer https://t.co/OFacvvK8d9
- Sundar Pichai (@sundarpichai) 21 januari 2025

DeepMind CEO Demis Hasabis merkte op dat dit "een zeer snelle vooruitgang is sinds onze eerste release in december". Er werd opgemerkt dat ze al meer dan tien jaar bezig zijn met het ontwikkelen van dergelijke planningssystemen, te beginnen met programma's als AlphaGo, en dat ze blij zijn met een krachtige combinatie van deze ideeën met de krachtigste fundamentele modellen.

Gemini 2.0 Flash Thinking Experimental is beschikbaar om gratis te testen in Google AI Studio en via de API. Sundar Pichai merkte op dat de vooruitgang in het schalen van redeneren indrukwekkend is en zal doorgaan, en beloofde meer nieuws in de toekomst.

Bron: 9to5Google