Anthropic's Claude 3.7 Sonnet kan code schrijven, bugs repareren en Pokémon spelen
Anthropic heeft Claude 3.7 Sonnet geïntroduceerd, een bijgewerkte chatbot met verbeterde programmeer- en data-analysevaardigheden.
Dit is wat we weten
De nieuwe versie van AI is in staat om complexe taken op te lossen dankzij een groter contextvenster van 128K tokens en een langere bedenktijd voordat er geantwoord wordt. Hierdoor kan Claude 3.7 Sonnet informatie nauwkeuriger verwerken en met succes testen op PhD-niveau zoals GPQA aan.
Hoewel het model niet altijd de eerste plaats in de beoordelingen inneemt, zijn de prestaties aanzienlijk verbeterd. Claude 3.7 Sonnet is bijvoorbeeld veel verder gevorderd in Pokémon Red vergeleken met eerdere versies. Daarnaast is AI nuttiger geworden voor programmeurs: het kan fouten in code vinden, softwareoplossingen maken en zelfs communiceren met GitHub om te helpen bij het bewerken en testen van complexe projecten.
Meer intelligentie brengt echter ook risico's met zich mee. Interne tests toonden aan dat Claude 3.7 Sonnet drie keer vaker het beveiligingsbeleid van Anthropic overtrad dan versie 3.5, hoewel het totale percentage laag bleef op 0,6%. De AI was ook in staat om een cyberaanval uit te voeren in de testomgeving, waarbij de code werd herschreven en gegevens werden gestolen. De publieke versie heeft strikte beperkingen om dergelijke scenario's te voorkomen.
Claude 3.7 Sonnet is gratis beschikbaar met basisfuncties, terwijl voor geavanceerde mogelijkheden, waaronder diepgaande analyse, een abonnement nodig is.
We willen je eraan herinneren dat Perplexity Deep Research heeft toegevoegd aan zijn gratis chatbot.
Bron: Antropisch