DeepSeek har nyligen släppt en uppgradering av sin flaggskeppsmodell, och resulaten är minst sagt imponerande. Den nya versionen, DeepSeek V3-0324 (där ”0324” står för releasedatumet 24 mars), visar på betydande förbättringar jämfört med föregångaren – särskilt inom kodning där den nu närmar sig prestandan hos stängda modeller som Claude 3.7.
DeepSeek-V3-0324 använder samma modellstruktur som sin föregångare och stödjer funktioner som funktionsanrop, JSON-utdata och FIM-completions. För mer information om hur man kör modellen lokalt hänvisas till deras GitHub-sida.
När det gäller kodning visar DeepSeek V3-0324 på remarkabla förbättringar. På Aiders polyglot-benchmark har modellen uppnått 55%, vilket gör den till den näst bästa icke-reasoning modellen, endast slagen av Claude 3.7 Sonnet. Detta är en enorm förbättring jämfört med tidigare versioner.

Något som verkligen sticker ut är förmågan att generera långa kodsekvenser utan fel. Enligt rapporter kan modellen producera upp till 700 rader kod utan att introducera buggar – en egenskap som gör den extremt värdefull för mjukvaruutvecklare.

Tekniska Specifikationer
Modellen är licensierad under MIT-licensen, vilket gör den helt tillgänglig för utvecklarsamhället att använda, modifiera och distribuera fritt. Detta är ett betydande steg mot ökad transparens i AI-utvecklingen. Enligt tester har modellen visat upp imponerande förmågor:
- Kan generera komplex frontend-kod med hög precision.
- Hanterar matematiska beräkningar på avancerad nivå.
- Visar exceptionell kodningshastighet och effektivitet.
- Presterar bättre än GPT-3.5 och Claude 3.7 på kodrelaterade uppgifter.
Prestanda och tillgänglighet
En annan fördel med DeepSeek V3-0324 är dess operativa effektivitet. Enligt forskaren Awni Hannun kan modellen köras med mer än 20 tokens per sekund på en Mac Studio med M3 Ultra-chip (512GB) med hjälp av mlx-lm och en 4-bitars kvantisering.
För utvecklare och företag som vill använda modellen finns flera alternativ:
- Nedladdning av modellvikterna från Hugging Face.
- Via DeepSeeks officiella webbplats (deepseek.com).
- Mobil-appar för iOS och Android.
- En gratis version via OpenRouter.
- API (api-docs.deepseek.com) till priset $0,14 per miljon inmatningstoken.
Detta är ett betydande steg framåt för öppen källkod inom AI. DeepSeek arbetar redan på sin nästa version R2 som planeras lanseras i april.
För att använda nya versionen, besök bara chat.deepseek.com och inaktivera Deep Think (R1).