Alibaba presenta Qwen3-Coder con supporto per agenti AI in grado di prendere decisioni autonome

Il team di Qwen ha ufficialmente presentato Qwen3-Coder, il suo generatore di codice più potente fino ad oggi, che supporta l'approccio "agente". La stella principale della linea è Qwen3-Coder-480B-A35B-Instruct. Questo è un modello ibrido Mixture-of-Experts con 480 miliardi di parametri (35 miliardi attivi contemporaneamente) che può lavorare con il contesto di fino a 256.000 token nativamente e fino a 1 milione di token con estrapolazione. Nei test, dimostra risultati record tra i modelli open source in compiti di Codifica Agentica, Uso del Browser Agentico e Uso degli Strumenti Agentici - al livello del Claude Sonnet 4.
Cos'è la codifica agentica?
Qwen3-Coder è stato creato non solo per generare codice, ma anche per lavorare come un "agente" che può pianificare, utilizzare strumenti, ricevere feedback e prendere decisioni. In compiti del mondo reale (ad es., SWE-Bench), interagisce con l'ambiente in diversi passaggi, il che richiede un complesso apprendimento RL a lungo termine. A questo scopo, il team di Qwen ha sviluppato un sistema scalabile di 20.000 ambienti paralleli basati su Alibaba Cloud.
Le caratteristiche di Qwen3-Coder
- Addestrato su 7,5 trilioni di token, dove il 70% è codice
- Supporta un contesto enorme fino a 1 milione di token (con YaRN)
- Utilizzo dell'apprendimento per rinforzo (Code RL) su compiti del mondo reale per migliorare l'esecuzione del codice
- Integrazione con strumenti per sviluppatori come Qwen Code (CLI), Claude Code e persino OpenAI SDK
- Capacità di lavorare sia attraverso l'API che nell'ambiente locale
Strumenti e API
Lo strumento Qwen Code CLI basato su Gemini Code è disponibile con il modello. Consente di utilizzare facilmente Qwen3-Coder nei tuoi progetti, con supporto per prompt e funzioni personalizzate. Offre anche lavoro attraverso Claude Code e accesso diretto all'API tramite Alibaba Cloud Model Studio.
A cosa serve?
Qwen3-Coder è posizionato come un agente di codifica universale - dalla generazione di siti web a compiti di sviluppo complessi a più fasi. Il team di Qwen prevede di rilasciare ulteriori dimensioni del modello per ridurre i costi di implementazione e sta esplorando opportunità per il miglioramento autonomo dell'agente.
Informazioni su Qwen
Qwen è una serie di modelli di linguaggio su larga scala e soluzioni per agenti del Team Qwen di Alibaba, progettati per generare testo, codice, analisi dei dati e scenari a più fasi utilizzando strumenti. L'ultima versione, Qwen3-Coder, è costruita su un'architettura Mixture-of-Experts con 480 miliardi di parametri (35 miliardi attivi), supporta fino a 256.000 token di contesto nativamente e fino a 1 milione con estrapolazione, e dimostra risultati a livello di modello chiuso come Claude Sonnet 4 in SWE-Bench, Codifica Agentica, Uso del Browser e Uso degli Strumenti. Il modello si integra con l'OpenAI SDK, strumenti CLI (Qwen Code, Claude Code), API di Alibaba Cloud e supporta gli ecosistemi GitHub e Hugging Face, utilizzando apprendimento per rinforzo su compiti di codifica del mondo reale per migliorare precisone ed efficienza.