OpenAI ha annunciato il lancio in anteprima di Codex, un agente per l’ingegneria del software basato su cloud, progettato per svolgere molteplici attività in parallelo. Questo strumento innovativo può scrivere nuove funzionalità, rispondere a domande su un codice esistente, correggere bug e proporre pull request pronte per la revisione. Ogni task viene eseguito in un ambiente sandbox isolato, preconfigurato con il repository dell’utente.
Codex è alimentato da codex-1, una versione ottimizzata del modello OpenAI o3 per il contesto dello sviluppo software. Addestrato tramite reinforcement learning su task reali in ambienti vari, codex-1 genera codice in uno stile vicino a quello umano, rispettando le istruzioni e iterando i test fino al loro superamento.
Indice degli argomenti:
Come funziona Codex di OpenAI
Codex è accessibile attraverso la barra laterale di ChatGPT. Gli utenti possono assegnare nuovi compiti digitando un prompt e cliccando su “Code”, oppure interrogare il codice cliccando su “Ask”. Ogni task viene eseguito in un ambiente isolato che può leggere e modificare file, oltre a eseguire comandi come test, linting e controlli di tipo. I tempi di completamento variano da 1 a 30 minuti, e l’utente può seguirne l’avanzamento in tempo reale.
Alla fine dell’esecuzione, Codex esegue il commit delle modifiche e fornisce prove verificabili tramite log del terminale e risultati dei test. L’utente può poi rivedere i risultati, chiedere revisioni, aprire una pull request su GitHub o integrare le modifiche nel proprio ambiente locale.

AGENTS.md: guida per l’agente
Codex può essere orientato tramite file AGENTS.md, simili ai README.md, che indicano come navigare il codice, quali comandi usare per i test e quali convenzioni seguire. Come uno sviluppatore umano, Codex dà il meglio di sé in ambienti ben documentati e strutturati. Tuttavia, mostra prestazioni elevate anche senza questi file o configurazioni specifiche.

Codex OpenAI: sicurezza e trasparenza al primo posto
Codex viene rilasciato come anteprima di ricerca, seguendo l’approccio di distribuzione graduale di OpenAI. È stato progettato con un’attenzione particolare alla trasparenza e alla possibilità di verifica da parte dell’utente. In caso di errori o incertezze, l’agente segnala chiaramente i problemi riscontrati, lasciando all’utente la decisione finale sull’integrazione del codice. La validazione manuale del codice generato resta comunque essenziale.

Output allineati agli standard umani
Uno degli obiettivi principali nell’addestramento di codex-1 è stato l’allineamento alle preferenze e agli standard di sviluppo umano. Rispetto al modello o3, codex-1 produce patch più pulite, pronte per essere esaminate e integrate nel flusso di lavoro quotidiano.

Misure contro gli abusi
Per prevenire l’uso malevolo dell’AI, come la creazione di malware, Codex è stato addestrato a rifiutare in modo preciso richieste sospette, distinguendo con attenzione tra utilizzi leciti e illeciti. La policy di sicurezza è stata rafforzata e dettagliata in un addendum alla System Card del modello o3.
Esecuzione sicura e protetta
Durante l’esecuzione dei compiti, l’agente Codex opera in un container isolato nel cloud, senza accesso a Internet. Può interagire solo con il codice fornito tramite repository GitHub e con dipendenze definite da uno script di setup.
Codex di OpenAI: casi d’uso reali
I team tecnici di OpenAI già utilizzano Codex per automatizzare attività ripetitive, come il refactoring o la scrittura di test. Codex si dimostra utile anche per sviluppare nuove funzionalità, documentare e mantenere il flusso di lavoro fluido.
OpenAI ha coinvolto diversi partner per testarne le capacità:
- Cisco lo utilizza per accelerare l’innovazione, esplorando casi d’uso reali.
- Temporal sfrutta Codex per lo sviluppo di funzionalità, debugging e refactoring.
- Superhuman ne beneficia per automatizzare attività ripetitive e velocizzare la delivery.
- Kodiak lo impiega nello sviluppo del proprio sistema di guida autonoma, come strumento di supporto e riferimento.
Codex CLI: agenti leggeri nella console
OpenAI ha rilasciato anche Codex CLI, un agente open-source da terminale che integra modelli come o3 e o4-mini. Oggi è disponibile una versione più piccola, codex-mini-latest, ottimizzata per interazioni a bassa latenza e pronta per l’uso in locale o via API.
Gli utenti Plus e Pro possono registrarsi con il proprio account ChatGPT, ricevere crediti gratuiti (5 dollari e 50 dollari rispettivamente) e generare automaticamente il token API.
Codex di OpenAI: disponibilità, costi e limiti
Codex è ora disponibile per gli utenti ChatGPT Pro, Enterprise e Team, mentre gli utenti Plus ed Edu saranno supportati a breve. Per alcune settimane, l’utilizzo sarà gratuito e illimitato. In seguito verranno introdotte tariffe flessibili basate sul consumo.
Per chi usa codex-mini-latest tramite API, il prezzo è di 1,50 dollari per milione di token input e 6 dollari per milione di token output, con sconto del 75% grazie al caching dei prompt.
Attualmente, Codex non supporta input visivi per compiti di frontend e non è ancora in grado di ricevere feedback durante l’esecuzione di un compito. Tuttavia, il modello è destinato a diventare sempre più interattivo e integrato nei flussi di lavoro quotidiani.
Verso un nuovo paradigma collaborativo
OpenAI immagina un futuro in cui gli sviluppatori gestiranno direttamente le attività da svolgere e delegheranno il resto agli agenti AI, aumentando produttività e velocità. L’interazione asincrona con più agenti, introdotta da Codex, potrebbe diventare lo standard di riferimento nello sviluppo software.
La roadmap prevede miglioramenti significativi: feedback durante l’esecuzione, aggiornamenti proattivi e integrazioni con IDE, tracker e sistemi CI. Codex potrebbe così trasformarsi in un vero collaboratore digitale, cambiando il modo in cui si scrive e gestisce il codice.
Codex segna un cambio di paradigma per l’ingegneria del software: un ecosistema AI collaborativo che consente ai team di concentrarsi su ciò che conta davvero. E questo è solo l’inizio.