approfondimento

Codex: cos’è e come funziona l’agente cloud per lo sviluppo software di OpenAI



Indirizzo copiato

Un agente cloud-based per l’ingegneria del software capace di svolgere attività in parallelo. Alimentato dal modello codex-1, supporta scrittura di codice, debug, proposte di pull request e altro ancora. Codex è disponibile per gli utenti ChatGPT Pro, Team ed Enterprise, e presto anche per Plus ed Edu. Un passo avanti verso l’automazione intelligente del lavoro degli sviluppatori

Pubblicato il 19 mag 2025



Codex OpenAI

OpenAI ha annunciato il lancio in anteprima di Codex, un agente per l’ingegneria del software basato su cloud, progettato per svolgere molteplici attività in parallelo. Questo strumento innovativo può scrivere nuove funzionalità, rispondere a domande su un codice esistente, correggere bug e proporre pull request pronte per la revisione. Ogni task viene eseguito in un ambiente sandbox isolato, preconfigurato con il repository dell’utente.

Codex è alimentato da codex-1, una versione ottimizzata del modello OpenAI o3 per il contesto dello sviluppo software. Addestrato tramite reinforcement learning su task reali in ambienti vari, codex-1 genera codice in uno stile vicino a quello umano, rispettando le istruzioni e iterando i test fino al loro superamento.

A research preview of Codex in ChatGPT
Video: Come si OpenAI è arrivata a Codex e come funziona

Come funziona Codex di OpenAI

Codex è accessibile attraverso la barra laterale di ChatGPT. Gli utenti possono assegnare nuovi compiti digitando un prompt e cliccando su “Code”, oppure interrogare il codice cliccando su “Ask”. Ogni task viene eseguito in un ambiente isolato che può leggere e modificare file, oltre a eseguire comandi come test, linting e controlli di tipo. I tempi di completamento variano da 1 a 30 minuti, e l’utente può seguirne l’avanzamento in tempo reale.

Alla fine dell’esecuzione, Codex esegue il commit delle modifiche e fornisce prove verificabili tramite log del terminale e risultati dei test. L’utente può poi rivedere i risultati, chiedere revisioni, aprire una pull request su GitHub o integrare le modifiche nel proprio ambiente locale.

OpenAI Codex

AGENTS.md: guida per l’agente

Codex può essere orientato tramite file AGENTS.md, simili ai README.md, che indicano come navigare il codice, quali comandi usare per i test e quali convenzioni seguire. Come uno sviluppatore umano, Codex dà il meglio di sé in ambienti ben documentati e strutturati. Tuttavia, mostra prestazioni elevate anche senza questi file o configurazioni specifiche.

OpenAI Codex
23 campioni verificati da SWE-Bench che non erano eseguibili sulla nostra infrastruttura interna sono stati esclusi. codex-1 è stato testato con una lunghezza massima del contesto di 192k token e uno “sforzo di ragionamento” medio, che è l’impostazione che sarà disponibile oggi nel prodotto.

Codex OpenAI: sicurezza e trasparenza al primo posto

Codex viene rilasciato come anteprima di ricerca, seguendo l’approccio di distribuzione graduale di OpenAI. È stato progettato con un’attenzione particolare alla trasparenza e alla possibilità di verifica da parte dell’utente. In caso di errori o incertezze, l’agente segnala chiaramente i problemi riscontrati, lasciando all’utente la decisione finale sull’integrazione del codice. La validazione manuale del codice generato resta comunque essenziale.


Output allineati agli standard umani

Uno degli obiettivi principali nell’addestramento di codex-1 è stato l’allineamento alle preferenze e agli standard di sviluppo umano. Rispetto al modello o3, codex-1 produce patch più pulite, pronte per essere esaminate e integrate nel flusso di lavoro quotidiano.

OpenAI Codex

Misure contro gli abusi

Per prevenire l’uso malevolo dell’AI, come la creazione di malware, Codex è stato addestrato a rifiutare in modo preciso richieste sospette, distinguendo con attenzione tra utilizzi leciti e illeciti. La policy di sicurezza è stata rafforzata e dettagliata in un addendum alla System Card del modello o3.


Esecuzione sicura e protetta

Durante l’esecuzione dei compiti, l’agente Codex opera in un container isolato nel cloud, senza accesso a Internet. Può interagire solo con il codice fornito tramite repository GitHub e con dipendenze definite da uno script di setup.

Video OpenAI Codex


Codex di OpenAI: casi d’uso reali

I team tecnici di OpenAI già utilizzano Codex per automatizzare attività ripetitive, come il refactoring o la scrittura di test. Codex si dimostra utile anche per sviluppare nuove funzionalità, documentare e mantenere il flusso di lavoro fluido.

OpenAI ha coinvolto diversi partner per testarne le capacità:

  • Cisco lo utilizza per accelerare l’innovazione, esplorando casi d’uso reali.
  • Temporal sfrutta Codex per lo sviluppo di funzionalità, debugging e refactoring.
  • Superhuman ne beneficia per automatizzare attività ripetitive e velocizzare la delivery.
  • Kodiak lo impiega nello sviluppo del proprio sistema di guida autonoma, come strumento di supporto e riferimento.

Video Codex OpenAI

Codex CLI: agenti leggeri nella console

OpenAI ha rilasciato anche Codex CLI, un agente open-source da terminale che integra modelli come o3 e o4-mini. Oggi è disponibile una versione più piccola, codex-mini-latest, ottimizzata per interazioni a bassa latenza e pronta per l’uso in locale o via API.

Gli utenti Plus e Pro possono registrarsi con il proprio account ChatGPT, ricevere crediti gratuiti (5 dollari e 50 dollari rispettivamente) e generare automaticamente il token API.


Codex di OpenAI: disponibilità, costi e limiti

Codex è ora disponibile per gli utenti ChatGPT Pro, Enterprise e Team, mentre gli utenti Plus ed Edu saranno supportati a breve. Per alcune settimane, l’utilizzo sarà gratuito e illimitato. In seguito verranno introdotte tariffe flessibili basate sul consumo.

Per chi usa codex-mini-latest tramite API, il prezzo è di 1,50 dollari per milione di token input e 6 dollari per milione di token output, con sconto del 75% grazie al caching dei prompt.

Attualmente, Codex non supporta input visivi per compiti di frontend e non è ancora in grado di ricevere feedback durante l’esecuzione di un compito. Tuttavia, il modello è destinato a diventare sempre più interattivo e integrato nei flussi di lavoro quotidiani.


Verso un nuovo paradigma collaborativo

OpenAI immagina un futuro in cui gli sviluppatori gestiranno direttamente le attività da svolgere e delegheranno il resto agli agenti AI, aumentando produttività e velocità. L’interazione asincrona con più agenti, introdotta da Codex, potrebbe diventare lo standard di riferimento nello sviluppo software.

La roadmap prevede miglioramenti significativi: feedback durante l’esecuzione, aggiornamenti proattivi e integrazioni con IDE, tracker e sistemi CI. Codex potrebbe così trasformarsi in un vero collaboratore digitale, cambiando il modo in cui si scrive e gestisce il codice.


Codex segna un cambio di paradigma per l’ingegneria del software: un ecosistema AI collaborativo che consente ai team di concentrarsi su ciò che conta davvero. E questo è solo l’inizio.

Articoli correlati

Articolo 1 di 4

OSZAR »