DevOps & AI Automation

Project Management Agentivo: da Task a Pull Request in Autonomia

Piattaforma SaaS multi-tenant dove i task di sviluppo vengono eseguiti autonomamente da agenti AI orchestrati: studio della codebase, implementazione in container isolati, test automatici e apertura della pull request — senza intervento manuale dello sviluppatore.

Stack

.NET 10 + Blazor ServerDocker (container isolation)RabbitMQ + RedisMongoDB + SQL ServerOpenRouter (Claude, GPT)

Risultati

  • Da task scritto a pull request pronta: 15–30 minuti autonomi
  • Riduzione del 70% del tempo di implementazione per task standard
  • Parallelizzazione su N agenti dev + tester concorrenti
  • Memory cumulativa: ogni esecuzione migliora la conoscenza della codebase
  • Durable execution: recovery completo dopo crash del worker

Il Problema

I tool di project management — da Jira a Linear — eccellono nel tracciare e organizzare il lavoro, ma non colmano il gap più costoso del ciclo di sviluppo: la traduzione di un task scritto in codice funzionante. Un task da 30 minuti di pianificazione richiede ancora 2–3 ore di implementazione, code review e apertura della PR. Su team che gestiscono decine di task paralleli, questo overhead si accumula in settimane di lavoro ad alto valore sostituibile.

Il problema non è la velocità del singolo sviluppatore: è che l'esecuzione rimane interamente dipendente dall'attenzione umana. Un task in backlog aspetta finché qualcuno non lo prende in carico. Non esiste un modo per parallelizzare l'implementazione oltre la dimensione del team.

La Soluzione

Abbiamo costruito una piattaforma SaaS di project management agentivo: i task vengono creati come in qualsiasi tool Kanban, ma quando l'utente clicca "Esegui con agente", un'orchestrazione di agenti AI ne porta a termine l'implementazione in autonomia.

Orchestrazione multi-agente specializzata: ogni esecuzione attiva tre tipologie di agente con ruoli distinti. L'agente PM studia la codebase (legge README, analizza la storia dei commit, identifica le convenzioni di branching), suddivide il task in sottotask atomici e coordina l'intera sequenza. Gli agenti Developer — fino a N in parallelo — operano ciascuno in un container Docker isolato: clonano il repository, implementano la feature, eseguono i test unitari, fanno commit e push sul branch creato. Gli agenti Tester verificano la qualità dell'implementazione complessiva, segnalano i fallimenti e, se necessario, attivano un ciclo correttivo automatico fino a 2 iterazioni.

Durable execution e resilienza: ogni fase è persistita come evento immutabile. Se il worker si interrompe nel mezzo di un'esecuzione, al riavvio il sistema rileva i container orfani, ricostruisce lo stato completo dalla sequenza eventi e riprende dal punto esatto di interruzione — senza perdita di contesto e senza intervento manuale.

Memory cumulativa per codebase: al termine di ogni esecuzione, un agente leggero estrae i fatti architetturali rilevanti — convenzioni di naming, pattern ricorrenti, aree critiche — e li archivia in un database semantico vettoriale per tenant. Le esecuzioni successive attingono a questa memoria: l'agente PM del task successivo già conosce la struttura del progetto senza doverla ristudiare da zero.

Live streaming UI: dall'interfaccia Blazor, l'utente segue in tempo reale ogni azione degli agenti: quale file viene letto, quale riga viene modificata, quali test passano o falliscono. Al termine, la pull request è già aperta sul repository, con descrizione generata automaticamente.

I Risultati

Un task che richiede 2–3 ore di lavoro umano viene completato in 15–30 minuti di esecuzione autonoma, con una pull request pronta per la revisione. La parallelizzazione su più agenti developer consente di lavorare su più sottotask simultaneamente, eliminando il collo di bottiglia sequenziale dell'implementazione umana.

Il costo per esecuzione — cumulato su planning, implementazione e test — si attesta tra $0,50 e $1,50 in chiamate API, comparabile al costo marginale di pochi minuti di sviluppatore senior.

Il sistema è in produzione multi-tenant e viene utilizzato per lo sviluppo iterativo di prodotti software complessi. La qualità delle PR generate migliora con ogni esecuzione, grazie alla memoria cumulativa sulla codebase.

Costruiamo qualcosa insieme

Raccontaci il tuo caso. Ti diremo come affrontarlo e in quanto tempo.