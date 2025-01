OpenAI ha annunciato oggi un’anteprima di ricerca di Operator, un agente che può navigare sul web per eseguire compiti al posto degli utenti.

Operator – spiega OpenAI – si basa su Computer-Using Agent (CUA), un modello che combina le capacità di visione di GPT-4o con un ragionamento avanzato attraverso l’apprendimento potenziato.

CUA è addestrato a interagire con le interfacce grafiche (GUI) – i pulsanti, i menu e i campi di testo usati quotidianamente dagli utenti – dandogli la flessibilità di navigare negli ambienti digitali senza richiedere API specifiche per il sistema operativo o il web.

Per consentire un rollout sicuro e iterativo, questa preview di Operator sarà disponibile per gli utenti Pro negli Stati Uniti all’indirizzo operator.chatgpt.com.

In questo modo, sottolinea OpenAI, Operator potrà imparare dall’utilizzo dei primi utenti e perfezionare le sue funzionalità, migliorando nel tempo. L’obiettivo di OpenAI è di estendere la disponibilità di Operator agli utenti Plus, Team ed Enterprise, nonché di integrare queste funzionalità in ChatGPT.

CUA beneficia dei progressi in termini di ragionamento, multimodalità e sicurezza, ponendo le basi per agenti come Operator affinché possano completare compiti complessi e in più fasi per gli utenti. Questo – afferma OpenAI – è l’inizio di un futuro in cui l’intelligenza artificiale non si limita a fornire informazioni, ma è anche in grado di eseguire autonomamente i flussi di lavoro, aiutando sia le aziende sia i privati.

Inoltre, OpenAI mette in evidenza diaver implementato rigorose misure di sicurezza per garantire un uso sicuro e responsabile di Operator. Maggiori informazioni a questo riguardo sono disponibili nella Scheda di Sistema di Operator.

Durante la live stream con Sam Altman, Yash Kumar (Product Lead for Operator) e i ricercatori del team CUA, Casey Chu e Reiichiro Nakano, si è discusso dello sviluppo di Operator, delle capacità della CUA e dell’impatto più generale degli agenti nell’ecosistema digitale.

È possibile rivedere la live stream su X o YouTube.