Ricercatori Apple hanno pubblicato un paper di ricerca che, secondo il team di autori, come gli LLM possano essere utilizzati per creare un sistema AI estremamente efficace per risolvere riferimenti di vario tipo, mostrando come la reference resolution possa essere convertita in un problema di modellazione linguistica, nonostante coinvolga forme di entità come quelle sullo schermo che non sono tradizionalmente adatte a essere ridotte a una modalità solo testuale.

La reference resolution – sottolineano i ricercatori Apple nell’abstract del paper – è un problema importante, essenziale per comprendere e gestire con successo contesti di diverso tipo. Questo contesto comprende sia gli scambi precedenti sia il contesto che riguarda entità non conversazionali, come ad esempio le entità sullo schermo dell’utente o quelle in esecuzione in background.

Mentre gli LLM hanno dimostrato di essere hanno dimostrato di essere estremamente potenti per una serie di compiti, il loro uso nella reference resolution, in particolare per le entità non conversazionali, rimane sottoutilizzato. Ed è qui che il team mette in evidenza l’importanza del paper, che dimostra come gli LLM possano essere utilizzati per creare un sistema efficace per risolvere riferimenti di vario tipo.

Secondo i ricercatori, il gruppo di lavoro ha dimostrato ampi miglioramenti rispetto a un sistema esistente con funzionalità simili per diversi tipi di riferimenti, con il modello più piccolo del team di Apple che ha ottenuto guadagni assoluti di oltre il 5% per i riferimenti on-screen.

I ricercatori hanno inoltre effettuato un benchmark con GPT-3.5 e GPT-4, con il modello più piccolo di Apple che ha ottenuto prestazioni paragonabili a quelle di GPT-4, mentre i modelli più grandi lo hanno addirittura superato in modo sostanziale.

Il sistema, che dà anche il titolo al paper, è stato denominato ReALM: Reference Resolution As Language Modeling.

La ricerca è firmata da Joel Ruben Antony Moniz, Soundarya Krishnan, Melis Ozyildirim, Prathamesh Saraf, Halim Cagri Ates, Yuan Zhang, Hong Yu e Nidhi Rajshree: un team di ingegneri Apple specializzati in machine learning e intelligenza artificiale.