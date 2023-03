Summarizer è l’ultima funzione potenziata dall’intelligenza artificiale di Brave Search, il motore di ricerca focalizzato sulla privacy di Brave Software, società sviluppatrice anche del browser Brave.

Summarizer – spiega il team del motore di ricerca – fornisce risposte concise e puntuali in cima alle pagine dei risultati di Brave Search, in risposta alle indicazioni dell’utente, basandosi esclusivamente sui risultati delle ricerche sul web.

Brave sottolinea che, a differenza di un modello di intelligenza artificiale puramente generativo, che è incline a fare affermazioni prive di fondamento, il team di sviluppo di Summarizer ha addestrato i modelli linguistici di grandi dimensioni (LLM, large language model) a elaborare più fonti di informazioni presenti sul web. Questo, dal punto di vista dell’azienda, produce una risposta più concisa e accurata, espressa in un linguaggio coerente.

Inoltre, la provenienza delle fonti originali dei dati è sempre citata tramite link, mette ancora in evidenza Brave. In questo modo si mantiene la giusta attribuzione delle informazioni e si aiuta gli utenti a valutare l’attendibilità delle fonti, entrambi elementi necessari per mitigare l’authority bias dei large language model.

La funzionalità Summarizer è disponibile per tutti gli utenti di Brave Search, su desktop e mobile. Gli utenti che preferiscono non utilizzare Summarizer, inoltre, possono disattivarlo facilmente nelle impostazioni.

L’uso dei risultati del web consente a Summarizer di fornire informazioni in tempo reale, aggiornate agli eventi del giorno. Brave sottolinea però anche come, visti gli attuali progressi dell’intelligenza artificiale, sia fondamentale ricordare agli utenti che non bisogna credere a tutto ciò che un sistema di AI produce, proprio come non bisogna credere a tutto ciò che viene pubblicato sul web. A rischio di affermare l’ovvio, dichiara l’azienda, non dovremmo sospendere il pensiero critico per qualsiasi prodotto o contenuto consumiamo, a prescindere da quanto possano essere impressionanti i risultati dei modelli di intelligenza artificiale.

Oltre al riassunto in sé, i modelli di intelligenza artificiale di Brave sono in grado di sostituire gli snippet (le descrizioni dei risultati) dipendenti dalla query con una versione riepilogativa di tali snippet, evidenziando la risposta quando possibile. Questa può essere vista come un riassunto di una singola fonte (come un articolo di stampa), in contrapposizione al riassunto principale in cui più fonti sono considerate e aggregate per creare una risposta più completa.

Chiaramente, Brave si rende perfettamente conto che quello dell’intelligenza artificiale integrata nei motori di ricerca è un trend già in fase avanzata di implementazione anche per i colossi del settore. E ci tiene a differenziarsi.

A differenza di molti altri che hanno rilasciato funzioni simili di recente, afferma la società sviluppatrice, Brave non si affida a terzi, né limita l’accesso per problemi di scalabilità. Brave Summarizer si basa su modelli di proprietà e gestiti dalla stessa azienda, che sono altamente calibrati per essere quanto più efficienti possibile al momento dell’inferenza.

Oggi – afferma l’azienda – Brave Search elabora ogni giorno picchi di 600 query al secondo, che vengono poi valutate con il modello di intelligenza artificiale dell’azienda. Sebbene venga generato un riepilogo per circa il 17% delle query, il team di sviluppo si aspetta che questo numero cresca nel prossimo futuro, man mano che l’azienda scala il suo sistema.

Brave sostiene che il suo modello AI è probabilmente il più grande sistema di questo tipo in produzione fino ad oggi, in quanto riceve più traffico di altri in termini di query al secondo, applica il riassunto a tutte le query e Bing e Google non hanno ancora aperto del tutto i loro sistemi.

Oltre alla scalabilità, Brave ha assicurato di aver fatto un enorme sforzo anche per garantire la qualità dei riassunti generati. Tuttavia, poiché il modello è ancora in fase iniziale di sviluppo, esiste la possibilità di produrre cosiddette “allucinazioni“, che mescolano frammenti non correlati in un unico risultato. C’è anche la possibilità che si producano testi falsi o offensivi, ma l’obiettivo dichiarato dell’azienda è quello di continuare a lavorare per migliorare i modelli man mano che i feedback degli utenti inizieranno ad arrivare.

Summarizer è stato interamente sviluppato dal team di Brave Search e come tale si basa sugli stessi principi di indipendenza e privacy che l’azienda applica a tutti i prodotti. Summarizer non è alimentato da ChatGPT o dai suoi sistemi di backend; è invece composto da tre diversi LLM addestrati su compiti diversi:

Il primo è QA (question answering) : questo modello viene utilizzato per cercare di estrarre una risposta concreta, se esiste, da frammenti di testo. Brave utilizza da tempo gli LLM per migliorare la pertinenza delle ricerche e questa è un’estensione di ciò che Brave Search già utilizzava per alimentare le sue funzioni di knowledge graph e featured snippets. La differenza sta nel numero e nella lunghezza degli snippet di testo analizzati.

: questo modello viene utilizzato per cercare di estrarre una risposta concreta, se esiste, da frammenti di testo. Brave utilizza da tempo gli LLM per migliorare la pertinenza delle ricerche e questa è un’estensione di ciò che Brave Search già utilizzava per alimentare le sue funzioni di knowledge graph e featured snippets. La differenza sta nel numero e nella lunghezza degli snippet di testo analizzati. Dopo la fase di estrazione del QA, i risultati candidati vengono ulteriormente classificati con un insieme di zero-shot classifier in base a un’ampia varietà di criteri (parole d’odio, testi volgari, spam e così via).

con un insieme di zero-shot classifier in base a un’ampia varietà di criteri (parole d’odio, testi volgari, e così via). L’insieme finale di testi candidati viene infine elaborato dal modello di riassunto/parafrasi, che cerca di riscrivere l’input in modo da eliminare le ripetizioni e mantenere il linguaggio uniforme per migliorare la leggibilità.

Benché il settore stia generando molto clamore intorno all’AI, Brave afferma di non essere ancora convinta che i modelli LLM possano sostituire la ricerca come la conosciamo oggi. Tuttavia, secondo Brave, se usati correttamente, questi nuovi modelli possono aiutare l’utente a navigare tra i risultati, ed è questo l’approccio che l’azienda segue con Summarizer.

Inoltre, l’azienda sviluppatrice crede fermamente in qualsiasi nuova tecnologia che aiuti gli utenti a soddisfare le loro esigenze e li metta in grado di controllare la loro esperienza online. Pertanto, continuerà a studiare come applicare i modelli LLM non solo al campo della ricerca, ma anche al browser Brave, dove si aspetta che le capacità di assistenza dell’intelligenza artificiale possano essere davvero fruttuose e rivoluzionarie.

Brave si propone come alternativa credibile alle BigTech. Il browser Brave ha oltre 57 milioni di utenti attivi mensili e Brave Search serve più di 22 milioni di query al giorno dal suo indice indipendente, il che – afferma l’azienda – lo rende il più grande motore di ricerca dopo Bing, Google e altri motori che si affidano alle API di Bing o Google.

Brave Search è disponibile su tutti i browser Brave (desktop, Android e iOS) ed è disponibile anche da qualsiasi altro browser all’indirizzo search.brave.com.