L'intelligenza artificiale ha ancora un problema di allucinazioni: come MongoDB mira a risolverlo con reranker avanzati e modelli di incorporamento

Iscriviti alle nostre newsletter giornaliere e settimanali per gli ultimi aggiornamenti e contenuti esclusivi sulla copertura AI leader del settore. Scopri di più
Per ottenere il miglior risultato possibile da una query di intelligenza artificiale, le organizzazioni necessitano dei migliori dati possibili.
La risposta che molte organizzazioni hanno dovuto superare per superare questa sfida è la generazione aumentata dal recupero (RAG). Con RAG, i risultati sono basati sui dati di un database. A quanto pare, però, non tutti i RAG sono uguali e ottimizzare effettivamente un database per ottenere i migliori risultati possibili può essere una sfida.
Il fornitore di database MongoDB non è estraneo al mondo dell'IA o RAG. Il database omonimo dell'azienda è già utilizzato per RAG e MongoDB ha anche lanciato iniziative di sviluppo di applicazioni AI . Mentre l'azienda e i suoi utenti, come il gigante medico Novo Nordisk , hanno avuto successo con l'IA di generazione, c'è ancora molto da fare.
In particolare, allucinazioni e accuratezza continuano a essere un problema che impedisce ad alcune organizzazioni di mettere in produzione l'intelligenza artificiale di generazione. A tal fine, MongoDB ha annunciato oggi l'acquisizione di Voyage AI , una società privata che sviluppa modelli avanzati di incorporamento e recupero. Voyage ha raccolto 20 milioni di dollari di finanziamenti nell'ottobre 2024 in un round supportato dal gigante dei dati cloud Snowflake. L'acquisizione porterà l'esperienza di Voyage AI nell'incorporamento della generazione e del riclassificazione, componenti fondamentali per la ricerca e il recupero basati sull'intelligenza artificiale, direttamente nella piattaforma di database di MongoDB.
"Nell'ultimo anno, e in particolare mentre le organizzazioni hanno cercato di pensare a come avrebbero potuto creare applicazioni basate sull'intelligenza artificiale, è diventato sempre più chiaro che la qualità e l'affidabilità delle applicazioni che creano, o la loro mancanza, stavano diventando uno degli ostacoli all'applicazione dell'intelligenza artificiale nei casi d'uso critici per la missione", ha affermato Sahir Azam, CPO di MongoDB, a VentureBeat.
L'idea di base di RAG è che, invece di basarsi semplicemente su una base di conoscenza costituita da dati addestrati, il motore di intelligenza artificiale di generazione può ottenere dati concreti da un database.
Creare RAG altamente accurati è piuttosto complesso e c'è ancora un potenziale rischio di allucinazioni, una sfida affrontata da MongoDB e dai suoi utenti. Mentre Azam ha rifiutato di fornire un esempio specifico o un incidente in cui gen AI RAG ha fallito un utente, ha fatto notare che l'accuratezza è sempre una preoccupazione.
Migliorare l'accuratezza e ridurre le allucinazioni comporta più passaggi. Il primo è migliorare la qualità del recupero (la "R" di RAG).
"In molti casi, la qualità del recupero non è abbastanza buona", ha detto a VentureBeat Tengyu Ma, fondatore e CEO di Voyage AI. "Nella fase di recupero, se non recuperano informazioni rilevanti, allora il recupero non è molto utile e il modello linguistico di grandi dimensioni (LLM) allucina perché deve indovinare un po' di contesto".
I modelli di intelligenza artificiale di Voyage, ora inclusi in MongoDB, contribuiscono a migliorare RAG in alcuni modi fondamentali:
- Modelli e riclassificatori specifici per dominio: vengono addestrati su grandi quantità di dati non strutturati provenienti da settori verticali specifici, consentendo loro di comprendere meglio la terminologia e la semantica di tali domini.
- Personalizzazione e messa a punto: gli utenti possono mettere a punto il meccanismo di recupero per set di dati e casi d'uso unici.

MongoDB non è il primo o l'unico vendor a riconoscere la necessità e il valore di avere una tecnologia di embedding e re-ranker altamente ottimizzata. Dopotutto, questo è uno dei motivi per cui Snowflake ha investito in Voyage AI e sta utilizzando i modelli dell'azienda.
È importante notare che, anche dopo essere stati acquisiti da MongoDB, i modelli di Voyage AI saranno ancora disponibili per Snowflake e per gli altri utenti di Voyage AI. La grande differenza è che Voyage AI sarà ora sempre più integrato nelle piattaforme di database di MongoDB.
L'integrazione diretta di modelli di embedding avanzati in un database è un approccio adottato anche da altri fornitori di database rivali. A giugno 2024, DataStax ha annunciato la propria tecnologia RAGStack che combina modelli di embedding e retrieval avanzati.
Azam ha sostenuto che MongoDB è un po' diverso, però. Innanzitutto, è un database operativo, al contrario di un database analitico. Inoltre, al contrario di fornire semplicemente approfondimenti e analisi, MongoDB aiuta a potenziare le transazioni e le operazioni nel mondo reale. MongoDB è anche ciò che è noto come un "database modello di documento", che ha una struttura diversa da un database relazionale tradizionale. Tale struttura non si basa su colonne e tabelle, che non sono particolarmente adatte a rappresentare informazioni su dati non strutturati (un elemento critico per le applicazioni AI).
"Siamo l'unica tecnologia di database che combina la gestione dei metadati sulle informazioni di un cliente, le operazioni e le transazioni, che rappresentano il cuore pulsante di ciò che accade nel business, nonché la base per il recupero, il tutto con un unico sistema", ha affermato Azam.
La necessità di modelli di incorporamento e recupero estremamente accurati è ulteriormente accelerata dall'intelligenza artificiale agentiva.
"L'intelligenza artificiale agentica ha ancora bisogno di metodi di recupero, perché un agente non può prendere decisioni fuori dal contesto", ha affermato Ma. "A volte, in realtà, vengono utilizzati più componenti di recupero anche in una sola decisione".
Ma ha osservato che Voyage AI sta attualmente lavorando su modelli specifici altamente personalizzati per i casi d'uso dell'AI agentica. Ha spiegato che l'AI agentica può utilizzare diversi tipi di query che possono comunque trarre vantaggio da una maggiore ottimizzazione.
Poiché la gen AI si sta sempre più spostando verso casi d'uso operativi, la necessità di eliminare il rischio di allucinazioni è chiaramente fondamentale. Mentre MongoDB ha avuto successo con la gen AI, Azam si aspetta che l'integrazione di Voyage AI apra nuovi casi d'uso mission critical.
"Se ora possiamo dire, 'Ehi, possiamo darti una precisione ben oltre il 90% per le tue applicazioni che oggi, in alcuni casi, possono raggiungere solo il 30 o il 60% di precisione nei risultati', l'apertura si allarga in termini di tipi di opportunità a cui le persone possono applicare l'intelligenza artificiale nelle loro applicazioni software", ha affermato Azam.
Se vuoi impressionare il tuo capo, VB Daily ha quello che fa per te. Ti diamo informazioni privilegiate su cosa stanno facendo le aziende con l'intelligenza artificiale generativa, dai cambiamenti normativi alle implementazioni pratiche, così puoi condividere approfondimenti per il massimo ROI.
Leggi la nostra Informativa sulla Privacy
Grazie per esserti iscritto. Scopri altre newsletter VB qui .
Si è verificato un errore.

venturebeat