Traduzioni in 50 lingue in meno di un secondo grazie all'IA

1 giorno fa 5

AGI - Lara, il modello di intelligenza artificiale di Translated per le traduzioni, ha raggiunto velocità da 10 a 40 volte superiori a quelle dei principali modelli linguistici grazie a un supercomputer di Lenovo.

Progettata per ambienti produttivi ad alto volume, Lara può così offrire quello che prima richiedeva un compromesso: unire la fluidità e le capacità di ragionamento di un grande modello linguistico alla precisione e affidabilità della traduzione automatica, garantendo prestazioni in tempo quasi istantaneo. Per raggiungere questo risultato, Translated ha co-progettando insieme a Lenovo una soluzione hardware dedicata alla traduzione e sviluppando un sistema di decodifica innovativo per sfruttare al massimo le prestazioni dei processori di ultima generazione.

Ottimizzata per contesti critici in termini di latenza, come chat in tempo reale, trading e notizie, Lara oggi raggiunge una latenza inferiore al secondo nelle 50 lingue più parlate al mondo.

È un'innovazione che fissa un nuovo standard per traduzioni di alta qualità e bassa latenza, aprendo la strada a soluzioni economicamente più efficienti, come la traduzione immediata della sola parte di contenuto necessaria, elaborando il resto solo su richiesta.

Per raggiungere queste prestazioni, Lenovo ha fornito i server ThinkSystem basati sulle GPU di NVIDIA, i processori più avanzati al mondo per i carichi di lavoro dell'AI. Ogni server supporta otto delle più recenti GPU interconnesse e ad alta velocità, che alimentano i progressi dell'IA, tra cui i large language model, il machine learning, il training dei modelli e il computing ad alte prestazioni.

I server ThinkSystem sono stati installati in due data center a Washington e in California, strategicamente posizionati vicino ai principali hub internet per mantenere la latenza della rete tra Lara e le principali dorsali di rete sotto al millisecondo. Per migliorare ulteriormente la reattività del sistema, il team di ingegneri di Translated ha progettato una nuova architettura, inedita nel settore della traduzione.

Nell'ambito di una collaborazione a lungo termine, Lenovo e Translated hanno anche siglato un accordo per implementare sistemi di raffreddamento a liquido in tutte le infrastrutture di Translated. Questo permetterà di ridurre il consumo di energia e aumentare la densità delle macchine, a supporto di operazioni di IA più sostenibili e facilmente scalabili.

Leggi l'intero articolo