In che modo SAP e Google Cloud stanno promuovendo l’AI alle aziende attraverso la collaborazione con agenti aperti, scelta dei modelli e intelligence multimodale

Feature

L’AI è sempre più integrata in ogni ambito delle attività di un’azienda, potenziando l’automazione, la conoscenza e il processo decisionale in tutti i sistemi e flussi di lavoro. All’interno della partnership tra SAP e Google Cloud, stiamo abilitando la prossima ondata di AI per il business contribuendo al nuovo protocollo di interoperabilità Agent2Agent (A2A), che getta le basi affinché gli agenti di intelligenza artificiale possano interagire e collaborare in modo sicuro tra le piattaforme.

Questo lavoro è completato da due ulteriori aree di progresso: in primo luogo, l’espansione dei modelli Google Gemini nell’hub di AI generativa di SAP sulla SAP Business Technology Platform (SAP BTP); in secondo luogo, l’utilizzo delle funzionalità di intelligenza video e vocale di Google per supportare la generazione aumentata di recupero (RAG) multimodale per l’apprendimento basato su video e la scoperta delle conoscenze nei prodotti SAP.

Insieme, questi sforzi riflettono un impegno condiviso per fornire un’AI pronta per il business, aperta, flessibile e profondamente radicata nel contesto aziendale.

Riunire gli agenti dell’AI: gettare le basi per l’interoperabilità

Il futuro del lavoro è agentico. Le aziende stanno implementando sempre più agenti di AI che aiutano lo svolgimento di attività reali, risolvendo i problemi dei clienti, gestendo le approvazioni e collaborando tra le funzioni aziendali. Questo è il motivo per cui SAP fornisce con Joule un’architettura agente collaborativa che supporta i flussi di lavoro agentici interfunzionali in SAP Business Suite.

Ma affinché questi agenti forniscano valore reale, non possono operare all’interno di un’unica infrastruttura di fornitori. Devono essere in grado di collaborare su piattaforme diverse, scambiare informazioni in modo sicuro e coordinare le azioni attraverso flussi di lavoro complessi.  Questa necessità di interazione senza soluzione di continuità sottolinea perché il protocollo A2A rappresenta un passo significativo oltre le semplici integrazioni API o gli strumenti avanzati.

Ecco perché SAP si è unita a Google Cloud e ad altri leader come fondatore e dare il proprio contributo al nuovo protocollo A2A. Questo standard aperto è progettato per garantire che gli agenti di vendor diversi possano interagire, condividere il contesto e lavorare insieme, permettendo un’automazione senza soluzione di continuità tra i sistemi tradizionalmente disconnessi.

Considerate ad esempio uno scenario dove un’azienda si trova a risolvere una controversia con un cliente: un responsabile amministrativo riceve una richiesta di fatturazione tramite Gmail. Invece di passare da uno strumento all’altro, può rivolgersi a Joule direttamente dall’e-mail. Joule, in qualità di orchestratore agente, avvia un processo di risoluzione della controversia, coinvolgendo un altro agente Google che si connette a Google BigQuery, dove risiedono i dati di magazzino transazionali rilevanti. Insieme, gli agenti validano il problema, recuperano analisi e raccomandano una risoluzione, senza cambio manuale di sistema, riconciliazione dei dati o perdita di contesto.

Questo è il tipo di collaborazione multipiattaforma che il protocollo A2A consente: gli agenti AI lavorano insieme per accelerare i risultati di business, ridurre gli attriti e permettere alle persone di concentrarsi su compiti più strategici. Rafforza inoltre la visione di SAP per Joule come agente orchestratore che lavora in tutti i flussi di lavoro di un’organizzazione: interoperabile, proattivo e profondamente connesso al contesto aziendale.

Ampliamento dell’accesso ai modelli Google nell’hub di AI generativa

Oltre all’interoperabilità degli agenti, SAP sta promuovendo il suo impegno a favore dell’apertura e della flessibilità ampliando l’accesso ai modelli Google nell’AI generative hub, una funzionalità chiave della AI Foundation su SAP BTP.

Attraverso l’AI generative hub, i clienti ottengono l’accesso di livello enterprise a un portafoglio di modelli  base, che include ora Google Gemini 2.0 Flash e Flash-lite, che aderiscono al supporto esistente per i modelli Gemini 1.5 già disponibili tramite l’hub.

Questa scelta estesa di modelli offre ai clienti la flessibilità di creare ed estendere soluzioni basate sull’AI utilizzando modelli ad alte prestazioni e a bassa latenza ottimizzati per i carichi di lavoro, pur rimanendo all’interno dell’ambiente protetto e ricco di contesto aziendale di SAP.

Combinando l’innovazione dei modelli di Google con la profonda comprensione dei processi di business da parte di SAP, consentiamo ai clienti di applicare l’AI generativa in modi non solo potenti, ma anche pratici, affidabili e pienamente allineati con il modo in cui operano le imprese.

La comprensione multimodale con Google Video Intelligence

Nell’ambito della continua collaborazione con Google Cloud, SAP sta inoltre promuovendo la RAG multimodale, una funzionalità altamente richiesta dai clienti SAP, in particolare per i contenuti di apprendimento basati su video.

La RAG multimodale migliora il recupero e la generazione delle informazioni integrando molteplici modalità di dati – testo, immagini, audio e video – in un unico processo strutturato. Questo approccio arricchisce il sourcing delle conoscenze ed eleva il modo in cui gli utenti interagiscono con i materiali di formazione e supporto.

Per risolvere la complessità dell’estrazione di insight significativi dai contenuti video, SAP sfrutta Google Video Intelligence per il rilevamento del testo su schermo tra i fotogrammi video e l’API Speech-to-Text di Google per una trascrizione accurata dell’audio. Durante il processo di indicizzazione, questi output vengono memorizzati con i timestamp corrispondenti, creando una base strutturata per recuperare i segmenti video rilevanti con precisione.

Mettendo a terra contenuti audio e visivi con metadati con allineamento temporale, SAP consente agli utenti di cercare e recuperare momenti specifici e contestualmente rilevanti all’interno di un video, rendendo l’esperienza di apprendimento più intuitiva, accessibile e di grande impatto.

“Man mano che l’AI agentica si evolve, la gestione fluida dei dati multimodali – testo, voce, video e immagini – diventa fondamentale”, ha dichiarato Miku Jha, direttore di AI/ML e Generative AI di Google Cloud. “Questo introduce sfide significative per l’interoperabilità degli agenti. È quindi indispensabile un protocollo aperto come A2A, che fornisca il quadro e la flessibilità necessari agli agenti per comunicare e collaborare efficacemente attraverso queste diverse modalità. La multimodalità non è semplicemente una capacità, è un requisito fondamentale che guida la prossima generazione di sistemi agentici interconnessi.”

Questo è un altro esempio di come SAP sta integrando le funzionalità AI di Google in scenari rilevanti per il business, aiutando i clienti a sbloccare più valore dai loro contenuti non strutturati e ad elevare il modo in cui le conoscenze vengono fornite in tutta l’azienda.

Visione condivisa per l’AI aziendale

Questi sforzi riflettono un più ampio allineamento strategico tra SAP e Google Cloud: una convinzione condivisa nell’AI che è aperta, componibile e basata su un contesto aziendale reale. Che si tratti di definire standard emergenti per la collaborazione con gli agenti, di offrire la scelta attraverso modelli best-in-class o di rendere fruibili contenuti non strutturati, ci concentriamo sull’aiutare i nostri clienti a innovare con sicurezza, oggi e nel futuro.

Per saperne di più su come SAP e Google Cloud stanno plasmando il futuro dell’AI aziendale, visita sap.com/ai.