Se stai ancora aspettando che l'AI faccia qualcosa di utile per la tua azienda, questa settimana ti dà dodici buoni motivi per smettere di aspettare.
Partiamo da casa nostra. Marketing Hackers ha lanciato AI Team, un sistema di agenti coordinati che gestisce social, immagini, video per TikTok, analisi dei competitor e persino email, calendari e fatturazione base, il tutto via WhatsApp e altri 20 canali, con 250 integrazioni disponibili tra cui Gmail e Shopify. Secondo i dati di Mentally.ai, sistemi agentici di questo tipo riducono il data entry tra il 70 e il 95%. Le preiscrizioni sono aperte.
Mentre tu aspetti che qualcuno visiti il tuo sito, il traffico dai motori AI è cresciuto del 1.490%. Amazon lavora con OpenAI su AWS, Walmart e Shopify hanno stretto accordi con Google per vendere direttamente dentro Gemini, e Shopify ha introdotto lo Universal Commerce Protocol per completare l'intero checkout senza che l'utente apra mai una scheda del browser. Trustpilot, nel frattempo, ha capito che le recensioni sono il carburante delle raccomandazioni AI ed è diventata il quinto dominio più citato su ChatGPT. Il tuo sito non è più il punto di arrivo del cliente. Forse non è nemmeno più il punto di partenza.
Sul fronte degli strumenti, il 26 marzo Google ha presentato Gemini 3.1 Flash Live, un modello audio-to-audio nativo con finestra di contesto da 128K token, supporto per oltre 90 lingue e memoria dei thread raddoppiata rispetto alla serie 2.5, niente più pause artificiali che tradiscono il bot, niente più ripetizioni per l'utente. Lo stesso giorno Mistral ha lanciato Voxtral TTS, 4 miliardi di parametri, latenza tra 70 e 90 millisecondi, clonazione vocale da 3-5 secondi di audio di riferimento, e nei test di preferenza umana ha superato ElevenLabs Flash v2.5 nel 68,4% dei casi. Chi costruisce agenti conversazionali ha ora due opzioni concrete in più.
Google ha anche introdotto su Gemini due funzioni per importare memoria e cronologia da ChatGPT e Claude, file ZIP fino a 5 GB, fino a 5 caricamenti al giorno. È importante precisare che gli utenti residenti nello Spazio Economico Europeo, nel Regno Unito e in Svizzera non possono accedere a questa funzionalità a causa delle vigenti disposizioni normative.
Dopo l'acquisizione avvenuta nel giugno 2025, Wix ha integrato la tecnologia di Base44 attraverso la nuova funzione Start from URL, la quale permette di generare un'applicazione in meno di sessanta secondi semplicemente incollando un indirizzo web. Il sistema riproduce fedelmente l'aspetto grafico del sito originale e offre agli utenti la possibilità di scegliere tra due diverse opzioni di configurazione, denominate Content & Design e Design only, a seconda delle specifiche necessità di sviluppo. Il risparmio di tempo è reale, ma la responsabilità legale per eventuali violazioni di copyright ricade interamente sull'utente finale.
Suno ha reso disponibile la versione 5.5 introducendo alcune novità, tra cui Voices per la clonazione vocale, Custom Models per l'addestramento di generatori musicali basati sul proprio catalogo e My Taste per l'applicazione automatica di generi e stili preferiti. Mentre la funzione My Taste risulta utilizzabile anche dagli utenti con piano gratuito, l'accesso alle altre due opzioni rimane vincolato alla sottoscrizione degli abbonamenti Pro e Premier.
Dalla Cina arriva GLM-5.1 di Zhipu AI, architettura Mixture-of-Experts con 744 miliardi di parametri totali e 40 miliardi attivi per inferenza, addestrato su 28,5 trilioni di token usando esclusivamente 100.000 chip Huawei Ascend 910B, zero dipendenza dalla filiera occidentale dei semiconduttori. Sui benchmark di coding agentico segna 45,3 contro i 47,9 di Claude 4.6 di Anthropic, il 94,6% delle prestazioni del rivale a circa un settimo del costo API. I pesi saranno rilasciati open-source con licenza MIT.
Sul fronte della monetizzazione dell'identità digitale, Wired riporta che un numero crescente di performer dell'industria per adulti sta cedendo la propria immagine a piattaforme come OhChat, My.Club, Joi AI e SinfulX AI per creare digital twin attivi 24 ore su 24.L'impatto di questa tendenza va oltre tale ambito, dato che Khaby Lame ha sottoscritto un contratto dal valore di 975 milioni di dollari per concedere in licenza la propria controparte digitale, stando a quanto riportato da Mondaq.
Con 311 voti contrari espressi lo scorso 26 marzo, il Parlamento Europeo ha respinto la proroga della deroga alla direttiva e-Privacy, stabilendo che dal 3 aprile 2026 diventerà illegale il sistema Chat Control che consentiva a piattaforme come Meta, Google e LinkedIn di analizzare le conversazioni private degli utenti in assenza di sospetti mirati.Le istituzioni stanno negoziando Chat Control 2.0.
Meta AI ha presentato TRIBE v2, Trimodal Brain Encoder, un modello addestrato su oltre 500 ore di fMRI provenienti da 700 partecipanti, capace di prevedere l'attivazione di circa 1.000 regioni cerebrali in risposta a video, audio e testo, spiegando fino al 54% della varianza dell'attività cerebrale nelle aree sensoriali. Meta lo presenta come progetto scientifico. Chi lavora con i contenuti sa già che un sistema in grado di prevedere quali stimoli attivano con più forza determinate aree cerebrali non resterà confinato ai laboratori di neuroimaging.
Tutto questo è successo in una settimana. Gli approfondimenti sono qui sotto.
Marketing Hackers lancia AI Team, il primo sistema agentico per PMI italiane a partire dal 5 euro al giorno.
Fonte: Marketing Hackers
Un team di agenti AI coordinati che gestisce marketing, social e amministrazione al posto dell'imprenditore

Report Gartner ha predetto che si stima che il 30% di task aziendali automatizzati entro il 2026 ed ecco che ti veniamo in soccorso.
Marketing Hackers ha lanciato AI Team, un sistema che coordina diversi agenti di intelligenza artificiale specializzati per automatizzare le attività di marketing e amministrazione delle PMI italiane. La differenza rispetto ai chatbot è che un chatbot risponde a una domanda alla volta e si ferma lì, un sistema agentico pianifica in autonomia, esegue task complessi su più passaggi e interagisce con strumenti esterni. In pratica, gli agenti di AI Team collaborano tra loro per gestire i canali social, creare immagini professionali, produrre video pronti per TikTok e analizzare i competitor, senza che l'utente debba possedere competenze tecniche.
Il perimetro operativo va oltre il marketing. Tramite WhatsApp e altri 20 canali supportati, gli imprenditori possono delegare compiti amministrativi come la gestione di email, calendari e fatturazione base attraverso.
Secondo i dati raccolti da Mentally.ai, sistemi agentici di questo tipo possono ridurre il data entry fino al 70-95%, con un miglioramento progressivo basato sul feedback umano. Le oltre 250 integrazioni disponibili, tra cui Gmail e Shopify, permettono agli agenti di interfacciarsi con i software già in uso dall'azienda, dai CRM agli ERP, senza richiedere la sostituzione degli strumenti esistenti.
Per quanto riguarda la protezione delle informazioni, Marketing Hackers assicura un'infrastruttura localizzata in Europa che rispetta pienamente il GDPR, applicando una politica di zero data training che impedisce l'impiego dei dati degli utenti per l'addestramento dei modelli. Le dinamiche del mercato italiano previste per il 2026 impongono ai sistemi agentici l'adozione di protocolli di Governance dell'Autonomia insieme ad architetture Human-in-the-loop, garantendo che le scelte di maggiore importanza rimangano sotto la supervisione diretta delle persone, aspetto che costituisce il fulcro dell'intero sistema..
Le preiscrizioni sono aperte sul sito ufficiale di Marketing Hackers per 20 posti, con un prezzo riservato ai primi adottanti e supporto personalizzato per l'implementazione. Per chi gestisce una PMI e spende ore ogni settimana su task ripetitivi, il punto da valutare è quanto tempo si libera delegando a un sistema che non dorme, non dimentica e si collega già agli strumenti che si usano ogni giorno.
Trustpilot integra le recensioni nei modelli IA. Il traffico dai motori intelligenti cresce del 1.490%
Fonte: AI News
Il sito web non è più il primo punto di contatto con il cliente, e i big del retail si stanno già adeguando
Gli utenti stanno abbandonando la ricerca tradizionale per affidarsi agli agenti IA quando devono comprare qualcosa online. Il traffico proveniente dai motori di intelligenza artificiale è cresciuto del 1.490%, di cui, secondo Perplexity, il 68% di questo traffico è 'bottom of funnel' (intento transazionale diretto), cioè gente che vuole comprare. Trustpilot sta integrando i propri dataset di recensioni direttamente nei Large Language Models per alimentare le raccomandazioni degli assistenti virtuali, diventando il quinto dominio più citato su ChatGPT.
Se un consumatore chiede a un chatbot quale aspirapolvere comprare, quel chatbot ha bisogno di dati reali su cui basare la risposta, e le recensioni degli utenti sono esattamente quel tipo di dato. Trustpilot lo ha capito e si è posizionata come fornitore di prove sociali verificate per i modelli linguistici, riducendo la necessità per l'utente di visitare il sito del retailer per farsi un'opinione.
Le partnership che stanno prendendo forma coinvolgono i nomi più pesanti del settore. Amazon collabora con OpenAI su AWS, mentre Walmart e Shopify hanno stretto accordi con Google per consentire acquisti diretti dentro Gemini, il chatbot di Mountain View. Shopify ha fatto un passo ulteriore introducendo lo Universal Commerce Protocol, una tecnologia che permette agli agenti IA di accedere ai dati dei prodotti e completare l'intero checkout senza che l'utente debba mai navigare sul sito del venditore.
Il concetto di "storefront agentico", la transazione avviene interamente dentro un'interfaccia conversazionale, dal primo prompt fino al pagamento.
Per chi gestisce un e-commerce, questa tendenza comporta una perdita concreta di dati di prima parte. Quando la vendita passa attraverso un intermediario IA, il marketer perde visibilità sul comportamento dell'utente prima dell'acquisto. Eppure il volume di vendite generato da questi canali proxy sembra compensare la perdita, almeno per i player che si sono già adattati. Le recensioni generate dagli utenti restano un asset di primo piano perché forniscono ai modelli linguistici le esperienze reali necessarie per formulare consigli credibili.
Secondo Digital Applied , la visibilità di un brand non dipende più dal ranking organico tradizionale ma dall'inclusione dei dati aziendali nei database degli LLM e dalla conformità a protocolli come l'Universal Commerce Protocol.
Come abbiamo visto nella mia guida, "Come farsi citare dall'AI nel 2026", il settore SEO e MarTech sta convergendo sulla definizione di "Agentic Commerce SEO", un approccio che sposta il focus dalla ricerca per parole chiave all'interrogazione di database strutturati, con un'attenzione particolare all'architettura tecnica dei feed di prodotto in formato JSON-LD.
I consumatori che preferiscono affinare i propri acquisti tramite prompt iterativi anziché semplici ricerche web sono già una quota misurabile del mercato, e intercettarli richiede che le informazioni aziendali siano accessibili a questi nuovi intermediari digitali prima ancora che al motore di ricerca classico.
Google Gemini ora importa la cronologia di ChatGPT e Claude: come funziona la migrazione
Fonte: PCWorld
Due strumenti per trasferire memoria e conversazioni dai chatbot concorrenti

Google ha introdotto su Gemini una coppia di funzionalità di migrazione che permettono di portare dentro la propria piattaforma i dati accumulati su ChatGPT e Claude. Si punta a ridurre l'onere legato alla migrazione tra diverse piattaforme, una difficoltà reale per gli utenti che hanno dedicato mesi alla configurazione di un assistente e desiderano evitare di ripartire da capo.
All'interno del pannello Impostazioni di Gemini è disponibile la funzione Import memory, progettata per semplificare il trasferimento delle informazioni personali tra diverse piattaforme. Il sistema genera un comando specifico che l'utente deve inserire in altri chatbot come ChatGPT o Claude, ottenendo così un prospetto organizzato contenente i dati accumulati, inclusi gli stili comunicativi e le informazioni lavorative. Una volta ottenuto questo riepilogo, è sufficiente copiarlo e inserirlo nell'apposita area di importazione affinché Gemini possa adattare le interazioni successive alle abitudini dell'utente.
Il secondo metodo è più diretto e riguarda l'intera cronologia delle conversazioni. Si esporta lo storico dal servizio di origine come file ZIP e lo si carica su Gemini. Secondo 9to5Google, la piattaforma accetta file fino a 5 GB ciascuno, con un limite di 5 caricamenti al giorno per utente. Questo consente di riprendere dialoghi precedenti senza perdere il filo di progetti complessi o sessioni di brainstorming già avviate altrove.
Un dettaglio da tenere presente riguarda la disponibilità geografica. Secondo il blog ufficiale di Google, la funzione è in fase di rilascio globale ma resta esclusa per gli utenti residenti nello Spazio Economico Europeo, nel Regno Unito e in Svizzera, per ragioni legate alla conformità normativa. Un vincolo che potrebbe rallentare l'adozione proprio nei mercati dove la sensibilità sulla portabilità dei dati è più alta.
L'iniziativa di Google vuole limitare il cosiddetto vendor lock-in, ovvero quel legame esclusivo con un unico fornitore che spesso disincentiva il passaggio verso soluzioni alternative. Poiché l'aggiornamento viene distribuito in modo scaglionato, le nuove funzionalità potrebbero non apparire subito all'interno del pannello di configurazione di tutti gli utenti.
Base44 lancia la clonazione di siti web via URL
Fonte: Efficienist
La piattaforma acquisita da Wix trasforma qualsiasi indirizzo web in un'app funzionante in meno di un minuto, ma le implicazioni legali restano interamente a carico di chi la usa

Base44, piattaforma di AI app building acquisita da Wix nel giugno 2025, ha introdotto una funzione chiamata "Start from URL". Il funzionamento del sistema appare piuttosto immediato poiché basta inserire l'URL di una pagina web affinché l'intelligenza artificiale crei un'applicazione capace di riprodurne fedelmente l'estetica. L'utente può scegliere tra due opzioni operative distinte per gestire il processo di clonazione. La modalità denominata Content & Design duplica l'intero portale includendo anche i testi originali, mentre l'impostazione Design only isola esclusivamente l'architettura visiva, recuperando layout, colori e posizionamento degli elementi grafici senza però riportare alcun contenuto testuale.
L'AI lavora esclusivamente sul frontend. Non accede a logiche backend, database o integrazioni con servizi di terze parti. Una volta importato il layout, la piattaforma mette a disposizione una libreria di asset e controlli globali del tema per intervenire su font e palette cromatica. Per chi deve costruire un MVP partendo da un sito legacy di proprietà, il risparmio di tempo è evidente: meno di un minuto per ottenere una base su cui iterare. Eppure il limite tecnico è altrettanto chiaro, perché senza backend il risultato è un guscio visivo che richiede comunque sviluppo separato per qualsiasi funzionalità reale.
Il problema più serio non è tecnico, è legale. Base44 ha trasformato lo scraping di siti altrui in una funzionalità di prodotto, e le critiche non si sono fatte attendere. L'accusa è di favorire il plagio sistematico del lavoro di designer e sviluppatori, rendendo la copia di un intero sito accessibile a chiunque con un clic. L'azienda ha scelto di scaricare interamente la responsabilità sull'utente finale, limitandosi a raccomandare la verifica del possesso dei diritti sul link clonato prima di procedere. Secondo i Termini di Servizio di Base44, chi utilizza la funzione è l'unico soggetto legalmente responsabile per eventuali violazioni di copyright o dei ToS dei siti clonati.
A complicare il quadro c'è anche la questione della sicurezza infrastrutturale. A luglio 2025, secondo Wiz Research, è stata identificata una vulnerabilità critica nella piattaforma che consentiva l'accesso non autorizzato ad applicazioni private degli utenti. Wix ha risolto il problema in 24 ore, ma l'episodio segnala che la maturità della piattaforma sul fronte della sicurezza è ancora in fase di consolidamento.
Per chi si trova dall'altra parte, cioè chi possiede un sito e vuole proteggerlo da strumenti di questo tipo, le contromisure esistono: file robots.txt configurati correttamente, monitoraggio delle anomalie nel traffico e soluzioni di protezione bot come Cloudflare sono le difese più comuni, secondo quanto riportato da Scrapes.Us. Nessuna di queste è infallibile, ma alzano il costo dell'operazione per chi tenta lo scraping automatizzato.
Base44 offre uno strumento oggettivamente veloce per prototipare interfacce. La domanda che resta aperta è se la comodità di clonare un sito in un minuto valga il rischio legale e reputazionale che ne deriva, soprattutto quando il link incollato non è il proprio.
Google lancia Gemini 3.1 Flash Live, il modello audio nativo pensato per gli agenti AI
Fonte: Efficienist
Un'architettura audio-to-audio che elimina la trascrizione e taglia la latenza per i workflow agentici
Google ha presentato il 26 marzo 2026 Gemini 3.1 Flash Live, un modello multimodale costruito sopra Gemini 3 Pro e progettato per alimentare agenti AI capaci di conversazioni vocali naturali. L'architettura di questo modello si distingue dai sistemi precedenti grazie alla sua operatività in modalità audio-to-audio nativa, evitando così la conversione del parlato in formato testuale prima della generazione della risposta. L'eliminazione di questo passaggio intermedio riduce la latenza e cancella quelle pause artificiali che solitamente permettono di identificare immediatamente una conversazione con un chatbot vocale.
Le specifiche tecniche meritano attenzione. La finestra di contesto arriva a 128K token e accetta input audio, video e immagini in un unico flusso. La memoria dei thread di conversazione è stata raddoppiata rispetto alla serie 2.5, secondo quanto riportato dalla model card di Google DeepMind, e questo consente agli agenti di gestire compiti complessi senza costringere l'utente a ripetere informazioni già fornite. Il supporto linguistico copre oltre 90 lingue in modo nativo, mentre i filtri ambientali integrati isolano la voce umana da rumori di fondo come traffico, televisione o conversazioni parallele.

Il modello regola anche il tono delle risposte in base allo stato emotivo percepito dell'interlocutore, un dettaglio che sposta l'interazione vocale da un piano puramente funzionale a uno più vicino alla conversazione tra persone. Sui benchmark, Gemini 3.1 Flash Live ha ottenuto il 90,8% su ComplexFuncBench Audio e il 36,1% su Scale AI's Audio MultiChallenge, secondo i dati pubblicati da Google DeepMind.
Per gli sviluppatori, l'accesso passa dalla Live API disponibile in Google AI Studio. Le imprese che vogliono integrare il modello in ambienti di produzione possono farlo tramite Vertex AI, dove Google ha reso disponibile il pacchetto Gemini Enterprise for Customer Experience, pensato per schierare agenti di servizio clienti operativi in oltre 200 paesi. Come riportato da Ars Technica, ogni output audio generato dal modello include un watermark digitale SynthID, una misura di sicurezza che permette di distinguere la voce sintetica da quella umana, anche se la qualità della prima rende il confine sempre meno percepibile a orecchio.
Per chi gestisce operazioni di customer care su scala internazionale, la combinazione di bassa latenza, filtri per ambienti rumorosi e ragionamento multi-step offre un'infrastruttura concreta su cui costruire automazioni vocali che fino a ieri richiedevano pipeline molto più frammentate. Il punto da monitorare resta la gestione dei costi, legata ai piani Google Cloud e Vertex AI con limiti di spesa configurabili, e la reale tenuta del modello su conversazioni lunghe e ad alta complessità operativa.
Mistral lancia Voxtral TTS: pipeline vocale completa con 3 GB di RAM e clonazione in 5 secondi
Fonte: Efficienist
Un unico fornitore per trascrizione, comprensione e sintesi vocale. Cosa cambia per chi costruisce agenti conversazionali
Il 26 marzo 2026, Mistral ha lanciato Voxtral TTS, un modello text-to-speech a pesi aperti con 4 miliardi di parametri che completa la propria offerta dedicata alle tecnologie vocali. Grazie a questa novità, gli sviluppatori dispongono di un flusso di lavoro integrato che comprende la trascrizione tramite Voxtral Transcribe, l'elaborazione dei contenuti con il modello linguistico proprietario e la sintesi vocale di Voxtral TTS. Questa soluzione evita agli utenti la necessità di combinare componenti differenti, come Whisper, modelli linguistici di altri fornitori e servizi di sintesi esterna, per costruire applicazioni vocali complesse.
Chi pianifica un deployment edge deve considerare con attenzione il fabbisogno di memoria, che parte da 16 GB di VRAM nel formato BF16 per ridursi a soli 3 GB di RAM tramite la quantizzazione, come indicato dai documenti ufficiali di Mistral. La latenza misurata durante l'esecuzione in tempo reale oscilla tra 70 e 90 millisecondi, permettendo l'impiego del modello in contesti conversazionali dove la rapidità di risposta evita che l'utente percepisca ritardi fastidiosi.
La clonazione vocale è l'altra caratteristica su cui Mistral punta con decisione. Bastano 3-5 secondi di audio di riferimento per replicare una voce conservandone accento, tono e prosodia emozionale, con supporto cross-lingua su 9 lingue e dialetti. Secondo TechCrunch, nei test di preferenza umana Voxtral TTS ha superato ElevenLabs Flash v2.5 nel 68,4% dei casi, un margine che posiziona il modello come alternativa concreta ai leader commerciali del settore.
Sul fronte dell'integrazione, le API seguono lo standard OpenAI con endpoint /v1/audio/speech, il che riduce sensibilmente il lavoro di adattamento per chi ha già costruito pipeline speech-to-speech su quella specifica.È opportuno prestare attenzione alla licenza del modello open-weight, poiché la distribuzione avviene tramite CC BY-NC 4.0 e limita il libero utilizzo esclusivamente alle attività prive di fini commerciali. Chi vuole impiegarlo in produzione deve passare dalle API commerciali di Mistral, con un costo di 0,016 dollari per 1.000 caratteri, secondo quanto indicato sul sito ufficiale.
Per chi costruisce agenti vocali, il vantaggio concreto è la riduzione della complessità architetturale. Gestire un'unica famiglia di modelli significa meno punti di rottura, meno contratti con fornitori diversi e un controllo più diretto sui dati che attraversano la pipeline. D'altra parte, la clonazione vocale veloce genera problemi di sicurezza che le licenze non commerciali limitano soltanto in minima misura, poiché il vincolo giuridico rimane l'unico vero ostacolo contro gli abusi nel momento in cui il modello viene eseguito localmente.
Suno v5.5. Clona voci, modelli custom e gusti automatizzati
Fonte: The Verge
L'aggiornamento introduce tre funzioni che spostano il controllo creativo dall'IA all'utente
La versione 5.5 del modello di generazione musicale di Suno offre agli utenti una maggiore autonomia sui risultati. Grazie all'introduzione di Voices, Custom Models, My Taste e ulteriori opzioni di personalizzazione, la piattaforma evolve da semplice generatore automatico a un sistema capace di adattarsi in modo specifico alle preferenze e alle necessità di ogni singolo utilizzatore.
La funzione Voices permette di clonare la propria voce caricando tracce a cappella, brani completi o registrando direttamente dal microfono. Per prevenire furti d'identità vocale, il sistema impone la lettura di una frase casuale come verifica obbligatoria, secondo quanto riportato dal blog ufficiale di Suno. Durante la fase beta, ogni generazione con Voices costa 4 crediti.
Custom Models consente di addestrare un modello musicale personalizzato caricando almeno sei brani del proprio catalogo. L'IA apprende lo stile, le sonorità e le strutture compositive di quei brani per poi replicarle nelle generazioni successive. Chi crea materiali audio per i brand, come podcast, jingle o colonne sonore per video, utilizza questa risorsa per assicurare un’uniformità stilistica costante evitando di dover apportare modifiche manuali in ogni occasione.
Il funzionamento di My Taste si distingue dagli altri strumenti poiché esamina i gusti personali relativi a generi e atmosfere, per poi applicare automaticamente tali stili attraverso la bacchetta magica presente all'interno della piattaforma. A differenza delle altre due funzioni, My Taste è accessibile a tutti gli utenti, compresi quelli con piano gratuito. Voices e Custom Models restano invece riservati agli abbonati Pro e Premier, gli unici che possono anche utilizzare le creazioni a fini commerciali (fonte: Suno Knowledge Base).
Suno sta costruendo un ecosistema in cui l'IA non decide al posto dell'utente, ma esegue secondo parametri definiti dall'utente stesso. Per i professionisti del marketing che lavorano con asset audio, la differenza tra un generatore generico e uno addestrato sul proprio brand è la differenza tra un contenuto usa e getta e uno riconoscibile.
Zhipu AI lancia GLM-5.1. 744 miliardi di parametri e costi API a un settimo di Claude 4.6
Fonte: Efficienist
Il modello cinese raggiunge il 94,6% delle prestazioni di Anthropic, con un'architettura MoE addestrata su hardware Huawei
Zhipu AI ha rilasciato a sorpresa GLM-5.1, un modello di linguaggio progettato specificamente per l'ingegneria degli agenti complessi e il coding affidabile, abbandonando la generazione di testo generica per concentrarsi su un segmento dove la domanda cresce e i margini di differenziazione sono ancora ampi. Il modello è già disponibile per gli utenti del piano GLM Coding.
L'architettura è di tipo Mixture-of-Experts (MoE) con 744 miliardi di parametri totali, di cui 40 miliardi attivi per ogni singola inferenza, secondo quanto riportato dalla documentazione ufficiale di Z.ai. L'addestramento ha coperto 28,5 trilioni di token ed è stato condotto esclusivamente su 100.000 chip Huawei Ascend 910B, un dettaglio che segna una dipendenza zero dalla filiera occidentale dei semiconduttori (secondo Digital Applied).
I numeri dicono che GLM-5.1 ha ottenuto un punteggio di 45,3 nei benchmark interni di coding agentico, contro i 47,9 di Claude 4.6 di AnthropicSebbene la differenza di prestazioni risulti limitata, dato che il sistema cinese arriva a coprire il 94,6% delle capacità del suo rivale principale, il risparmio finanziario è enorme, poiché le tariffe API ammontano a circa un settimo di quelle applicate dagli operatori occidentali.
Il rilascio improvviso ha portato con sé qualche frizione operativa. La community ha segnalato errori di permesso e consumi anomali della quota API nelle prime ore di utilizzo, problemi che Zhipu AI sta già monitorando. L'azienda ha confermato che i pesi del modello saranno rilasciati in modalità open-source con licenza MIT, una scelta che potrebbe accelerare l'adozione da parte di team indipendenti e piccole aziende che non possono permettersi i costi ricorrenti dei provider proprietari.
Per fortuna la competizione nel coding agentico non è più un duopolio tra OpenAI e Anthropic. GLM-5.1 non supera Claude 4.6, ma lo tallona a una frazione del costo, e lo fa con hardware interamente cinese. Per chi valuta strumenti di AI applicata al codice, il rapporto prestazioni-prezzo è diventato un parametro che pesa quanto la qualità grezza dell'output.
Digital twin nell'industria per adulti. I creator trasformano la propria immagine in asset licenziabile
Fonte: Wired
L'industria del sesso adotta i cloni AI per generare reddito passivo e sopravvivere al tempo

Entriamo nella parte che preferisco della Newsletter. Via alle danze della distopia!
Che un creator potesse monetizzare la propria immagine non è una novità. Che potesse farlo mentre dorme, dopo il pensionamento, e senza invecchiare di un giorno, lo è. Secondo quanto riportato da Wired, un numero crescente di performer dell'industria per adulti sta licenziando la propria immagine a piattaforme di intelligenza artificiale per creare digital twin, cloni virtuali che ne replicano fattezze, voce e personalità, capaci di interagire con i fan 24 ore su 24.
Le piattaforme coinvolte si chiamano OhChat, My.Club, Joi AI e SinfulX AI. Su OhChat il processo di onboarding richiede l'invio di 30 immagini e una sessione di addestramento vocale, al termine della quale il creator stabilisce livelli di consenso precisi che vanno dalla semplice chat testuale fino al nudo integrale. Il clone può essere eliminato in qualsiasi momento, e questa possibilità di revoca immediata distingue il modello da quello delle agenzie di gestione tradizionali, dove spesso i fan credono di parlare con la performer ma interagiscono con ghostwriter precari pagati a cottimo.
Il vantaggio competitivo per i professionisti è duplice. Da un lato, il digital twin genera reddito passivo senza richiedere la presenza fisica del creator, che può ritirarsi dall'attività mantenendo vivo il proprio brand. Dall'altro, i fan sanno di interagire con un'AI ufficialmente autorizzata, il che paradossalmente aumenta la trasparenza rispetto al sistema precedente. Le performer possono anche far esplorare al proprio avatar scenari che non accetterebbero nella realtà, proteggendo la propria sicurezza personale senza rinunciare a segmenti di mercato redditizi.
Il fenomeno non riguarda solo l'industria per adulti. Secondo Mondaq, Khaby Lame ha firmato un accordo da 975 milioni di dollari per la licenza del suo gemello digitale, a conferma che la trasformazione dell'identità personale in proprietà intellettuale licenziabile è un modello di business che sta scalando ben oltre una singola nicchia.
Resta comunque irrisolto il nodo giuridico sollevato da Odin Law, secondo cui gli accordi standard imperniati sul diritto d'autore risultano insufficienti a tutelare le persone. Diventa necessario inserire disposizioni contrattuali dettagliate che includano il consenso esplicito, la protezione dei marchi, i diritti di pubblicità e l'impiego di firme crittografiche per contrastare efficacemente la creazione di deepfake non autorizzati.
Sul fronte tecnico, standard come C2PA e SynthID stanno guadagnando adozione per certificare la provenienza dei contenuti generati da AI, secondo quanto riportato da Sumsub. L'EU AI Act, dal canto suo, impone già requisiti di disclaimer per i contenuti generati artificialmente, un obbligo che secondo Alibaba Insights serve anche a mantenere la fiducia dell'audience ed evitare il cosiddetto effetto "uncanny valley"
Il Parlamento Europeo boccia il Chat Control. Dal 3 aprile stop alla scansione di massa dei messaggi privati
Fonte: Computer Weekly
Con 311 voti contrari, l'Eurocamera chiude la porta alla sorveglianza indiscriminata delle chat. Meta, Google e LinkedIn dovranno adeguarsi entro pochi giorni
Il 26 marzo 2026 il Parlamento Europeo ha votato contro l'estensione della deroga alla direttiva e-Privacy che consentiva alle piattaforme digitali di scansionare in modo massivo le comunicazioni private dei cittadini UE. 311 voti contro, 228 favorevoli e 92 astenuti, secondo quanto riportato da Computer Weekly. Il sistema noto come Chat Control, che permetteva ad aziende come Meta, Google e LinkedIn di passare al setaccio le chat degli utenti senza un sospetto specifico, sarà illegale in Europa.
La deroga scadrà ufficialmente il 3 aprile 2026, secondo quanto documentato dall'europarlamentare Patrick Breyer. Da quella data, le forze dell'ordine potranno monitorare le comunicazioni private solo in presenza di sospetti concreti e con un mandato giudiziario, oltre a conservare la facoltà di sorvegliare i contenuti pubblicati su canali pubblici.
L'opposizione alla scansione indiscriminata si è costruita su argomenti tecnici precisi, esperti di cybersicurezza e le stesse aziende tecnologiche hanno segnalato che il meccanismo minava la crittografia end-to-end, creando vulnerabilità sfruttabili non solo dalle autorità ma anche da attori malevoli.
Le istituzioni europee stanno negoziando un nuovo regolamento, il cosiddetto Chat Control 2.0, che dovrebbe trovare un punto di equilibrio tra la protezione dei minori online e la tutela della riservatezza delle comunicazioni.
Meta TRIBE v2 prevede come il cervello reagisce a video, audio e testo
Fonte: Efficienist
Un modello trimodale addestrato su oltre 500 ore di fMRI che spiega il 54% della varianza dell'attività cerebrale, con implicazioni dirette per chi lavora con i contenuti
Meta AI ha presentato TRIBE v2, acronimo di Trimodal Brain Encoder, un modello capace di prevedere l'attivazione di circa 1.000 regioni cerebrali in risposta a tre tipi di stimoli: video, audio e testo. L'architettura combina V-JEPA 2 per l'elaborazione video, Wav2Vec2-BERT per l'audio e Llama 3.2 per il linguaggio, allineando le rappresentazioni multimodali con i segnali fMRI attraverso un approccio di apprendimento auto-supervisionato (secondo Meta AI Research).
Il modello è stato addestrato su oltre 500 ore di registrazioni fMRI provenienti da 700 partecipanti, e che nelle aree sensoriali riesce a spiegare fino al 54% della varianza dell'attività cerebrale. Le prestazioni su soggetti mai visti prima risultano tre volte superiori rispetto ai metodi precedenti, una capacità di generalizzazione "zero-shot" che secondo The Decoder segna un salto di qualità rispetto ai tentativi precedenti di decodifica neurale.
Meta circoscrive l'impiego dei suoi modelli all'attività scientifica, concentrandosi sullo sviluppo di strutture di intelligenza artificiale modellate sui circuiti cerebrali e sulla riproduzione di patologie neurologiche che evita il ricorso a esami invasivi. La possibilità di limitare il ricorso a dispendiose procedure di neuroimaging su soggetti viventi appare realistica e promette di velocizzare gli studi neuroscientifici con risultati quantificabili.
Eppure la questione che interessa chi si occupa di marketing è un'altra. Un sistema che prevede quali stimoli multimediali attivano con più forza determinate aree cerebrali offre, almeno in teoria, la possibilità di progettare contenuti ottimizzati per innescare le reazioni neurali più intense. Meta presenta il progetto come puramente scientifico, ma il rischio di un uso commerciale per massimizzare l'engagement su piattaforme come Facebook e Instagram è un tema che gli stessi ricercatori stanno monitorando.
La capacità di TRIBE v2 di misurare la reazione biologica a un filmato o a una traccia audio prima della diffusione rende labile la distinzione tra il semplice perfezionamento dei materiali e la vera e propria manipolazione del pubblico. Il neuromarketing fino a oggi richiedeva laboratori, campioni ridotti e tempi lunghi. Un modello che generalizza su soggetti mai analizzati potrebbe comprimere tutto questo in una simulazione software. Uno strumento potente, che va trattato con la stessa cautela che si riserva a qualsiasi tecnologia capace di agire sulle risposte involontarie delle persone.
Se hai apprezzato queste informazioni, aiutatemi a crescere: condividile con la tua rete di colleghi e amici e invitatali a iscriversi per diffondere la conoscenza. Continuate a seguirci per rimanere sempre aggiornati nel mondo dell'intelligenza artificiale e scoprire nuove opportunità.
Cosa ottieni iscrivendoti:
- Accesso a tutti gli episodi della newsletter
- Guide e corsi completi sull'AI per marketer
- Strumenti AI professionali (BrandPix, Short Video Suite)
- Crediti gratuiti per iniziare subito
