È possibile distinguere un testo scritto da un umano da uno generato dall’intelligenza artificiale ?
Nell’era dell’intelligenza artificiale, è sempre più difficile distinguere tra testi scritti da persone e quelli generati da algoritmi. In questo articolo, esploreremo gli strumenti e le metodologie disponibili per riconoscere l’origine di un testo. Scoprirai come funzionano queste tecnologie e come possono aiutarti a garantire l’autenticità e la qualità dei contenuti che incontri online.
Scrivere o generare: possiamo distinguere tra un testo umano e uno creato dall’IA?
Nel titolo abbiamo scelto volutamente i verbi “scrivere” e “generare” per sottolineare una differenza epistemologica fondamentale.
Mentre “scrivere” implica un percorso semantico guidato dall’intenzione e dalla comprensione umana, “generare” attraverso l’IA si basa su una costruzione probabilistica di parole e frasi.
Questa distinzione ci porta a chiederci: è possibile, nell’era dell’intelligenza artificiale, riconoscere l’origine di un testo?
Da Google DeepMind una soluzione open: SynthID
Google DeepMind ha sviluppato uno strumento che potrebbe aiutarci a rispondere a questa domanda. Dopo aver condotto un enorme esperimento coinvolgendo milioni di utenti della loro app Gemini, hanno reso open source SynthID, un watermark invisibile per testi generati dall’IA.
Google DeepMind ha creato SynthID, uno strumento per riconoscere i testi scritti dall’intelligenza artificiale (IA), e lo ha reso disponibile a tutti (open source). SynthID fa parte di una serie di strumenti di watermarking (inserimento di un segno invisibile) per contenuti generati dall’IA. In precedenza, l’azienda aveva introdotto watermark per immagini e video generati dall’IA.
A maggio, Google ha annunciato l’applicazione di SynthID nella sua app Gemini e nei chatbot online, rendendolo disponibile gratuitamente su Hugging Face, una piattaforma dove si possono trovare dati e modelli di IA.
I watermark sono diventati importanti per aiutare le persone a capire quando qualcosa è stato creato dall’IA, contribuendo a combattere problemi come la disinformazione.
Come funziona SynthID?
Lo strumento aggiunge un segno invisibile direttamente nel testo quando viene generato da un modello di IA.
I modelli di linguaggio di grandi dimensioni (LLM) funzionano dividendo il testo in “token” (unità come caratteri, parole o parti di frasi) e prevedendo quale token è più probabile che venga dopo. Ogni token riceve un punteggio di probabilità; più alto è il punteggio, più è probabile che il modello scelga quel token.
SynthID modifica leggermente queste probabilità durante la generazione, inserendo informazioni aggiuntive. Per riconoscere il watermark e capire se un testo è stato creato da un’IA, SynthID confronta i punteggi di probabilità delle parole in testi con e senza watermark.
SynthID Funziona sempre? Google DeepMind ha scoperto che l’uso di SynthID non peggiora la qualità, l’accuratezza, la creatività o la velocità del testo generato. Questa conclusione deriva da un grande esperimento reale sulle prestazioni di SynthID dopo che il watermark è stato implementato nei prodotti Gemini e utilizzato da milioni di persone. Gli utenti potevano valutare le risposte dell’IA con un pollice in su o in giù.
Il team ha analizzato circa 20 milioni di risposte del chatbot con e senza watermark, scoprendo che gli utenti non hanno notato differenze nella qualità.
I risultati sono stati pubblicati oggi su Nature.
Che cosa è un watermark
Un watermark è un segno distintivo, visibile o invisibile, applicato a un contenuto digitale (immagini, video, documenti) per identificarne l’origine, proteggere i diritti d’autore o garantirne l’autenticità. Esso può essere un logo, testo, o pattern grafico inserito su una superficie visibile dell’immagine o un codice nascosto all’interno dei dati del file. I watermark visibili sono utili per dissuadere l’uso non autorizzato del materiale, poiché rendono evidente chi ne detiene i diritti. I watermark digitali invisibili, invece, sono utilizzati per tracciare e proteggere i contenuti senza alterarne l’aspetto. Questo metodo è ampiamente utilizzato da fotografi, aziende multimediali e piattaforme online per prevenire la pirateria e garantire il riconoscimento del proprietario originale.
Attualmente, SynthID per il testo funziona solo su contenuti generati dai modelli di Google, ma rendendolo open source si spera di ampliare la compatibilità con altri strumenti.
Quali sono le limitazioni? SynthID resiste a tentativi di modifica come tagliare il testo o fare piccole correzioni, ma è meno affidabile quando il testo generato dall’IA viene riscritto o tradotto in un’altra lingua.
È anche meno efficace in risposte a domande con informazioni precise, come “Chi ha scritto i Promessi Sposi?”, perché c’è meno margine per modificare le probabilità dei token senza alterare i fatti.
Quindi, si potrà sempre riconoscere un testo scritto dall’IA?
Forse no, ma strumenti come SynthID rappresentano un passo avanti nell’affrontare le sfide poste dall’intelligenza artificiale nella generazione di testi.
Personalmente ritengo che questa domanda sia molto meno importante di quanto sembri. Alla fine, ciò che conta davvero è che il testo sia affidabile, basato su contenuti veri, con richiami a casi reali, chiaro da leggere e capace di lasciare al lettore qualcosa di significativo.
Che sia stato scritto da un umano o generato con l’aiuto dell’IA è, in fondo, solo una questione di strumenti e di forma. L’essenziale è la qualità e l’integrità dell’informazione che il testo trasmette.
Fonti:
- Google DeepMind is making its AI text watermark open source, By Melissa Heikkilä (MIT TR)
- Scalable watermarking for identifying large language model outputs, Sumanth Dathathri, Abigail See, Sumedh Ghaisas, Po-Sen Huang, Rob McAdam, Johannes Welbl, Vandana Bachani, Alex Kaskasoli, Robert Stanforth, Tatiana Matejovicova, Jamie Hayes, Nidhi Vyas, Majd Al Merey, Jonah Brown-Cohen, Rudy Bunel, Borja Balle, Taylan Cemgil, Zahra Ahmed, Kitty Stacpoole, Ilia Shumailov, Ciprian Baetu, Sven Gowal, Demis Hassabis & Pushmeet Kohli (Nature)
AI - Intelligenza Artificiale
Con questo Topic raccogliamo per i nostri lettori tutti gli articoli, news, approfondimenti riguardanti l'evoluzione tecnica, le norme e regole, i casi applicativi sul tema dell'intelligenza artificiale
Condividi su: Facebook LinkedIn Twitter WhatsApp