Marco Mambrini · @privacyexpert
14 followers · 44 posts · Server mastodon.uno

A proposito di Vall-E, l' di che promette di replicare qualunque voce dopo soli 3 secondi di ascolto di quella originale (di cui vi parlavo qualche giorno fa).

In particolare, pare che gli stessi ricercatori di Microsoft (nel loro paper, che riporto nel link) si siano accorti dei potenziali rischi a cui già facevamo cenno...

Continua: linkedin.com/posts/marco-mambr

#intelligenzaartificiale #microsoft #ai #spoofing #ia #etica #dataprotection #fake #vall_e #valle #deepfake

Last updated 3 years ago

Marco Mambrini · @privacyexpert
11 followers · 34 posts · Server mastodon.uno

Due articoli di approfondimento per comprendere meglio e riflettere su quella che sembra essere diventata la nuova frontiera del : l'impiego dell' per creare audio con la voce di chiunque vogliate, dal vostro amico al noto politico o, perché no, al Direttore Generale della vostra azienda.

linkedin.com/posts/marco-mambr

#fake #intelligenzaartificiale #ai #microsoft #etica #dataprotection #phishing #sociologia #ia #deepfake #fakenews #valle #vall_e

Last updated 3 years ago

Luis Ferreira · @lmf
57 followers · 106 posts · Server universeodon.com

An interesting paper from Microsoft:

Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers
valle-demo.github.io/

ABS: Specifically, we train a neural codec language model (called VALL-E) using discrete codes derived from an off-the-shelf neural audio codec model, and regard TTS as a conditional language modeling task rather than continuous signal regression as in previous work.

#ai #language_model #speech_synthesis #vall_e #tts #neural_networks

Last updated 3 years ago