vous auriez de bons moteurs de text to speech qui font des voix propres et sans fucking accent anglais ? (du texte transformé en voix, pas l'inverse hein)
payant ou non, tant que y'a pas de services de GAFAM dedans et que la voix est vraiment propre sans effet de voix de robot ça m'intéresse.
#a11y #accessibilité #vocalisation #stt #speech2text
#a11y #accessibilite #vocalisation #stt #speech2text
https://github.com/modal-labs/quillman A complete chat app that transcribes audio in real-time, streams back a response from a language model, and synthesizes this response as natural-sounding speech.
I was waiting for this, an offline LLM that you can talk to (AS im voice). 🗣️
#ai #machineleraning #chatgpt #voice #text2speech #speech2text
#ai #machineleraning #chatgpt #voice #text2speech #speech2text
Excited to be part of this challenge in #NLP #speech2text for the public sector here in Luxembourg.
---
RT @GovTechLab_LU
🚨The #GovTechLab is looking for innovative solutions for real-time automatic #transcription in Luxembourgish, French, German and English of video and audio streams for its "Transcribo Vox" #innovation partnership 👉 https://gd.lu/cwp9H5
@MinDigital_LU
@CTIE_LU
https://twitter.com/GovTechLab_LU/status/1642819487832391683
#nlp #speech2text #GovTechLab #transcription #innovation
Connaissez-vous un bon soft de transcription de parole #speech2text libre ?
Ce serait pour retranscrire des interviews
Do you know any open source speech to text app that can be integrated into Android keyboards?
#android #opensource #speech2text
#opensource #speech2text #android
Bonjour tout le monde, il y a quelques temps, j'ai vu passer un pouet parlant d'un site internet qui permet de transcrire automatiquement un fichier audio (voix) en texte reposant sur des logiciels libres. Est-ce que quelqu'un saurait m'indiquer un tel site? #speech2text
Bonjour tout le monde, il y a quelques temps, j'ai vu passer un pouet parlant d'un site internet qui permet de transcrire automatiquement un fichier audio (voix) en texte reposant sur des logiciels libres. Est-ce que quelqu'un saurait m'indiquer un tel site? #speech2text
Sur le site de Vosk (https://alphacephei.com/vosk/models), je vois deux gros modèles, celui de Vosk, et un de #LINTO, et sur le site de LINTO (https://doc.linto.ai/#/services/linstt_download) il y a :
- des modèles v1, 4 différents
- des modèles v2 (a priori meilleurs ?), dont 2 "acoustic models" et 2 "decoding graphs".
Lesquels servent à quoi ?
À l'usage, vous en avez trouvé un meilleur ? (et en quoi ?)
Ou c'est pareil ?
Je ne m'y retrouve pas dans tous ces modèles de #Speech2Text 😅
Question pour les gens qui ont testé la transcription automatique de la parole (#Speech2Text) intégrée à #Kdenlive : quel modèle #Vosk choisir ?
Je compte prendre un des "gros" modèle pour avoir la meilleure fidélité de la retranscription.
Mais pour retranscrire du français, quel modèle est le plus performant ?
Plus de détails ⬇️