Michael Downey 🇺🇳 · @downey
4264 followers · 8566 posts · Server floss.social

@igorwarneck I haven't tried them, but supposedly there are several apps that integrate the speech-to-text engine.

alphacephei.com/vosk/integrati

#OpenSource #Vosk #a11y

Last updated 1 year ago

ThierryM :oc: :nextcloud: · @ThierryM
119 followers · 842 posts · Server framapiaf.org

Un article intéressant décrivant une application pour faire réciter des tables de multiplication (ou autre chose) à des élèves : linuxfr.org/users/martoni/jour

#logiciellibre #Vosk #erun #python

Last updated 1 year ago

Kdenlive · @kdenlive
3847 followers · 139 posts · Server floss.social

23.04.2 is out with many bug fixes and enhancements to and subtitling engines. Also resolves various issues related to timeline sequences, project archiving, subtitle display, motion tracker, color wheel effect, and rendering.

kdenlive.org/en/2023/06/kdenli

WithOpenSource

#Kdenlive #whisper #Vosk #videoediting #artWithOpenSource

Last updated 1 year ago

· @modem56kb
5 followers · 101 posts · Server floss.social
LisPi · @lispi314
384 followers · 5884 posts · Server mastodon.top

@gsuberland @whitequark There's actual no real reason it can't be done other than Google intentionally destroyed Android access APIs to calls so you couldn't record them either (nevermind that it's perfectly legal in my country so long as you're part of the conversation, fuck them for making it so much harder).

One could very well run a copy of at the same time.

#Vosk

Last updated 1 year ago

pvergain · @pvergain
277 followers · 1916 posts · Server framapiaf.org

toolkit

- github.com/alphacep/vosk-api

Vosk is an offline open source speech recognition toolkit. It enables speech recognition for 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish. More to come.

#recognition #speech #Vosk

Last updated 2 years ago

iCapitaine · @Icapitaine
62 followers · 149 posts · Server framapiaf.org

Si quelqu'un veut me donner un coup de main ce serait chouette de faire une interface toute simple en TKinter ?:-)
Je ne maitrise pas encore assez le code que pour y arriver tout seul ^^

#programmation #Vosk #python

Last updated 2 years ago

iCapitaine · @Icapitaine
62 followers · 148 posts · Server framapiaf.org

Mer-veill-eux :-)
Je viens de réussir à installer VOSK, un système de reconnaissance vocale...Et cela marche super bien :-) :-)

Pour l'instant ce n'est pas très user friendly bien que cela ne soit pas catastrophique non plus... une ligne de code à entrer dans le terminal et paf ça reconnait tout ce que l'on dit dans le micro !
Mieux ? C'est facile à installer, multi-plateforme, tout en local et open-source ! L'idéal pour accélérer les rapports !

#python #logiciellibre #opensource #Vosk

Last updated 2 years ago

Mohamed · @kentoseth
130 followers · 406 posts · Server fosstodon.org

So I want to train some audio data for VOSK and it says I need to use Kaldi with some filters on the model.

Q1: Has anybody ever trained a Kaldi model to use with the VOSK-API?

Q2: Did you struggle to set it up?

Q3: Did you need an expensive cloud GPU?

#kaldi #Vosk #asr

Last updated 2 years ago

Marc J. · @marcj0711
5 followers · 67 posts · Server mamot.fr
Marc J. · @marcj0711
5 followers · 66 posts · Server mamot.fr

En mode installation de (reconnaissance vocale) vu que c'est l'outil choisi et recommandé par .

Quelqu'un sait comment éviter les problèmes d'encodages des sous-titres dans KDenlive ?
(j'ai des .srt propres via mais ils s'affichent mal après importation dans KDenlive sur mon ).

Vidéo à suivre parutions dans Mes aventures numériques.

#Vosk #kdenlive #whisper #ubuntu

Last updated 2 years ago

Troll & 🥔 · @Troll
3112 followers · 64147 posts · Server maly.io


J'ai été surpris de trouver un assistant vocal sur , même si ça semble assez pauvre en fonctionnalités comparé aux assistants vocaux des GAFAM.

Ce qui m'a le plus surpris c'est que ca comprends assez bien le français lorsque je lance des recherches. Apparemment ça utilise un truc qui s'appelle pour la reconnaissance vocale.

:fdroid:
f-droid.org/en/packages/org.di

:github_:
github.com/Stypox/dicio-androi


github.com/alphacep/vosk-api/

#dicio #fdroid #voxspeech #AppDiscovery #Vosk #speechtotext

Last updated 2 years ago

· @svajef
3 followers · 410 posts · Server mastodon.ethibox.fr
LisPi · @lispi314
76 followers · 1462 posts · Server mastodon.top

@GrapheneOS I've noticed a general lack offer in general regarding and just as importantly *offline* Speech-To-Text libraries & programs (using some proprietary data-collecting SaaSS is just not an acceptable option).

(alphacephei.com/vosk/) is just about the only one I'm aware of that's actively maintained at the moment.

#freesoftware #Vosk

Last updated 2 years ago

Bazza · @bazza
518 followers · 4913 posts · Server mograph.social

Descargue el nuevo modelo de y funciona mucho mejor en castellano 😮

#Vosk

Last updated 2 years ago

DasMammut · @rkbw
37 followers · 977 posts · Server rollenspiel.social

Lange habe ich eine gesucht, die lokal installiert werden kann (d.h. keine Hochladen von Audiofiles in irgendwelche Clouds) und vernünftige Ergebnisse liefert. Jetzt bin ich endlich fündig geworden: / bringt super Ergebnisse, insbesondere mit den großen Sprachmodellen (separat herunterzuladen: alphacephei.com/vosk/models) 👍

#spracherkennung #Vosk #kaldi

Last updated 2 years ago

katzenberger · @katzenberger
146 followers · 702 posts · Server social.tchncs.de

@xahteiwi If you're not looking for a *live* , you might want to try out the @kdenlive + combo. When downloading models, make sure you pick the ones that try to reconstruct punctuation and upper/lower case. The combo also works when you've only got a sound track.

You can export the transcription to SRT, for further editing.

Find a quick video howto here: yewtu.be/watch?v=_PVsZc5vdtc

#language #Vosk #transcription

Last updated 2 years ago

Tuxicoman · @tuxicoman
1324 followers · 14632 posts · Server social.jesuislibre.net

je cherche un APK pour faire du -to-Speech en français et depuis n'importe que champ de saisie sans envoyer mes requêtes chez quelqu'un.

Je ne trouve pas de binaire pour ou .

Vous avez des recommandations?

#android #text #mozilla #deepspeech #picovoice #Vosk

Last updated 2 years ago

Tuxicoman · @tuxicoman
1342 followers · 14846 posts · Server social.jesuislibre.net

je cherche un APK pour faire du -to-Speech en français et depuis n'importe que champ de saisie sans envoyer mes requêtes chez quelqu'un.

Je ne trouve pas de binaire pour ou .

Vous avez des recommandations?

#android #text #mozilla #deepspeech #picovoice #Vosk

Last updated 2 years ago

· @svajef
4 followers · 282 posts · Server mastodon.ethibox.fr

local. Ce qui veut dire : aucune donnée dans la nature !!

Le code source est ici :
github.com/ElishaAz/Sayboard
L'apk est disponible dans la section "Releases" (bientôt sur fdroid j'espère) !

- 2/2

#opensource #intelligence #ia #Vosk #libre #vieprive

Last updated 2 years ago