Caspar von Allwörden · @allwoerd
44 followers · 52 posts · Server t3n.social

An die Podcast-Menschen unter uns (und auch alle Hörer:innen): Dank der neuen Sprachmodelle können auch deutsche langsam automatisiert werden und die Ergebnisse sind brauchbar. Nutzt ihr das schon? Und für was? Barrierefreiheit ist mir klar, aber wäre das auch davon abgesehen ein Service, den ihr haben wollen würdet?

#podcasts #transkribiert

Last updated 1 year ago

Marcel Waldvogel · @marcel
624 followers · 666 posts · Server waldvogel.family

@MrClicko wurde mit fast 700'000 Stunden trainiert.

Das sind über 77 Jahre Geplapper!

⅔ dieser 681'070 Stunden waren ; nur 2% ( nach (Hoch-)Deutsch)+½% ( nach Englisch). Ob davon etwas CH-Deutsch war, ist nicht überliefert. Erstaunlich, dass trotz des wenigen Inputs das Modell in Deutsch doch sehr gut und auch in CH-Deutsch noch OK abschneidet.
arxiv.org/abs/2212.04356

#Whisper #sprache #englisch #deutsch #transkribiert #ubersetzt #stt #speechtotext

Last updated 2 years ago