An die Podcast-Menschen unter uns (und auch alle Hörer:innen): Dank der neuen Sprachmodelle können auch deutsche #Podcasts langsam automatisiert #transkribiert werden und die Ergebnisse sind brauchbar. Nutzt ihr das schon? Und für was? Barrierefreiheit ist mir klar, aber wäre das auch davon abgesehen ein Service, den ihr haben wollen würdet?
@MrClicko #Whisper wurde mit fast 700'000 Stunden #Sprache trainiert.
Das sind über 77 Jahre Geplapper!
⅔ dieser 681'070 Stunden waren #Englisch; #Deutsch nur 2% (#transkribiert nach (Hoch-)Deutsch)+½% (#übersetzt nach Englisch). Ob davon etwas CH-Deutsch war, ist nicht überliefert. Erstaunlich, dass trotz des wenigen Inputs das Modell in Deutsch doch sehr gut und auch in CH-Deutsch noch OK abschneidet. #STT #SpeechToText
https://arxiv.org/abs/2212.04356
#Whisper #sprache #englisch #deutsch #transkribiert #ubersetzt #stt #speechtotext