D:\side\ · @dside
596 followers · 3372 posts · Server mastodon.ml

@zblesk I can both read and write in English quite well, it's fine, feel free to ask for a proper translation too!

I was previously using NocoDB as the editor, API and webhook source. But I'll probably cut that down to just the editor and use good ol' SQL for the rest. But I'm working on a very small scale there – a -based personal voice assistant would be the primary client. So I can get away with a lot of cut corners :blobcatwinktongue:

#Rhasspy

Last updated 1 year ago

D:\side\ · @dside
551 followers · 3169 posts · Server mastodon.ml

🗣️ Что-то я уже давно не трогал .

Выпущена ранняя версия Rhasspy 3, а в ней распознаёт речь уже Whisper (по моделям от OpenAI), а синтезирует Piper. Всё ещё без облаков.

Whisper даже без закрытого словаря показывает впечатляющую точность. Для русского языка, да.

Даже модель tiny-int8 (43Мб), пригодная для Raspberry Pi 4, довольно шустро выдаёт похожий текст. А если чётко произнести, то даже правильный.

А small (968Мб) настолько суров, что даже восстанавливает по паузам пунктуацию, бьёт на предложения и замечает (по интонации?) вопросы!

Я как-то дальнейшее развитие своей говорилки планировал из расчёта на закрытый словарь, но похоже, что он не потребуется, можно сосредоточиться на тексте.

Что до Piper — после Larynx улучшение инкрементальное, но заметное. Голос звучит куда естественнее, фонемы соединяются органичнее.
Всё ещё местами странное ударение и добавились неловкие паузы, но "чтение первого абзаца случайной статьи с Википедии" теперь вызывает куда меньшее недоумение.

#Rhasspy

Last updated 1 year ago

D:\side\ :verified_coffee: · @dside
211 followers · 2159 posts · Server mastodon.ml

Забавная история рядом с .

Когда-то Kitt AI выпустил Snowboy для улавливания ключевых слов в звуковом потоке — что как раз нужно для активации голосового помощника.

В духе проприетарщины, к сожалению, они предоставляли только несколько "универсальных" моделей, а персональные тренировали исключительно у себя в веб-консоли, и полученные оттуда модели работали по 30 дней ( :blobcatangery: ), после чего должны были быть натренированы заново.

Но что-то у них пошло не так и в декабре 2020 они свои сервисы повыключали, но оставили на гитхабе код. Что именно произошло дальше, я несколько теряюсь, но Seasalt AI довольно оперативно сделали для него генерацию персональных моделей без срока годности.

А Майк, автор Rhasspy, некоторое время спустя собрал из трудов Seasalt AI генератор моделей, который записывает образцы слова в браузере, обрезает, тренирует модель и отдаёт на скачивание:
github.com/rhasspy/snowboy-sea

Благодаря всему этому, наконец-то, у моего помощника есть собственное имя.

#Rhasspy

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
211 followers · 2111 posts · Server mastodon.ml

Я всё-таки пошёл копать, как устроен голос Larynx в , с целью избавиться от странной аномалии, которая меня уже много месяцев донимает: произношения "шесть" как [шос].

Оказалось, что косяк случается ещё до того, как в дело вступает какой-либо машинлёрнинг. Там тупо в словаре для слова "шесть" были фонемы "ʂ oː s tʲ". Почему и откуда, вопрос тоже интересный, но для другого раза.

А что случается это *до* машинлёрнинга это *очень* хорошая новость — благодаря этому изменение несложно сделать руками в уже собранном и установленном языковом профиле, ничего тренировать не надо.

Больше никакого "шос градусов"!

Теперь затолкать бы эту правку в проект: github.com/rhasspy/gruut/issue

#Rhasspy

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
210 followers · 2107 posts · Server mastodon.ml

🗣️ Незадолго до того, как остаться без работы, я готовил для нашего корпоративного мероприятия свой рассказ о том, как я сталкивался с разным голосовым управлением, как меня это в итоге привело к и что надо бы делать дальше.

А поскольку в задуманном ранее виде материал уже явно не увидит свет, а терять его жалко, я адаптировал его для блога.

dside.ru/domestic-chatterbox/

#Rhasspy

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
211 followers · 2086 posts · Server mastodon.ml

«Программист с помощью нейросетей создал себе девушку»
(Продолжение темы с
naked-science.ru/community/538 )

…а ведь я с (локальным голосовым помощником) двигался в ту же сторону. Просто те составные части, что использовал Брайс, пока ещё локально попросту не запустить, а жёстких внешних зависимостей я у себя в системе сознательно избегаю.

Я подхожу больше с прагматической стороны — напоминания о делах по дому, сводки на день и другая подобная информационная рутина.

И в отличие от Брайса, я сам с усам и останавливать меня некому, ы-ы-ы-ыхы-хы-хы-хы :blobfoxfloofdevil:

#Rhasspy #РегулярныеВыражения

Last updated 2 years ago

Eelco Mulder :mastodon: · @voorstad
192 followers · 278 posts · Server mastodon.nl

@arnoudwokke en oh ja: google home / alexa vervangen met & spraakaansturing natuurlijk. Zou leuk zijn als daar een flink artikel aan zou kunnen wijden.

#tweakers #Rhasspy #homeassistent

Last updated 2 years ago

Ronald · @Ronald
362 followers · 1353 posts · Server mastodon.nl

@chonar
What kind of hardware do you use to interact? I guess you need some sort of microphone (obviously), but it needs to look nice to fit into your living room.
A comm badge would be the best solution, I guess 😉.
@homeassistant

#Rhasspy #homeassistant

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
162 followers · 1919 posts · Server mastodon.ml

@rara верно, .
Микрофон – тупо недорогая веб-камера. Logitech C310, кажется.

Я брал массив микрофонов Respeaker для Raspberry Pi для этой цели даже, но его драйвер оказался с такими лютыми приколами, что я потерялся, разгребая их, и так его и не задействовал.

Вернулся к Rhasspy ≈полгода спустя и уже с машинкой на x86_64 (Respeaker там воткнуть некуда) и запустил с тем, что первым попалось под руку. Но это сработало настолько хорошо, что я уже больше года железо не трогаю.

В списке дел валяется мысль сделать из малинки и респикера говорилку-сателлит (тупо голосовой передатчик в обе стороны, подключенный к основному узлу для обработки), но до этого когда ещё дойдёт…

(Edit: а, поправочка – на Respeaker я пытался настроить ещё не Rhasspy, а ныне почивший Snips. У кого на гитхабе был прекрасный слоган "We make technology disappear".)

#Rhasspy

Last updated 2 years ago

D:\side\🐘\en · @dside
32 followers · 144 posts · Server mastodon.online

"This is why we can't have nice things" and why open solutions like are absolutely necessary to eventually embrace the full potential of control.

From docs on , an skill for
lexigr.am/docs/why.html#why-ca

#kodi #alexa #kanzi #voice #Rhasspy

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
149 followers · 1854 posts · Server mastodon.ml

Майкл Хэнсен, автор , оказывается, теперь работает в Nabu Casa — это компания, основанная ядром разработчиков для развития открытых систем умного дома вокруг HA и будет помогать компании сделать 2023 "Годом Голоса".

Для контекста, ещё не так давно он работал над Mycroft, тоже голосовым ассистентом, тоже в основном открытым, но частично облачным.

Это всё происходит на фоне недавнего сокращения команды Alexa в Amazon.

Источник: community.rhasspy.org/t/rhassp

#homeassistant #Rhasspy

Last updated 2 years ago

D:\side\ :verified_coffee: · @dside
146 followers · 1814 posts · Server mastodon.ml

@vas3k отличный пост!

У меня с Xiaomi получше сложилось, уже года 4 всё живо. Бесит только неимоверно, что они в рамках бренда для устройств сопоставимых размеров не смогли договориться о размерах батареек. Где-то CR2032, где-то CR2450, где-то ещё какая-то блажь, но это забота около раза в год и обычно крошечная — кроме случаев, когда запас батареек надо пополнить.

Но вместо дэшборда у меня гвоздь системы — локальный голосовой помощник. Всё по заветам DIY, немного корявенький, но свой, и если чего-то не хватает, быстро подкручивается — общается и с Nextcloud, и с Home Assistant, и вообще со всем на что хватит терпения. Рассказывал у себя с тегом . Пушечная вещь, рекомендую.

#Rhasspy

Last updated 2 years ago

SEPIA Open Assistant · @sepia
33 followers · 69 posts · Server mastodon.online
SEPIA Open Assistant · @sepia
33 followers · 69 posts · Server mastodon.online

@TechNews ... or you can build a respecting, with @sepia or @mycroft_ai or for example 😉

#Rhasspy #smartspeaker #opensource #cloudfree #privacy #diy

Last updated 2 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

@ivan , однозначно. Очень простая для понимания модель на базе сообщений, завёрнутая в приличный интерфейс, в котором можно начинать с простого и постепенно дойти до JS.

У меня голосовой помощник на обрабатывает с его помощью команды, и JS мне до сих пор не потребовался, хотя видов команд уже пара десятков.

На глаза ещё попадался n8n, но по-моему он ориентирован на использование в компаниях, что отражается на ассортименте доступных для него узлов. У NodeRED ассортимент пошире на несколько порядков.

#Rhasspy #nodered

Last updated 2 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

@devlight70 с это, надо сказать, совсем несложно: rhasspy.readthedocs.io/en/late

Мой вообще на NodeRED без единой строчки собственного кода работает.

#Rhasspy

Last updated 2 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

🎤 Хроники
Ну, успех. Теперь вместе с и мой голосовой помощник понимает фразы вида:
"Где $предмет?" (и отвечать!)
"$предмет теперь $где" (и записывать!)

Список предметов и мест приходится пока поддерживать прямо из морды NocoDB, поскольку свободный голосовой ввод (заранее неизвестных слов) работает так себе, но даже возможность напоминать себе, где лежат определённые редко используемые вещи, а также "перекладывать" их в системе учёта без экранов – это удобно.

#nodered #NocoDB #Rhasspy

Last updated 2 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

🎤 Хроники

Давно не было обновлений. События как-то не располагали. Продолжил делать домашнюю инвентаризацию.

1. Баг, с которым я столкнулся в 📃 , оказался не совсем багом и 11 дней назад кто-то это всё-таки зарепортил: github.com/nocodb/nocodb/issue Поведение сомнительное, ну да ладно. Говорят, улучшат.

2. 📃 обзавёлся официальным способом запуска через 🐳 Compose, довольно монструозным, но подробным, модульным и гибким. Похож на подход Funkwhale.
Так что я его запустил пощупать. Приятно, что изменения вещает в реалтайме: изменения появляются у других пользователей немедленно.
Но его лицензионная модель это что-то с чем-то. Значительная часть фич, в т. ч. принципиальных для использования во внутренней сети (ручное создание пользователей, например), заперта на подписку в $5/мес/лицо. Серьёзно?
Поскольку код открыт и на Python, обойти это не составит большого труда, но поскольку живое отображение мне не особо надо, я скорее просто не буду его использовать. 🤷‍♀️

#docker #Baserow #NocoDB #Rhasspy

Last updated 2 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

🎤
Новая команда: "Расскажи анекдот". Реализация элементарная, но не безмозглая:

- GET anekdot.ru/random/anekdot/ (иногда даже смешно!)
- HTML-узел на селектор .text.desktop, выдать массив текстов
- Взять из массива первый элемент
- Если анекдот длинный (длину буду подбирать) — сказать "Сейчас", потому что преобразование в речь может задержаться
- Отправить анекдот ответом

#Rhasspy #nodered

Last updated 3 years ago

D:\side\🐘\ru · @dside
127 followers · 1729 posts · Server mastodon.ml

@lightfox@mastodon.social для автоматизации, воспроизведение через вызов API , но можно любой другой медиаплеер с API присобачить, наверное.

#nodered #Rhasspy

Last updated 3 years ago