Блог Һомай

Чего НЕ будет уметь умная колонка для детских садов?

Недавно мы рассказали вам про то, что будет уметь наша умная колонка Хомай, которая появится в октябре в пяти детских садах. Если вы не читали — обязательно почитайте (вот тут), а пока спойлер: она будет на правильном красивом башкирском языке рассказывать сказки.
Помните, как бывает в сказках? У всякого магического предмета есть действие, для выполнения которого он предназначен: горшочек варит кашу, клубок показывает дорогу. И мы понимаем: есть действия, которые даже самая волшебная палочка сделать не сможет.
Так же и в нашей истории. Когда мы рассказали, что первые октябрьские колонки будут уметь, самое время сказать, чего они НЕ будут уметь (это грустная часть, но про нее обязательно нужно поговорить).
  • Умные колонки по проектам “Әминә” не будут уметь работать с контентом. Хомай не поставит Айдара Галимова и Өфө йүкәләре. Да, старшие сестры Хомай (Siri, Alexa, Алиса и Cortana) завоевали себе расположение людей во всем мире, подбирая музыку под настроение, включая и выключая аудиокниги и подкасты. У нас пока нет доступной библиотеки контента, но есть договоренность с несколькими исполнителями, чьи песни можно будет ставить. Надеемся, в будущем таких возможностей станет больше!
Есть ли в этом плюсы? Хитрые родители, которые уже пытались ограничить потребление мусорной информации для своих детей, уже тянут руку вверх: “Да, плюсы первого поколения наших умных колонок в том, что информация от Хомай будет проверенная, без мата, запрещенного контента и пока только на башкирском языке”. Идеально для наших целей, верно?
Кстати, у нас есть очень крутая идея: в будущем мы хотим через сказки учить детей новому языку. Колонка сможет рассказывать истории на двух языках, постепенно добавлять в знакомый язык новые слова и пополнять словарный запас. Это полезная функция и для взрослых, которые преодолевают языковой барьер или учат новый язык (мы обязательно расскажем об этом).
  • “Сәләм, Һомай”, — говорит малыш, и умная колонка включается, услышав свое имя. Эта функция у нас будет реализована, но на всякий случай мы оставим вариант включения по нажатию кнопки. Мы перестраховались, потому что у нас возникли проблемы с такой важной штукой как WakeWord.
Это то самое командное слово, которое распознается колонкой. Процесс происходит в структурном элементе девайса: то самое ключевое слово Хомай будет понимать не через удаленный сервер, а прямо тут, внутри корпуса.
Мы уже писали о том, как собирали библиотеку голосов, и так получилось, что нас там практически нет детсадовцев. А детская речь очень сложна для распознавания: даже любящие родители порой не понимают, что же им пытается сказать юный экспериментатор с языковыми конструкциями. Возможно, не все детские голоса могут быть распознаны.
Конечно, это не навсегда. Потом мы обязательно добавим такие варианты произношения в наш датасет, и после обновления колонка сможет распознать больше разных голосов.
Пока мы подстраховались с планом Б. И это тоже по-своему неплохо, в конце концов, дети обожают трогать и нажимать кнопки!
По этой же причине дети не смогут вести с “октябрьскими” колонками долгие беседы, Хомай пока просто не сможет их понять.
Хотим ли мы решить эту проблему в будущем? Обязательно! Но пока сроки поджимают, а мы видим цель, не видим препятствий.
Когда у нас в работе появляется затык, и все бесит, и кажется, что выхода нет, мы выдыхаем, наливаем чай с мәтрүшкә, садимся возле окна и представляем, как малыш подходит к колонке, нажимает кнопку, просит рассказать сказку, и приятный женский голос начинает: “Борон-борон заманда, йәшәгән ти бер малай…”. На душе становится теплее, и сразу понятно, что трудности победить можно, а цель наша стоит того, чтобы ломать голову.
Хотите узнавать о выходе новых статей сразу же? Подпишитесь на наш канал в Телеграме:

Хомай/Homai/Һомай - на русском языке
Һомай - на башкирском языке