Чего НЕ будет уметь умная колонка для детских садов?
2023-10-30 18:00
Недавно мы рассказали вам про то, что будет уметь наша умная колонка Хомай, которая появится в октябре в пяти детских садах. Если вы не читали — обязательно почитайте (вот тут), а пока спойлер: она будет на правильном красивом башкирском языке рассказывать сказки.
Помните, как бывает в сказках? У всякого магического предмета есть действие, для выполнения которого он предназначен: горшочек варит кашу, клубок показывает дорогу. И мы понимаем: есть действия, которые даже самая волшебная палочка сделать не сможет.
Так же и в нашей истории. Когда мы рассказали, что первые октябрьские колонки будут уметь, самое время сказать, чего они НЕ будут уметь (это грустная часть, но про нее обязательно нужно поговорить).
Умные колонки по проектам “Әминә” не будут уметь работать с контентом. Хомай не поставит Айдара Галимова и Өфө йүкәләре. Да, старшие сестры Хомай (Siri, Alexa, Алиса и Cortana) завоевали себе расположение людей во всем мире, подбирая музыку под настроение, включая и выключая аудиокниги и подкасты. У нас пока нет доступной библиотеки контента, но есть договоренность с несколькими исполнителями, чьи песни можно будет ставить. Надеемся, в будущем таких возможностей станет больше!
Есть ли в этом плюсы? Хитрые родители, которые уже пытались ограничить потребление мусорной информации для своих детей, уже тянут руку вверх: “Да, плюсы первого поколения наших умных колонок в том, что информация от Хомай будет проверенная, без мата, запрещенного контента и пока только на башкирском языке”. Идеально для наших целей, верно?
Кстати, у нас есть очень крутая идея: в будущем мы хотим через сказки учить детей новому языку. Колонка сможет рассказывать истории на двух языках, постепенно добавлять в знакомый язык новые слова и пополнять словарный запас. Это полезная функция и для взрослых, которые преодолевают языковой барьер или учат новый язык (мы обязательно расскажем об этом).
“Сәләм, Һомай”, — говорит малыш, и умная колонка включается, услышав свое имя. Эта функция у нас будет реализована, но на всякий случай мы оставим вариант включения по нажатию кнопки. Мы перестраховались, потому что у нас возникли проблемы с такой важной штукой как WakeWord.
Это то самое командное слово, которое распознается колонкой. Процесс происходит в структурном элементе девайса: то самое ключевое слово Хомай будет понимать не через удаленный сервер, а прямо тут, внутри корпуса.
Мы уже писали о том, как собирали библиотеку голосов, и так получилось, что нас там практически нет детсадовцев. А детская речь очень сложна для распознавания: даже любящие родители порой не понимают, что же им пытается сказать юный экспериментатор с языковыми конструкциями. Возможно, не все детские голоса могут быть распознаны.
Конечно, это не навсегда. Потом мы обязательно добавим такие варианты произношения в наш датасет, и после обновления колонка сможет распознать больше разных голосов.
Пока мы подстраховались с планом Б. И это тоже по-своему неплохо, в конце концов, дети обожают трогать и нажимать кнопки!
По этой же причине дети не смогут вести с “октябрьскими” колонками долгие беседы, Хомай пока просто не сможет их понять.
Хотим ли мы решить эту проблему в будущем? Обязательно! Но пока сроки поджимают, а мы видим цель, не видим препятствий.
Когда у нас в работе появляется затык, и все бесит, и кажется, что выхода нет, мы выдыхаем, наливаем чай с мәтрүшкә, садимся возле окна и представляем, как малыш подходит к колонке, нажимает кнопку, просит рассказать сказку, и приятный женский голос начинает: “Борон-борон заманда, йәшәгән ти бер малай…”. На душе становится теплее, и сразу понятно, что трудности победить можно, а цель наша стоит того, чтобы ломать голову.