Яңылыҡтар

Башҡорт теле өсөн спелл-чекер: идеянан алып тормошҡа ашырыуға тиклем

Башҡорт теле өсөн спелл-чекер: идеянан алып тормошҡа ашырыуға тиклем

Диктант тикшерелгән! Башҡорт теле уҡытыусыһы дәфтәрҙәр тарата. Дәфтәрҙе асаһың, ә унда хаталар ҡыҙыл төҫ менән төҙәтелгән. Дәфтәрҙең ситенән өндәү билдәләре ҡуйылған, эштең аҫтында 3+ билдәһе тора 🤔 Мәктәптә уҡығанда беҙҙең кемебеҙ генә:”Эх, хатаһыҙ яҙыусы ҡәләм булһа икән!...” - тип хыялланманы икән.
30 йылдан ашыу ваҡыт елеп үтеп тә киткән. Хыялға бирелеүсе мәктәп уҡыусылары үҫеп етеп, башҡорт телендәге текстарҙың барлыҡ хаталарын һыҙып күрһәтеүсе программа уйлап таптылылар. Улар баһа ҡуяһы урынға, уҡыусының эшендәге хаталарҙы төҙәтергә һәм дөрөҫ яҙылышты күрһәтергә тәҡдим дә индерә.
Мөғжизәме? Эйе, тик хыялды тормошҡа ашырыуҙа тылсымлы таяҡтың һис кенә кәрәге булманы. Беҙ һеҙгә башҡорт теле өсөн тәғәйенләнгән спелл-чекер (орфографик хаталарҙы төҙәтеү программаһы) нисек эшләй икәнлеге хаҡында һөйләмәксебеҙ http://tiksher.eu/.ҙ.

Венгер эҙҙәре

Текстарҙа хаталар табыу - бөтә донъя буйынса күп һанлы лингвистарҙы һәм программистарҙы берләштергән ҡыҙыҡлы мәсьәлә. Беҙҙең эш буш урындан башланманы. Hunspell китапханаһын эшләгән Венгрия биологы һәм ирекле программа тәьминәтен уйлап табыусыһы Ласло Неметтың хеҙмәте беҙҙең башланғысыбыҙҙың төп нигеҙен тәшкил итте.
Был - орфографияны тикшереү өсөн һәр кем ҡуллана ала торған бушлай программа. Тәү баштан ул ҡатмарлы һүҙьяһалыш системалы һәм киң күләмле морфологиялы телдәргә (мәҫәлән, программаны уйлап табыуысы үҙе һөйләшкән венгр теленә) тәғәйенләнгән.
Башҡорт теле, венгр, эстон, баск, фин, төрөк һәм башҡа телдәр кеүек агглютинатив телдәр рәтенә ҡарай. Бындай һүҙьяһалыш тамыр һүҙгә ялғауҙар ҡушыу ярҙамында барлыҡҡа килә. Мәҫәлән, “бала” (ребенок) – “бала-лар” (дети) – “бала-лар-ым” (мои дети). Рус телендә өс төрлө һүҙ менән билдәләнгәнде башҡорт телендә аффикстар, ялғауҙар ярҙамында ябай ғына итеп яһап була.
Һүҙьяһалыштың ҡайһыныһы һүҙҙең тамыры, ҡайһыныһы аффикс икәнен, ялғауҙарҙың дөрөҫ ҡулланылышын нисек аңларға? Бының өсөн китапхана һәм алгоритмдар бар: яһалма һүҙьяһалыштағы һүҙҙәр һанының бәйләнешен таныу, һүҙьяһалыш эсендәге аффикстарҙы эшкәртеү…
Ҡатмарлымы? Әлбиттә, ҡатмарлы!

Ярҙам ҡулы һуҙыусылар

Беренсе яҡшы яңылыҡ - күпселек эште был өлкәләге юл ярыусылар беҙгә тиклем эшләп өлгөргән ине инде!
Икенсе яҡшы яңылыҡ - башҡортса спелл-чекерҙы беҙ команда менән берлектә булдырҙыҡ. Беҙгә ярҙам иттеләр:
⭐ Андрей Чемышев @chemyshev программист, марий телен цифрлаштырыусы активист;
🌟 Рәмилә Каримова @karramnig, ҡағиҙәләрҙе тикшереп, әҙерләп биреүсе Рәсәй Фәндәр академияһы Өфө федераль тикшеренеү үҙәгенең Тарих, тел һәм әҙәбиәт институты лингвисы;
🔥 Жангузель @Ianguzel, сайттың ябай, әммә аңлайышлы тышҡы йөҙөн булдырыусы дизайнер,ул булдырған тышлыҡ һәр ҡулланыусы файҙалана алырлыҡ еңел, бер нәмә лә иғтибарҙы ситкә тартмай, текст мөхәррирләү менән ҡулланған һәр кемгә үҙенән үҙе аңлашылып тора;
🏆 Ильяс Насыров @Ilyas_nasurov, сайтты булдыдырған студент-программист;
🪴 беҙҙең блогты уҡыусы @sharddin һәм @bushidze, улар беҙгә атамалар уйлап сығарыра ярҙам итте (http://tiksher.eu/ — “Тикшереү”-ҙең тәржемәһе “проверять”).
Ихтимал, һеҙ: "Мари һәм башҡорт телдәре шул тиклем оҡшашмы? Уртаҡ алгоритмдар ҡулланырға мөмкинме?" - тип һорарһығыҙ. Был һорауҙарға, бер яҡтан, ыңғай, икенсе яҡтан, кире яуап бирергә мөмкин. Эйе, беҙҙең телдәр агглютинатив телдәр системаһына ҡарай, әммә башҡорт теле - төрки, ә мари теле фин-уғыр төркөмдәренә инә.
Hunspell алгоритмдары менән эшләүебеҙ ике тел өсөн дә уртаҡ башланғыс булып тора. Hunspell алгоритмдары һәр кем өсөн асыҡ һәм теләһә ҡайһы телдең орфографияһын тикшереүҙе алгоритмлаштырыуҙы ябайлаштырыу өсөн эшләнгән. Беҙҙе программалаусылар берләшмәһенең үҙ-ара ярҙам итеүе бик рухландыра. Ниндәй ҙә булһа файҙалы эш эшләгәндән һуң, башҡалар ҙа уларҙың аҡыл хеҙмәте һөҙөмтәләре менән файҙаланһын өсөн, улар үҙҙәренең хеҙмәттәре менән уртаҡлаша,: сайттың сығанаҡтары асыҡ, уны нисек эшләтеп ебәреү тураһында инструкция бар, файлдарҙы күрһәтергә һәм интерфейсты тәржемә итергә мөмкин (ул бик ябай).
Башҡа китапханалар менән эш иткәндә лә,
Тикшереү
tiksher.eu
интеграциялау ауырлыҡ тыуҙырмай, сөнки эштең иң ҡатмарлы өлөшө - сайтта төймәгә баҫыу менән хатаны төҙәтеү варианттарын күрһәтеүсе яңы тәҙрә асылһын өсөн, хатаның аҫтына һыҙып билдәләнә.
Беҙҙә бөтә донъя энтузиастарын берләштереүсе команда тупланған. Беҙ автоматик тәржемәләүҙе, орфографияны тикшереү сервистарын, туған телде синтезлау һәм таныуҙы булдырып, телде цифрлаштырыу базаһы киң ҡулланылһын өсөн, бар көсөбөҙҙө берләштерергә ынтылабыҙ.
Эйе, беҙҙең телдәр төрлөсә яңғырай, әммә
Тикшереүtiksher.eu
бөтә был процесс өсөн дә коды бер төрлә. Беҙҙең проект та тап шулай атала: “Телдәр төрлә, ә код – бер үк” . . Шуға күрә мин, үҙемә тиклем эшләгән киң күңелле кешеләр кеүек, интеллектуаль хеҙмәт һөҙөмтәләрем менән уртаҡлашам, һәм ул, һис шикһеҙ, кемгәлер интернет һәм гаджеттарҙы башҡорт телендә һөйләшергә һәм уны аңларға өйрәтеүҙә алға табан тағы ла бер аҙым яһарға ярҙам итер, тип ышанам.
https://github.com/Ilyas909/Bashkort_SpellChecker.
🔥Был кодты ҡулланып, башҡортса әҙер спелл-чекерҙы LibreOffice сервистарына еңел интеграциялау мөмкин.
Һеҙ ни тиерһегеҙ, коллегалар?
🤯