මෙපමණ කලක් අතින් වචන ටයිප් කරපු අපට කටින් වචන කියන කොට ටයිප් වෙන තාක්ෂණය ( voice recognition) දෙන්න ගූගල් ආයතනය කටයුතු කරලා තියෙනවා. ගූගල් එකට සිංහල ගියේ කොහොමද? අපි ඒ ප්රශ්නෙට උත්තරේ හොයාගෙන ගියා ලංකාවේ පෙරලිකාරම ජංගම දුරකථන යෙදවුමක් වූ “හෙළකුරු” නිර්මාණය කළ භාෂා ආයතනයේ නිර්මාතෘ ධනික පෙරේරා හමුවෙන්න.
කවුද මේ ධනික පෙරේරා ?
හෙළකුරු නිර්මාතෘ ධනික පෙරේරා යනු සම්මාන ගණනාවකින් පිදුම් ලැබූ තරුණ ව්යවසායකයෙක් වගේම මොරටුව සරසවියෙන් උපාධිය ලැබූ පරිගණක ඉංජිනේරුවෙක්. 2011 වර්ශයෙදි තමන්ගේම ව්යාපාරයක් ලෙස භාෂා ලංකා සමාගම ආරම්භ කරන ඔහු මේ වන විට වසරේ යොවුන් පරිගණක විද්යාඥයා, වසරේ නැගී එන ව්යවසායකයා, වසරේ නැගී එන තොරතුරු තාක්ෂණ නියමුවා සහ වසරේ හොඳම තොරතුරු තාක්ෂණ ව්යවසායකයා යන සම්මාන වලින් පිදුම් ලබා තිබෙනවා.
කළුතර සිරිකුරුස විද්යාලයෙන් සිප්සතර හදාරා, පසුව මොරටුව විශ්ව විද්යාලයේ පරිගණක විද්යාව හා ඉංජිනේරු අධ්යන අංශයට සුදුසුකම් ලබන ඔහුගේ විශාලම හීනයක්ව පැවතියේ සිංහල භාෂාවෙන් මෘදුකාංග නිර්මාණය කිරීමයි. තම උසස් පෙළ ව්යාපෘතියට “මානවයා” නමින් උසස් පෙළ ජීව විද්යා සිංහල පරිගණක මෘදුකාංගයක් නිර්මාණය කරන ධනික විශ්ව විද්යාලයේ තුන් වන වසරේ දී තම කේවල ව්යාපෘතිය ලෙස “සෙට් බ්රවුසරය” නිර්මාණය කරයි. ඒ, එකල ජංගම දුරකථන වලින් සිංහල වෙබ් අඩවි පරිශීලනයට තිබූ සීමා මායිම් කඩා බිඳ දැමීමටයි. එය 2011 වසරේ දකුණු ආසියානු “එබ් බිලියන්ත්” මෘදුකාංග තරඟාවලියේ දී සම්මානයට පාත්ර වුණා. පසුව ජංගම දුරකථන සේවා සැපයුම් ආයතන වලින් එම මෘදුකාංගයට ලද ඉල්ලුම හමුවේ භාෂා ලංකා පෞද්ගලික සමාගම ආරම්භ කෙරුණා.
සිංහලෙන් කියවිමට හැකියාවක් තිබුනද, ප්රතිචාර දැක්විම සිංහල භාෂාවෙන් කළ නොහැකි වීම මීළඟ ගැටළුව විය. ඒ වෙනුවෙන් බොහෝ විට පුද්ගලයන් භාවිතා කලේ “singlish’ ක්රමයයි. මෙතරම් ලස්සන අක්ෂර මාලාවක් ඇති භාෂාවකින් එරට වැසියන්ට අකුරු කර ගැනීමේ හැකියාව ලබා දීමේ අරමුණෙන් මීළඟට ඔවුන් හඳුන්වා දුන් පෙරළිකාර නිර්මාණය එළිදකින්නේ 2012 දී බණ්ඩාරනායක සම්මන්ත්රණ ශාලාවේ පැවති ඉන්ෆොටෙල් ප්රදර්ශනයට සමගාමීවයි. ඒ “හෙළකුරු” ය. මෙම නිර්මාණය ජනගත වීමත් සමඟ තම සිතැඟි එලෙසම ලිවීමට හැකියාව ජනතාවට උදා වුනා. එතැනින් පටන් ගත් ඒ ගමන අද කථන හඳුනා ගැනීමේ යතුරු පුවරුව තෙක් ඔබව ගෙන යාමට සමත් වෙලා තියෙනවා.
“හෙළකුරු” නිර්මාණය ඔබ දකින තරම් සරල නෑ
ඕනෑම කාරණාවක දී මෙන්ම හෙළකුරු නිර්මාණයේ දීත් බාධක පැමිණ තිබෙනවා. සිංහල වැනි විශාල වපසරියක විහිදුනු භාෂාවක් ජංගම දුරකථන යතුරු පුවරුවට ගැනීමත් එක්තරා විදියක විප්ලවයක්. ඒ ගමනේ පැමිණි බාධක කිහිපයක් පිළිබඳ අපි ධනික පෙරේරාගෙන් විමසීමක් කළා.
1. මුල් කාලීනව අනෙකුත් ජංගම දුරකථන යෙදවුම් වලට සිංහල සහය නොදැක්වීම
හෙළකුරු නිර්මාණය වන්නේ ජංගම දුරකථනයවල ඕනෑම යෙදුමක සිංහල යතුරු කළ හැකි ලෙසයි. නමුත් හෙළකුරු හඳුන්වා දුන් මුල් කාලයේ බොහෝ ජංගම දුරකථන වල සිංහල සහය නොතිබීම නිසා ඔවුන්ම නිපදවූ සෙට් බ්රවුසරයේ හැර අනෙකුත් යෙදුම් වල (Facebook, WhatsApp, Viber ආදී) සිංහල භාෂාව සහය නොදැක්වීම අභියෝගයක් වුනා. මෙහිදී වූ ගැටළුව වූයේ තමන්ට යමක් සටහන් කිරීම කළ හැකි වුනත් එය අදාළ යෙදුමේ දර්ශනය නොවීමයි. මෙයට පිළියමක් ලෙස භාෂා ආයතනය විසින් “සිංහල පෙරදසුන් තීරුව” හෙවත් Sinhala Preview bar නම් විකල්පය හෙළකුරුට හඳුන්වා දුන්නා.
2. සම්ප්රදායක සිංහල යතුරු පුවරුව නවකයන්ට තරමක් සංකීර්ණ වීම
හෙළකුරු යතුරු පුවරුවට කලින් පැවති ක්රමය වුනේ විජේසේකර සිංහල යතුරු ලියනය වන අතර මෙය අලුතෙන්ම සිංහල භාෂාව යතුරුකරන අයකුට තරමක් අපහසු එකක් වුනා. එයට අපූරු පිළියමක් ලෙස හෙළකුරු විසින් හදුන්වා දුන්නේ “ස්මාර්ට් ෆොනටික්” හෙවත් “ශබ්දානුකූල යතුරු පුවරු ක්රමය”, එහෙමත් නැත්නම් නම් Singlish ආකාරයට අප සටහන් කරන වචන ඒ අයුරින්ම නියම සිංහල වචන බවට පරිවර්තනය කිරීමයි. ඒය ඉතාමත් ජනප්රිය වුනා.
3. සම්මත විජේසේකර යතුරු පුවරුව සංකීර්ණ වීම
එමෙන්ම බොහෝ දෙනාගේ ඉල්ලීම පරිදි විජේසේකර ක්රමයද මෙයට යම් සංස්කරණ කිහිපයකින් පසු එකතු කළා. මෙම යතුරු පුවරු ක්රමය අතීතයේ පැවති යතුරුලියන වල හා පසුව පරිගණක වලට සම්මතය ලෙස සැකසූ ක්රමය නිසා කුඩා තිරයකින් යුතු ජංගම දුරකථන වලට මෙම ක්රමය එලෙසින්ම හඳුන්වා දීම අභියෝගයක් වුනා. මෙයට පිළියමක් ලෙස විජේසේකර ක්රමය ජංගම දුරකථනයට එලෙසින්ම හඳුන්වා දෙනු වෙනුවට ජංගම දුරකථනයට සරිලන සේ long press වැනි ක්රමවේද භාවිතා කරනු ලැබුවා. මේ හරහා යම් යම් වෙනස්කම් කිරීම් සහ වැඩිදියුණු කිරීම් සිදු කලා. ඉන්පසුව විජේසේකර ක්රමයට හුරු වූ අය වෙනුවෙන් එය නිර්මාණය කරනු ලැබුවා. ඉන්පසු එය “ස්මාර්ට් විජේසේකර” ක්රමය නමින් හෙළකුරු හා එක් වුනා.
4. වදන් යෝජනා, එසේ නැතිනම් Word Prediction තාක්ෂණය සිංහලට හඳුන්වාදීමේ සංකීර්ණතා
මේ අතරවාරයේ ඉංග්රීසි යතුරු පුවරු සඳහා Word Prediction තාක්ෂණය පැමිණ එය ඉතා ජනප්රිය වෙමින් තිබුනා. සිංහල සඳහාත් මෙම තාක්ෂණය නිර්මාණය කරන්නට භාෂා ආයතනය කටයුතු කළ ද අකුරු 26 ක් පමණක් ඇති ඉංග්රීසි භාෂාවට මෙම තාක්ෂණය නිර්මාණය කරනවාට වඩා අකුරු විශාල සංඛ්යාවක් හා පිලි සමඟින් එක්වූ අකුරු සංයෝජන විශාල ගණනක් ඇති සිංහල භාෂාවට මෙම තාක්ෂණය නිර්මාණය කිරීම අභියෝගාත්මක වුනා. කෙසේ නමුත් විවිධ විකල්ප තාක්ෂණික ක්රමවේද උපයෝගී කරගනිමින් සිංහල භාෂාවටද මෙම තාක්ෂණය ඉංග්රීසි භාෂාව හා කරට කර වැඩ කරන ලෙස සාර්ථකව හඳුන්වා දීමට භාෂා ආයතනයට හැකි වුනා.
5. ලෝකයේ අනෙකුත් යතුරු පුවරු හා තරඟකාරී ලෙස යාමට යුතු වීම
ඔබ හෙළකුරු භාවිතා කර අයෙක් නම් ඔබත් එක් වරක් හෝ භාෂා සමාගමෙන් තුවක්කු ඉමොජිය ඉල්ලා කරදර කර නැති වෙන්නට බැහැ. එයට පිළියම ලෙස සම්පුර්ණ ඉමොජි (සිනහා මුහුණු) කට්ටලයම මෙම හෙළකුරු යතුරු පුවරුව භාවිතා කරන අයට හෙළකුරු සමාගම විසින් ලබා දී තිබුණා. අන්තර්ජාතික යතුරු පුවරු යාවත්කාලීන වන තරම්ම වේගයෙන්ම මෙම යතුරු පුවරුවත් යාවත්කාලීන කිරීමේ අභියෝගය නම් හෙළකුරු යතුරු පුවරුව මනාවට ජයගෙන තිබෙනවා.
කොහොමද කියන වචන ටයිප් වෙන්නේ ?
මෙම තාක්ෂණය ඉතාමත් සංකීරණ එකක් වන නමුත් ධනික පෙරේරා විසින් එය සරලව පැහැදිලි කළා.
මෙහිදී සිදුවන්නේ මයික්රෆෝනය සක්රිය කර අප විසින් පවසන දේවල් කෙටි හඬ කොටස් ලෙස, එසේත් නැත්නම් ශබ්ද ස්ට්රීම් එකක් (audio stream) ලෙස ගූගල් සර්වර වලට ගොස්, එහිදී ගූගල් කථන හඳුනාගැනීමේ යන්ත්ර (Speech Recognition Engine) මඟින් එම හඬ හඳුනාගෙන, හඳුනාගත් වචන සිංහල යුනිකේත හරහා අප වෙත නැවත එවීමයි. එසේ එන වචන තිරය මත සිංහල අකුරෙන් අපිට දිස් වෙනවා. එම නිසා තරමක් වේගවත් අන්තර්ජාල සම්බන්ධතාවක් ඔබ මෙම සේවාව ලබා ගැනීමේදී භාවිතා කළ යුතු වෙනවා.
නමුත් සමහරවිට ඉදිරියේදී මෙය ඔබට අන්තර්ජාලය නොමැතිව වුවද භාවිතා කළ හැකි වනු ඇතියි ඔහු විශ්වාසය පළ කළා.
හෙළකුරු වොයිස් ටයිපින්
හෙළකුරු යතුරු පුවරුවට මෑත කාලීනව මෙය හඳුන්වා දුන්නත් භාෂා ලංකා සමාගම මීට වසර ගණනාවක සිටම මේ වෙනුවෙන් වැඩ කටයුතු කර තිබෙනවා. මුල් කාලීනව මෙම තාක්ෂණය ඔවුන් විසින්ම නිර්මාණය කිරීමට අදහස් කළත්, එයට අදාළ තාක්ෂණික පර්යේෂණ කටයුතු ශ්රී ලංකාවේ විශ්ව විද්යාල මට්ටමින් පවා සිදුවෙමින් තිබී තිබෙන්නේ ඉතාම ප්රාථමික මට්ටමකයි. කථන හඳුනාගැනීමේ තාක්ෂණය නිමි නිෂ්පාදනයක් වී ජනතාව අතරට එන සේයාවක් හෝ එකල තිබී නැහැ. මේ අතරවාරයේ ගූගල් සමාගම ඉංග්රීසි හා අනෙකුත් ප්රධාන භාෂාවන් සඳහා නිර්මාණය කර තිබූ ඔවුන්ගේ කථන හඳුනාගැනීමේ සේවාවට සිංහල භාෂාව එක් කරන්නට කටයුතු කරමින් සිටින බව භාෂා ආයතනයට දැන ගැනීමට ලැබී තිබෙනවා. ගුගල් ආයතනයේ ඉංජිනේරු උපදේශකයෙකු ලෙස සේවය කරන ශ්රී ලාංකිකයෙකු වන කේෂාන් සෝඩිමාන හරහා මෙම කටයුත්තේ ශ්රී ලාංකේය සම්මාදම්කරුවා වන්නට භාෂා ආයතනයට හැකිවී තිබෙනවා.
2015 ලංකාවට එන ගූගල්
2015 දී ගූගල් ආයතනයේ ස්වාභාවික භාෂා සැකසුම් කණ්ඩායම (Natural Language Processing Team) ලංකාවට පැමිණෙන අතර කේෂාන් සෝඩිමානගේ සම්බන්ධීකරණය මත භාෂා ආයතනය ගූගල් කණ්ඩායම හා මෙම කටයුත්තේ මුලික සාකච්ඡා ආරම්භ කරනු ලබනවා. ඉන්පසු භාෂා ආයතනය විසින් එම වසරේදීම සිංගප්පුරුවේ තිබෙන ගූගල් ආයතනයේ ශාඛාව හා සම්බන්ධ වන අතර, මෙහිදී මෙයට අදාළ අවබෝධතා ගිවිසුම අත්සන් කිරීම සිදු වෙනවා. මෙහිදී භාෂා ආයතනයේ කාර්ය වී තිබුණේ ගූගල් ආයතනය විසින් නිර්මාණය කර තිබූ කථන හඳුනාගැනීමේ තාක්ෂණය සිංහල භාෂාවට හුරු කරවීමට දායක වීමයි. 2016 දී මෙයට අදාළ වැඩකටයුතු නිමා වෙන අතර ඉන් වසරකට පසුව, එනම්, 2017 දී ගූගල් සමාගම විසින් සිංහල භාෂාව කථන හඳුනා ගැනීමේ තාක්ෂණය හා යාවත්කාලීන කරනවා.
සිංහල කථන හඳුනා ගැනීමේ තාක්ෂණය හඳුන්වා දීම වෙනුවෙන් ගූගල් සමාගම හා සම්බන්ධ වීමට හැකිවීම භාෂා ආයතනය ලැබූ අභිමානවත් ජයග්රහණයක් බව ධනික පෙරේරා පවසනවා. එමෙන්ම දෙවසරකට පෙර එදා තමන් දායක වූ දෙයහි ප්රතිපල අද දකින විට තමන් ඊටත් වඩා සතුටු වන බවත් ඔහු ප්රකාශ කළා. එමෙන්ම මේ සඳහා ගූගල් සමාගමෙන් දායක වූ කේෂාන් සෝඩිමාන ඇතුළු කණ්ඩායමටද මෙහිදී ඔවුන් විශේෂ ස්තූතියක් පළකර සිටියා.
ගූගල් ආයතනය මෙම කථන හඳුනාගැනීමේ සේවාව ජනතාව අතරට ගෙන යාමට යොදාගනු ලබන එක් යෙදුමක් ලෙස ගූගල් ජීබෝඩ් යතුරුපුවරුව හඳුන්වා දෙන්න පුළුවන්. එමඟින්ද කථන හඳුනාගැනීම සිදුකරන්නේ ඉහත සේවාව මඟිනුයි. එය නිකුත් කර දින තුනක් යන තැන එය ශ්රී ලාංකිකයන් මිලියන 2කට අධික ප්රමාණයක් භාවිතා කරන හෙළකුරු හා එම සේවාව සම්බන්ධ කිරීමට භාෂා කණ්ඩායමට හැකිවෙනවා.
හෙළකුරු Voice typing විශේෂ වෙන්නේ ඇයි ?
මෙහි විශේෂම කරුණ වන්නේ අප මෙතෙක් භාවිතා කරමින් සිටි හෙළකුරු යෙදවුමට යාවත්කාලීන කිරීමෙන් පමණක් මෙය භාවිතා කළ හැකි වීමයි. මේ නිසා මෙය තවදුරටත් ජනතාවට නුහුරු දෙයක්, නැතහොත් අලුතෙන්ම හුරුවිය යුතු දෙයක් ලෙස සංකීර්ණ දෙයක් වෙන්නෙ නැහැ. ඔබ කළ යුතු එකම දෙය වන්නේ Google Play Store එක හරහා මෙය යාවත්කාලීන කිරීමයි. ඉන්පසු යතුරු පුවරුව මත දිස්වන මයික්රොෆ්රෝන ලකුණ ස්පර්ශ කර ඔබටත් මෙම සේවාව භාවිතා කළ හැකි වෙනවා. මෙය ඇත්තෙන්ම යතුරුකරණයේ නවතම පෙරළියක් වනු නිසැකයි. ඊට අමතරව මෙම සේවාව සඳහා ගූගල් කථන හඳුනාගැනීම හරහා ලබාගන්නා හඳුනාගැනීම් ඔබට දර්ශනය වීමට පෙර හෙළකුරු යෙදුම මඟින් තවත් වැඩිදියුණු කිරීමක් සිදු කරන හෙයින් ශ්රී ලංකාවේ මිලියන 2ක ජනතාවට හෙළකුරු හරහා වඩා නිරවද්යව මේ සේවාව අත්විඳීමේ අවකාශය ද ලැබී තිබෙනවා.
Voice typing යතුරු පුවරු විශ්රාම යවයි ද ?
මෙම පැනයට ධනික පෙරේරා මෙහෙම පිළිතුරක් ලබා දුන්නා.
“අපි ප්රායෝගිකව කල්පනා කර බැලුවොත්, හඳුන්වා දෙන මොහොතේ මෙය යම් උන්මාදයට හේතූ වන තරමේ තාක්ෂණයක් වුවත් මේ කථන හඳුනාගැනීමේ ක්රමය ප්රායෝගිකව සෑම මොහොතමකම භාවිතා කිරීමේ හැකියාව අඩුයි. ඒ නිසා යතුරුපුවරුව යන දේ විශ්රාම යාමක් සිදු වෙන්නේ නෑ. එසේ වුනා නම් එය මීට පෙර වෙනත් භාෂා වෙනුවෙන් මෙම කථන හඳුනාගැනීමේ පහසුකම ලැබීමත් සමගම සිදු විය යුතුව තිබුණා, නමුත් එසේ වී නැහැ. එම නිසා තවදුරටත් අපගේ හෙළකුරු යතුරුපුවරු සේවාවන් වැඩි දියුණු කිරීම ද අප දිගටම සිදු කරනු ලබනවා.”යැයි ඔහු පැවසීය.
හෙළකුරු ඉස්සරහට මොනවා කරයි ද ?
හෙළකුරු යෙදවුම මේ වන විට ජංගම දුරකථන භාවිතා කරන්නන් අතර සන්නාමයක් බවට පත්ව තිබෙනවා. ඒ නිසා ඉදිරියේදී හෙළකුරු යෙදවුම තවදුරටත් හුදෙක් අකුරු ලියන යතුරු පුවරුවකින් එහාට ගොස් සේවා ගොන්නකින් යුතු “සුපර් ඇප්” යන සංකල්පයට ඉදිරියේදී යාවත්කාලීන වනු ඇති අතර ඒ හරහා ආපදා අවස්ථා වැනි ජාතික තත්ත්වයන් වලදී සේවා සහය දැක්වීම මේ වන විටත් ක්රියාත්මකව පවතිනවා.ඒ හරහා ශ්රී ලාංකිකයෙකුට ජංගම දුරකථනය යෙදුමක් හරහා ලබාගත හැකි ඕනෑම ආකාරයේ සේවාවක් හෙළකුරු මඟින් ලබාගත හැකියාවක් ලැබේවී.
ඔබ මෙය කියවන මොහොතේදී ඔබට www.helakuru.lk වෙබ් අඩවියෙන් පරිගණකය හරහා ද හෙළකුරු වොයිස් ටයිපින් පහසුකම භාවිතා කිරීමේ හැකියාව පවතින අතර, එයින් යුනිකෝඩ් හා අප Photoshop වැනි මෘදුකාංග වල භාවිතා කරන ලෙගසි ෆොන්ට් ආකාරය යන දෙආකාරයකටම පිටපත් ලබා ගැනීමේ හැකියාවක් පවතිනවා. එය හරහා ඔබගේ වැඩ කටයුතු තවත් පහසු කර ගැනීමේ හැකියාyව ලැබෙනවා.
භාෂා ලංකා ආයතනය මේ වන විට ගූගල් ආයතනයේ ක්රමෝපායික සහකරුවෙක් (Strategic Partner) ලෙස ද කටයුතු කරන අතර ඉදිරියේදීද අපට ඔවුන්ගෙන් තවත් මෙවන් විශ්මයජනක තාක්ෂණික නිර්මාණයන් දැකබලාගත හැකි වේවි.
ඉතින් අලුත් අලුත් දේ තනන මෙවන් අලුත් නිර්මාණකරුවන් ගෙන ඔබ දන්නා දේවල් අපිත් එක්ක බෙදාගන්න අමතක කරන්න එපා .
කවරය – .bp.blogspot.com