বাংলাদেশ কম্পিউটার কাউন্সিল (বিসিসি) গণপ্রজাতন্ত্রী বাংলাদেশ সরকার
মেনু নির্বাচন করুন
Text size A A A
Color C C C C
সর্ব-শেষ হাল-নাগাদ: ২৮ মার্চ ২০১৯

গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ প্রকল্প

ক্রমিক নং

বিষয়বস্তু

 বিবরণ

প্রকল্পের নাম

“গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ” প্রকল্প

মেয়াদ

জুলাই ২০১৬ – জুন ২০১৯

প্রাক্কলিত ব্যয়

অর্থের উৎস

পরিমান

বৈদেশিক সাহায্য

০.০০ (লক্ষ টাকায়)

জিওবি

১৫৯০২.০৫ (লক্ষ টাকায়)

মোট

১৫৯০২.০৫ (লক্ষ টাকায়)

   

 

 

 

 

 

 

জনবল

কমকর্তা: ০২ জন

কমচারী: ০৭ জন

পরামর্শক: ০৭ জন

পটভূমি

বাংলা ব্যবহারের দিক থেকে পৃথিবীতে প্রভাবশালী ভাষাগুলোর একটি। বাংলা ভাষাভাষীর রয়েছে রক্তস্নাত ভাষা-আন্দোলনের ইতিহাস। দেশ ও ভাষার মর্যাদা রক্ষায় এই জাতির রয়েছে গৌরবময় ঐতিহ্য, রয়েছে ভাষার প্রতি দরদ, ভাষাকে সমুন্নত রাখার চেতনা। কিন্তু দুঃখজনক হলেও সত্য, বাংলা ভাষাকে প্রযুক্তিবান্ধব করার ক্ষেত্রে প্রয়োজনীয় ভিত্তি তৈরি হয়নি, বিশেষ করে কম্পিউটিংয়ে বাংলা ভাষাকে অভিযোজিত করার ক্ষেত্র--খুব বেশি অগ্রসর হয়নি । আনন্দের বিষয় যে, তথ্য ও যোগাযোগ প্রযুক্তি বিভাগের অধীনে বাংলাদেশ কম্পিউটার কাউন্সিলের এর তত্ত্বাবধানে আন্তর্জাতিক পরিসরে নেতৃস্থানীয় ভাষা হিসেবে বাংলাকে প্রতিষ্ঠার লক্ষ্যে বিশেষ করে, কম্পিউটিং ও আইসিটিতে বাংলা ভাষাকে অভিযোজিত করার উদ্দেশ্যে ‘গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ’  প্রকল্পের কাজ চলমান রয়েছে।

 

দেশকে ‘ডিজিটাল বাংলাদেশ’ হিসেবে গড়ে তোলার একটি প্রধান শর্ত বাংলা ভাষাকে প্রযুক্তিবান্ধব করা। তথ্য ও যোগাযোগ প্রযুক্তিতে বাংলা ভাষার ব্যবহার ও প্রয়োগ হলে দেশের প্রশাসনিক ব্যবস্থা, শিক্ষা ব্যবস্থা ও যোগাযোগ কাঠামোতে নতুন পরিবর্তন সূচিত হবে। আন্তর্জাতিক পর্যায়ে বাংলা ভাষাকে যথাযথ মর্যাদাদান ও উৎকর্ষে পৌঁছানো সম্ভব হবে।

 

লক্ষ্য ও উদ্দেশ্য

প্রকল্পের লক্ষ্য ও উদ্দেশ্য হচ্ছে আন্তর্জাতিক পরিসরে (Global Platform-এ) নেতৃস্থানীয় ভাষা হিসেবে বাংলাকে প্রতিষ্ঠা করা। বিশেষ করে, কম্পিউটিং ও আইসিটিতে বাংলা ভাষাকে অভিযোজিত করা বা খাপ খাইয়ে নেয়া- এ প্রকল্পের প্রধান উদ্দেশ্য। গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণের লক্ষ্যে প্রকল্পটির উদ্দেশ্য বাংলা ভাষার জন্য বিভিন্ন প্রযুক্তিমাধ্যমে (ওয়েব, মোবাইল, কম্পিউটার) ব্যবহারযোগ্য বিভিন্ন সফটয়্যার/টুলস/রিসোর্স উন্নয়ন করা, যাতে বাংলা ভাষা কম্পিউটারে ব্যবহার করতে কোনো প্রতিবন্ধকতা না থাকে।

 

প্রকল্পটির উদ্দেশ্য বাংলা ভাষার জন্য বিভিন্ন প্রযুক্তিমাধ্যমে (ওয়েব, মোবাইল, কম্পিউটার) ব্যবহারযোগ্য বিভিন্ন সফটওয়্যার/টুলস/রিসোর্স উন্নয়ন করা, যাতে বাংলা ভাষা কম্পিউটারে ব্যবহার করতে কোনো প্রতিবন্ধকতা না থাকে। এর মাধ্যমে বাংলা ভাষার জন্য ১৬টি সফটয়্যার/টুলস/রিসোর্স উন্নয়ন করা হবে। প্রধান কম্পোনেন্টেগুলো হলো: বাংলা করপাস উন্নয়ন, বাংলা থেকে পৃথিবীর প্রধান দশটি ভাষায় অটোমেটিক যান্ত্রিক অনুবাদক উন্নয়ন, বাংলা OCR উন্নয়ন (টাইপ করা ও হাতের লেখা অটোমেটিক শনাক্তকরণ ও কম্পোজ), কথা থেকে লেখা এবং লেখা থেকে কথায় রূপান্তর সফটওয়্যার, জাতীয় কিবোর্ড (বাংলা) এর উন্নয়ন, বাংলা ফন্ট রূপান্তর ইঞ্জিন, বাংলা বানান ও ব্যাকরণ সংশোধক উন্নয়ন, স্ক্রিন রিডার সফটওয়্যার উন্নয়ন, বাংলা অনুভূতি বিশ্লেষণের সফটওয়্যার উন্নয়ন, ক্ষুদ্র-নৃগোষ্ঠীর ভাষার জন্য কিবোর্ড উন্নয়ন প্রভৃতি।

 

কর্মযজ্ঞ সুসম্পন্ন হলে আশা করা যায়, মুখে উচ্চারিত বাংলা ভাষা স্বয়ংক্রিয়ভাবে কম্পোজ হয়ে যাবে, লিখিত টেক্সট কম্পিউটার পড়ে শোনাবে, মুদ্রিত বই-দলিল দ্রুত সফটকপিতে রূপান্তরিত হবে, বাংলা ভাষা সঠিক যান্ত্রিক অনুবাদ পাওয়া যাবে, বাংলা ভাষার বিশাল মৌখিক ও লিখিত নমুনা (করপাস) গড়ে উঠবে। এতে বিশ্বের দরবারে ও তথ্যপ্রযুক্তি জগতে বাংলা ভাষার মর্যাদা ও ব্যবহারযোগ্যতার মান বৃদ্ধি পাবে।

 

প্রকল্পের উল্লেখ্যযোগ্য কম্পোনেন্ট

বাংলা বানান ও ব্যাকরণ সংশোধক  (Bangla Spell & Grammar checker)

বানান পরীক্ষক ও ব্যাকরণ সংশোধক হলো বাংলা ভাষার বা শব্দ,বাক্য স্বয়ংক্রিয়ভাবে সম্পাদনা করার সফটওয়্যার। এই সফটওয়্যার কেবল ভুল বানান চিহ্নিত করবে তা নয়,বরং স্বয়ক্রিয়ভাবে সংশোধনের পরামর্শ দেবে। এই সফটওয়্যারের বানান পরীক্ষক অংশটি মোবাইল, কম্পিউটার, ওয়েবসহ অন্যান্য মাধ্যমে ভাষাগত  ভুল চিহ্নিত করবে এবং সঠিক বানান ব্যবহারে পরামর্শ দেবে। বিশেষ করে, একই রকম উচ্চারণ কিন্তু বানান ভিন্ন, একই রকম বানান কিন্তু অর্থ ভিন্ন এমন কনটেক্সট নির্ভর বানান ভুল বিষয়ে সংশোধনী দেবে।

 

ব্যাকরণ সংশোধক ভুল বাংলা বাক্য জানাতে সাহায্য করবে। সরল ও জটিল বাক্যের প্রচলিত সাধারণ ভুলগুলো চিহ্নিত করে ব্যবহারকারীর কাছে বিকল্পসহ সঠিক বাক্য উপস্থাপন করবে।  বানান ও ব্যাকরণ পরীক্ষক প্রুফরিডারের কাজ করবে, যা দ্রুত নির্ভুল রচনা নিশ্চিত করবে। এতে প্রকাশনা শিল্পে ও ওয়েব মাধ্যমে বাংলা ভাষা সঠিকভাবে ব্যবহারের সহজ পথ তৈরি হবে। এই বানান ও ব্যাকরণ পরীক্ষক সফটওয়্যারটি বাংলা একাডেমির প্রমিত বানানবিধি ও প্রমিত বানান অভিধানকে অনুসরণ করবে।

 

বাংলা ম্যাশিন ট্রান্সলেটর  (Bangla Machine Translator)

যান্ত্রিক অনুবাদের মাধ্যমে বাংলাভাষাকে বিভিন্ন ভাষায় স্বয়ংক্রিয়ভাবে অনুবাদ করা যায়। এর অনুবাদকের মাধ্যমে তথ্যমূলক বাংলা, দৈনন্দিন বাংলা, প্রাতিষ্ঠানিক রচনা/ডকুমেন্টস/ নথি, সংবাদ বিজ্ঞপ্তি, আবহাওয়া সংবাদ দ্রুত নির্ভুলভাবে অনুবাদ করা সম্ভব হবে। এই অনুবাদকের মাধ্যমে বাংলা থেকে ইংরেজি এবং ইংরেজি থেকে বাংলা ছাড়াও বাংলা থেকে স্প্যানিশ, ফরাসি, জার্মান, রুশ, মান্দারিন, জাপানিজ, কোরিয়ান, আরবি, হিন্দি ভাষায় এবং উল্লিখিত ভাষাগুলোকে থেকে বাংলায় অনুবাদ করা যাবে।

 

বাংলা ওসিআর (Bangla OCR )

কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির সাহায্যে মুদ্রিত বর্ণমালা ও হাতের লেখাকে শনাক্ত করা যায়। এই প্রযুক্তিতে যেকোনো ছবিতে বা অপরিবর্তনযোগ্য ফাইল ফরম্যাটে (পিডিএফ,জেপিইজি) থাকা বর্ণমালাকে কম্পিউটার শনাক্ত করতে পারে এবং দ্রুত তা অনুসন্ধানযোগ্য (searchable) টেক্সটে রূপান্তর করে দিতে পারে। এই কম্পোনেন্টের মাধ্যমে কম্পিউটার কম্পোজকৃত বাংলা, টাইপরাইটারে মুদ্রিত বাংলা এবং লেটারপ্রেসে মুদ্রিত বাংলা ডকুমেন্টকে স্ক্যান করে বা ছবি তোলার মাধ্যমে সার্চেবল ক্যারেকটারে রূপান্তরিত হবে। এই কম্পোনেন্ট বাংলা হাতের লেখা শনাক্ত করতে পারবে। এর মাধ্যমে বাংলা হাতের লেখা রয়েছে এমন একটি অপরিবর্তনযোগ্য ফাইল বা ছবিকে সিলেক্ট করার পর তাতে অঙ্কিত হাতের লেখা ইউনিকোডে রূপান্তারিত হবে। স্টাইলাস বা আঙুল দিয়ে প্যালেটে বা মোবাইল স্ক্রিনে বর্ণ বা শব্দ লেখার পর তা বাংলা ইউনিকোড টেক্সটে  রূপান্তরিত হবে

 

বাংলা টেক্সট টু স্পিচ, বাংলা স্পিচ টু টেক্সট সফটওয়্যার (Bangla speech to text & text to speech)

এই কম্পোনেন্টের মাধ্যমে বাংলা কথাকে লেখায় এবং লেখাকে কথায় রূপান্তরিত করা যাবে। রেকর্ড করা বা চলমান বাংলা কথাকে লেখায় রূপান্তর করবে স্পিচ টু টেক্সট (STT) সফটওয়্যার। এই অ্যাপ্লিকেশনটি সম্পন্ন হলে বাংলা ভাষার ভাষণ ও বক্তব্য দ্রুত লিখিত বা কম্পোজ অবস্থায় পাওয়া যাবে। বিভিন্ন সাক্ষাৎকার, বিবৃতি দ্রুত যন্ত্রের মাধ্যমে অনুলিখন করা যাবে, যার ফলে অনেক অর্থ-সময় ও শ্রম বাঁচবে।

পক্ষান্তরে টেক্সট টু স্পিচ (TTS) অ্যাপ্লিকেশন হলো ডিজিটাল টেক্সটকে উচ্চারিত শব্দে রূপান্তর করা। এই অ্যাপ্লিকেশন যাদের ডিসলেক্সিয়া (dyslexia) অর্থাৎ পড়ার অসুবিধা বা দৃষ্টি-বৈকল্য আছে তাদের উপকারে আসবে । এর ফলে স্বয়ংক্রিয়ভাবে যন্ত্রের মাধ্যমে সরকারি জরুরি বিজ্ঞপ্তি, নির্দেশনা, পত্রিকার শিরোনাম/ তাজা খবর শোনা যাবে। ওয়েবসাইটে প্রকাশিত লেখা সহজে শোনা যাবে।

 

বাংলা করপাস উন্নয়ন (Bangla Corpus)

বাংলা পৃথিবীতে ব্যবহৃত প্রধান ভাষাগুলোর একটি হলেও তথ্য-প্রযুক্তি ও ভাষা-প্রযুক্তির বিবেচনায় বাংলা এখনও শক্তিশালী ও রিসোর্সফুল ভাষা হয়ে উঠতে পারেনি।  বাংলা ভাষাকে রিসোর্সফুল ভাষায় উন্নীত করার প্রধান উপায়  হলো করপোরা তৈরি। বাংলায় এজন্য তৈরি হচ্ছে একটি বিশাল করপাস। করপাসটি হবে প্রতিনিধিত্বমূলক এবং ব্যালেন্সড । ভাষা-প্রযুক্তির ভাষায়, এটি মূলত অ্যানোটেটেড সিনট্যাকটিক ট্রি-ব্যাংক করপাস হবে। যার অন্তত শতকরা ১০ ভাগ গোল্ড স্ট্যান্ডার্ড রক্ষা করবে, বাকি ৯০ ভাগ সিলভার স্ট্যান্ডর্ড রক্ষা করবে। করপাসটি প্রতিনিয়ত নতুন র-ডেটা যুক্ত হওয়ার সুযোগ থাকবে, ফলে এটি দ্রুত বিশাল ভাণ্ডারে পরিণত হবে। এই করপাস ব্যবহার করে ‘মেশিন লানিং’ প্রযুক্তির মাধ্যমে কৃত্রিম বুদ্ধিমত্তাসম্পন্ন বিভিন্ন বাস্তব জীবনে ব্যবহারযোগ্য অ্যাপ্লিকেশন তৈরি করা যাবে। এই করপাসটি বিশাল তথ্যভাণ্ডার (বিগ ডেটা রিপোজিটরি)হিসেবে গড়ে উঠবে এবং সংখ্যাগত বিশ্লেষণের মাধ্যমে বাংলা ভাষার বৈশিষ্ট্য বৈজ্ঞানিকভাবে নির্ধারণ করা সুযোগ তৈরি হবে।  এই কম্পোনেন্টে করপাস সংগ্রহ, প্রক্রিয়াজতকরণ এবং বিতরণ ব্যবস্থা তৈরি হবে একটি পাইপলাইনের মাধ্যমে। যাতে বাংলা ভাষার করপাসকে আন্তর্জাতিক মান রক্ষা করে প্রতিনিয়ত সমৃদ্ধ করা সম্ভব হয়।

 

জাতীয় কিবোর্ড   (National Keyboard)

কম্পিউটারে নির্বিঘ্নে বাংলা কম্পোজ করার জন্য বাংলাদেশ কম্পিউটার কাউন্সিল কর্তৃক এর ‘জাতীয় বাংলা কিবোর্ড’-কে আরো উন্নত করা হচ্ছে। এর কিবোর্ড জাতীয় মান (BDS1538:2018) অনুসরণ করে তৈরি হবে। এর ফলে বিভিন্ন জনপ্রিয় অপারেটিং সিস্টেম যেমন, উইন্ডোজ, ম্যাকওএস, লিনাক্স, এন্ড্রয়েড ও আইওএস এ একই মান ও প্রক্রিয়া অনুসরণ করে বাংলা লেখা সম্ভব হবে। আশা করা যাচ্ছে, এই কিবোর্ডের মাধ্যমে মুদ্রণ জগতে ও ওয়েবে বাংলা ভাষা ব্যবহারের সকল জটিলতা ও প্রতিবন্ধকতা দূরীভূত হবে।

 

বাংলা ফন্ট কনভার্টার (Bangla font Converter)

বিভিন্ন ডিজিটাল মাধ্যমে যেমন, কম্পিউটার অপারেটিং সিস্টেম, ওয়েব ও মোবাইল প্লাটফর্ম-এ বাংলা ফণ্ট স্থানান্তরের সময় ভেঙে যায়। কখনো কখনো এক অ্যাপ্লিকেশন থেকে অন্য অ্যাপ্লিকেশনে (যেমন, ওয়ার্ড থেকে এক্সেল বা পাওয়ার পয়েন্ট)লেখা স্থানাস্তরের সময় ফন্ট ভেঙে যায়। এ ফন্টভাঙা সমস্যা থেকে মুক্তি পাওয়ার জন্য একটি ফন্ট এনকোডিং কনভার্টার তৈরি করা হচ্ছে, যা ফন্ট ইন্টারঅপারেবল ইঞ্জিন হিসেবে কাজ করবে। অর্থাৎ বিভিন্ন অপারেটিং সিস্টেম, ডিভাইস, সফটওয়্যার, মুদ্রিত ও ডিজিটাল মাধ্যমে ফন্ট ভাঙবে না। ভাঙলে তা এই ইঞ্জিনের মাধ্যমে সঠিক অবস্থায় আনা যাবে।

 

দৃষ্টি প্রতিবন্ধীদের জন্য স্ক্রিন রিডার (Screen Reader)

স্ক্রিন রিডার সফটওয়্যার এর মাধ্যমে দৃষ্টি প্রতিবন্ধী ব্যক্তি বা স্বল্প দৃষ্টিসম্পন্ন ব্যক্তিরা কম্পিউটার বা মোবাইল ব্যবহার করতে পারবেন। কম্পিউটারের পর্দায় ভেসে আসা প্যারাগ্রাফের বাংলা লেখা পড়ে শোনাবে এই সফটওয়্যার। কম্পিউটারের ইন্টারফেসে থাকা বাটন বা আইকন বাংলা ভাষায় চিনিয়ে দেবে, কমান্ড দেয়া যাবে, যার মাধ্যমে দৃষ্টিহীন ব্যক্তি সহজে কম্পিউটার বা মোবাইল ব্যবহার করতে পারবে।

 

বাক ও শ্রবণ প্রতিবন্ধীদের জন্য সফটয়্যার  ( software for disable people)

এই কম্পোনেন্টের মাধ্যমে বাক ও শ্রবণ প্রতিবন্ধী ব্যক্তিদের জন্য সাইন টু স্পিচ সফটওয়্যার উন্নয়ন করা হচ্ছে। এর মাধ্যমে একজন ব্যবহারকারী কোনো স্মার্টফোন, ট্যাবলেট বা ক্যামেরাযুক্ত পিসির সামনে দুই হাত, মুখ ও শরীরের ঊর্ধ্বাংশের সমন্বয়ে ইঙ্গিত ভাষা প্রকাশ করবেন। সফটওয়্যার এই ইঙ্গিত ভাষাকে বাংলা ইউনিকোড টেক্সটে রূপান্তর করবে। প্রয়োজনে এই টেক্সট সাথে সাথে উচ্চারিত কথায় রূপান্তরিত হবে। ফলে বাক ও শ্রবণ প্রতিবন্ধীদের প্রাথমিক যোগাযোগের  সীমাবদ্ধতা  দূর করা সম্ভব হবে।

 

বাংলা টেক্সটের সেন্টিমেন্ট বিশ্লেষণ (Sentiment analysis of Bangla Text)

সেন্টিমেন্ট অ্যানালাইসিস টুল সাধারণত কোনো ডকুমেন্ট বা প্যারাগ্রাফের টেক্সট বিশ্লেষণ করে বলতে পারে প্যারাগ্রাফটির বক্তব্য ইতিবাচক/পজেটিভ, নেতিবাচক/নেগেটিভ না নিরপেক্ষ/নিউট্রাল। এর মাধ্যমে ওয়েবসাইটের মন্তব্য ও প্রতিক্রিয়া/ফিডব্যাক বিশ্লেষণ করা যায়। এর মাধ্যমে দ্রুত বাজার-জরিপ, জনমত জরিপ করা, নির্বাচন উত্তর জনমত যাচাই যন্ত্রের মাধ্যমে দ্রুত করা যাবে।

 

ক্ষুদ্র-নৃগোষ্ঠী ভাষার কিবোর্ড ও শব্দভাণ্ডার (Keyboard and Resource for Ethnic Minority Languages)

বাংলাদেশের ক্ষুদ্র-নৃগোষ্ঠীর ভাষাগুলোর অধিকাংশ খুব স্বল্প পরিসরে তথ্য প্রযুক্তির জগতে ব্যবহৃত হয় । অধিকাংশ ক্ষেত্রেই ভাষার মানসম্পন্ন ডকুমেন্টশন, রিসোর্স ও ম্যাটেরিয়াল নেই। এদের মধ্যে দের মধ্যে কয়েকটি বিপন্ন অবস্থায় রয়েছে। অনেক ভাষার পর্যাপ্ত ডিজিটাল ডেটা নেই, ফন্ট ও এনকোডিং নেই। অনেক ভাষার লিপিও নেই। ডিজিটাল রিসোর্স তৈরির মাধ্যমে এই ভাষাগুলোকে প্রযুক্তি জগতে ব্যবহারের উপযোগী করা সম্ভব ।এই লক্ষ্যে, যেসব ভাষার নিজস্ব বর্ণমালা রয়েছে, সেসব ভাষার জন্য জাতীয় মান অনুসরণ করে কিবোর্ড সফটয়্যার উন্নয়ন করা হচ্ছে। একই সঙ্গে অন্যান্য বিপন্ন ভাষাগুলোকে ডিজিটাল আর্কাইভে সংরক্ষণের ব্যবস্থা করা হচ্ছে।

 

বাংলা থেকে আইপিএ কনভার্টার (Bangla to IPA converter)

বাংলা ইউনিকোড টেক্সটকে স্বয়ংক্রিয়ভাবে আইপিএতে প্রকাশ করবে এই কম্পোনেন্ট। সাধারণত এই কনভার্টার সূক্ষ্ম লিপ্যন্তর রীতি অনুসরণ করে তৈরি হচ্ছে। আইপিএ (IPA)  আন্তর্জাতিক ধ্বনিমূলক বর্ণমালা মানুষের দ্বারা উচ্চারিত প্রায় সব ধ্বনির লিখিত রূপকে প্রকাশ করা যায়। সাধারণত অভিধান রচয়িতা, বিদেশি ভাষার ছাত্র-শিক্ষক, ভাষাবিদ, স্পিচ-প্যাথলজিস্ট, গায়ক, অনুবাদক এই বর্ণমালা ব্যবহার করে থাকে। এই কনভার্টার তৈরির ফলে দ্রুত বাংলা ভাষার উচ্চারিত রূপকে আন্তর্জাতিক মান অনুসারে লেখা যাবে।

 

ভাষা-প্রযুক্তির সমন্বিত প্ল্যাটফর্ম  (service platform)

এই কম্পোনেন্টটি প্রকল্পের সবগুলোর সার্ভিসের মিলনবিন্দু হিসেবে কাজ করবে। এখানে ওসিআর, হাতেরলেখা শনাক্তকরণ, যান্ত্রিক অনুবাদ, এনকোডিং কনভার্টার, টেক্সট স্কোরিং, সেন্টিমেন্ট অ্যানালিইসিস, স্পেল ও গ্রামার চেকার, টেক্সট টু স্পিচ, স্পিচ টু টেক্সট প্রভৃতি সার্ভিসগুলো একসঙ্গে সমন্বিত থাকবে। একজন ব্যবহারকারী  ব্রাউজারের মাধ্যমে এই প্লাটফর্মে প্রবেশ করে উল্লিখিত সার্ভিসগুলো ব্যবহার করতে পারবে। এছাড়াও এই প্লাটফর্মে থাকবে প্রোডাক্ট শোকেস যেখান থেকে সফটওয়্যার ছাড়াও ডেটা বা ডকুমেন্ট ডাউনলোড করা যাবে।

 

বাংলা স্টাইল গাইড (Bangla style guide)

প্রযুক্তির সঙ্গে ভাষার সম্মিলনের প্রথম শর্ত হলো ভাষার রীতি এবং ভাষা ব্যবহারের মান ও নীতি ঠিক করা।  ভাষার এই মান ও নীতির সংগ্রহকে স্টাইলগাইড বলা হয়। এর আওতায় রয়েছে বাংলা ক্যারেকটার প্রমিতকরণ, বাংলা সর্টিং অর্ডার প্রমিতকরণ, ইঙ্গিতভাষা/সাইন ল্যাংগুয়েজ প্রমিতকরণ, বিরাম চিহ্ন প্রয়োগ-রীতি প্রমিতকরণ, ওয়েবে ও মুদ্রণ জগতে টাইপোগ্রাফিকাল স্টাইল শিট প্রমিতকরণ, প্রকাশনায় অন্যভাষার সঙ্গে বাংলা ভাষার ব্যবহারের রীতি (ইংরেজি, আরবি, সংস্কৃত, চাকমা প্রভৃতি) নির্ধারণ, বাংলা গ্লোসারি, টীকা ব্যবহারের রীতি (ফুটনোট ও এন্ডনোট), গ্রন্থপঞ্জি ও নির্ঘণ্ট লেখার নিয়ম নির্ধারণসহ লিপি ও ভাষাসংক্রান্ত প্রযুক্তিজগতে প্রয়োগযোগ্য সকল মান প্রমিতকরণ ।

 

বাংলা ইউনিকোড (Bangla Unicode)

ইউনিকোড হলো লিখন পদ্ধতি বা লিপিসমূহের কম্পিউটারে ব্যবহার করার জন্য আন্তর্জাতিকভাবে স্বীকৃত একটি কমন মান। পৃথিবীর প্রায় সকল প্রধান ভাষার লিপির জন্য কম্পিউটার ইন্ডাস্ট্রির বিজ্ঞানী, বিভিন্ন দেশের প্রতিনিধি ও বিজ্ঞানীদের সমন্বয়ে গঠিত কনসোর্টিয়াম এই মান নির্ধারণ করে থাকে। এই কম্পোনেন্টের মাধ্যমে বাংলাদেশের পক্ষে বাংলা ভাষা ও অন্যান্য ভাষার ইউনিকোড মান নিধারণে সকল প্রকার সমর্থন প্রদান করা হবে।

বাংলা ছাড়াও বাংলাদেশের অন্যান্য ভাষার ইউনিকোড মানের সম্ভাব্য যাচাই, প্রণয়ন ও প্রকাশ করা হবে এই কম্পোনেন্টের মাধ্যমে।

ইউনিকোড কনসোর্টিয়ামের আরেকটি ইউনিট হলো কমন লোকাল ডাটা রিপোজিটরি (বা CLDR)। এটি স্থানীয় ইউনিকোড বিষয়ে বৃহত্তম ও প্রমিত তথ্য ভাণ্ডার। আন্তর্জাতিক কোম্পানিসমূহ তাদের সফটওয়্যার আন্তর্জাতিকায়ন ও স্থানীয়করণে এই তথ্য ভাণ্ডার ব্যবহার করে থাকে। বাংলা ভাষার ক্ষেত্রেও এই কম্পোনেন্টের মাধ্যমে সিএলডিআর উন্নয়ন করা হবে। একই সঙ্গে এর মাধ্যমে ইউনিকোড ও সিএলডিআর প্রমিতকরণ, জমাকরণ ও রক্ষণাবেক্ষণের জন্য প্রয়োজনীয় ব্যবস্থা গ্রহণ করছে।

 

বহুভাষার করপাস (Multilingual Corpus)

মেশিন ট্রান্সলেশনের জন্য বাংলার সঙ্গে বিভিন্ন ভাষার সমান্তরাল অনূদিত করপাস প্রয়োজন রয়েছে।এই কম্পোনেন্টের মাধ্যমে বাংলার সঙ্গে দশটি ভাষার সমান্তরাল করপাস উন্নয়ন করা হবে।

 

বাস্তবায়ন অগ্রগতি

-    ১৬টি কম্পোনেন্টের EoI প্রস্তাব মূল্যায়ন সম্পন্ন হয়েছে।

-    ২টি কম্পোনেন্টে কার্যাদেশ দেয়ার হয়েছে।

-    ১টি কম্পোনেন্টের চূড়ান্ত মূল্যায়ন সম্পন্ন হয়েছে, পুনরায় EoI প্রস্তাব আহবান করা হয়েছে।

-    ১টি কম্পোনেন্টের চূড়ান্ত মূল্যায়ন সম্পন্ন হয়েছে, পুনরায় EoI প্রস্তাব আহবানের বিষয়টি প্রক্রিয়াধীন।

-    ৩টি কম্পোনেন্টের RFP মূল্যায়ন কার্যক্রম চলমান রয়েছে।

-    ৩টি কম্পোনেন্টের RFP ইস্যু প্রক্রিয়াধীন রয়েছে।

-   ৬টি কম্পোনেন্টের Terms of Reference (ToR) অনুমোদনের জন্য বিশেষজ্ঞ কমিটির নিকট উপস্থাপন করা হয়েছে।

 

আর্থিক অগ্রগতি: ৪৩.০৫%।

বাস্তব অগ্রগতি: ৫২.০০%।

প্রশিক্ষণ  

স্থানীয়: ০ জন

বৈদেশিক: ০১ জন

১০

সেমিনার/কর্মশালা/আয়োজিত  ইভেন্ট ও প্রতিযোগিতা

  • “গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ প্রকল্পের আওতায় ১৬টি অ্যাপ্লিকেশন/টুলস তৈরি করা হবে।  এগুলোর মধ্যে অন্যতম টুলস Software for Disable People।এই টুলসের আর্কিটেকচার ও রূপরেখা পর্যালোচনার জন্য ‘Real Time Sign Language/Gesture Recognition and Speech Generation’শিরোনামে ০৮ নভেম্বর, ২০১৮ তারিখ রবিবার ঢাকার কারওয়ান বাজারস্থ জনতা টাওয়ার সফটওয়্যার টেকনোলজি পার্কের সম্মেলন কক্ষে সেমিনারের আয়োজন করা হয়েছে। এ অনুষ্ঠানে গণপ্রজাতন্ত্রী বাংলাদেশ সরকারের ডাক, টেলিযোগাযোগ ও তথ্য প্রযুক্তি মন্ত্রণালয়ের মাননীয় মন্ত্রী জনাব মোস্তাফা জব্বার প্রধান অতিথির আসন গ্রহন করেন।
  • “গবেষণা ও উন্নয়নের মাধ্যমে তথ্য প্রযুক্তিতে বাংলা ভাষা সমৃদ্ধকরণ প্রকল্পের আওতায় ১৬টি অ্যাপ্লিকেশন/টুলস তৈরি করা হবে।  এগুলোর মধ্যে অন্যতম টুলস Developing a Service Platform Combining Language Processing Tools to Build Processing Pipelines for Value Adding Tasks in Multilingual Content Processing কম্পোনেন্টের আর্কিটেকচার ও রূপরেখা পর্যালোচনার জন্য ‘ইন্টিগ্রটেড সার্ভস প্লাটফর্ম -এসডি ১৯’ শিরোনামে গত ১৫ নভেম্বর, ২০১৮ তারিখে কারওয়ান বাজারস্থ জনতা টাওয়ার সফটওয়্যার টেকনোলজি পার্কের সম্মেলন কক্ষে সেমিনারের আয়োজন করা হয়েছে।
  • ১৯ মার্চ, ২০১৯ ইং তারিখ মঙ্গলবার বিকাল ৩.০০ ঘটিকায়  আন্তর্জাতিক কনভেনশন সিটি বসুন্ধরা (আইসিসিবি) এর সেমিনার হলে বাংলা যান্ত্রিক অনুবাদক এর উপর সেমিনার অনুষ্ঠিত হয়েছে। এ অনুষ্ঠানে গণপ্রজাতন্ত্রী বাংলাদেশ সরকারের ডাক, টেলিযোগাযোগ ও তথ্য প্রযুক্তি মন্ত্রণালয়ের মাননীয় মন্ত্রী জনাব মোস্তাফা জব্বার প্রধান অতিথির আসন গ্রহন করেন।

Share with :

Facebook Facebook