• ভাষা:
  • English
  • বাংলা
হোম > কমপিউটারে বাংলা ধ্বনির প্রয়োগ ও ডিজিটাল বাংলাদেশ
লেখা সম্পর্কিত
পাবলিশ:
২০০৯-০৭-৩০
তথ্যসূত্র:
অন্যান্য
লেখার ধরণ:
ডিজিটাল বাংলাদেশ
ভাষা:
বাংলা
স্বত্ত্ব:
অন্যান্য
কমপিউটারে বাংলা ধ্বনির প্রয়োগ ও ডিজিটাল বাংলাদেশ

মাদের মাতৃভাষা বাংলা। প্রাণের ভাষা বাংলা। নিত্যদিনের ভাব বিনিময়ে এই বাংলা যোগায় আত্ম-অনুভূতির সঞ্চালনে ভাবনার খোরাক। প্রাণের এই বাংলাকে আজকের তথ্য ও যোগাযোগপ্রযুক্তির দ্রুতগতির মাধ্যমে সম্পৃক্ত করার প্রয়াস চলছে সেই নববইয়ের দশকের মাঝামাঝি সময় থেকেই। দেশে-বিদেশে গবেষণা ও উন্নয়ন কর্মকান্ডের বিপুল পরিধিতে বাংলা ভাষা সংযোজন করেছে অমিত সম্ভাবনা। বাংলা ফন্ট ও বিজয় বাংলা আমাদের কমপিউটার প্রযুক্তির ব্যবহারে বাংলাকে অনেক সমাদৃত করেছে। বাংলা ইউনিকোডভিত্তিক গবেষণা ও উন্নয়ন আমাদেরকে আরো সমৃদ্ধ করেছে তথ্যপ্রযুক্তির মহাসড়কে বাংলাকে এগিয়ে নেয়ার কাজে। বাংলা টেক্সট-এর সফল উন্নয়ন ও প্রয়োগের ফলে আজ আমাদের দৈনন্দিন জীবনের অনেক ক্ষেত্রে, সরকারি-বেসরকারি সব কাজে কমপিউটারে আমরা স্বাচ্ছন্দ্যে বাংলা ব্যবহার করতে পারি। বাংলা মুদ্রণশিল্প এ সফল প্রয়োগের এক উজ্জ্বল দৃষ্টান্ত। তথাপি বাংলা টেক্সট বা ফন্টের উন্নয়নের সাথে সম্পৃক্ত করতে পারিনি আমাদের শতকরা ৬০ ভাগ পড়তে বা লিখতে না জানা সাধারণ মানুষকে। না পারা যারা বাংলা পড়তে বা লিখতে সমর্থ নয়, যাদের ভাগ্যের উন্নয়ন একান্ত অপরিহার্য, তথ্য ও যোগাযোগপ্রযুক্তির সাথে সম্পৃক্ত করার আমাদের প্রয়াসকে সফলতা দিতে হলে বাংলা ধ্বনির প্রাযুক্তিক প্রয়োগের ওপর জোর তাগিদ দেয়া ছাড়া এক্ষেত্রে সাফল্য পাওয়ার কোনো বিকল্প নেই। আজকের এই লেখায় বাংলা ধ্বনিবিজ্ঞান, এই সম্পর্কিত ধারণা, বর্তমান বিশ্ব ও বাংলাদেশ, গবেষণা ও উন্নয়ন এর প্রয়োগ এবং বর্তমান ও ভবিষ্যৎ নিয়ে আলোচনা করা হলো। পাঠকদের চেষ্টা করবো এই ক্ষেত্রে গবেষণা ও উন্নয়নের কাজের ধারণার মাধ্যমে অনুপ্রেরণা যোগাতে।

বাংলা ধ্বনি ও ধ্বনিতত্ত্ববিষয়ক ধ্যানধারণা কমপিউটারে বাংলা ধ্বনির প্রয়োগের জন্য একান্ত প্রয়োজন। বাংলা ধ্বনি ও ধ্বনিতত্ত্বের ওপর লেখা আব্দুল হাই ও প্রণব চৌধুরীর সব মহলে সমাদৃত বই আছে। বাংলা ধ্বনিতত্ত্বের ওপর বিন্তর আলোচনা করা এ পরিসরে সম্ভব নয়। তাছাড়া বাংলা ধ্বনিতত্ত্বের বিষয়টি তুলনামূলকভাবে জটিলতর বলে বিষয়টি এখনো বেশিরভাগ সাধারণ পাঠকের বিরক্তিবোধের কারণ হতে পারে বলে মনে করি। সে উপলব্ধি থেকে সেদিকে যেতে চাইনি। তবে একান্ত আগ্রহী পাঠকদেরকে অনুরোধ করবো এ সম্পর্কে বিস্তারিত জানতে উপরে উল্লিখিত লেখকদের বই পড়তে।

ধ্বনির বিশে¬ষণ, সংশে¬ষণ এবং শনাক্ত করার মাধ্যমে আমরা ধ্বনিভিত্তিক প্রযুক্তি উদ্ভাবন করতে পারি। এই প্রক্রিয়া অব্যাহত। প্রথমে ধরা যাক, আজকের সবচেয়ে বহুল আলোচিত মোবাইলফোনপ্রযুক্তির কথা। আপনার টেলিফোন সেটটিতে নাম্বার বাটনের সহায়তায় ডায়ালিংয়ের কাজ করতে হয়। এই কাজকে সহজ করার জন্য প্রযুক্তিবিদরা ভাবছেন ‘ভয়েস ডায়ালিং’-এর কথা। অর্থাৎ আপনার সেটটি আপনার কথা শুনে সেই অনুযায়ী কাজ করবে। প্রযুক্তির ভাষায় ধ্বনি শনাক্তকরণের মাধ্যমে আপনার টেলিফোন সেটটি সব কাজ সম্পাদন করবে। একই সাথে বর্ণ থেকে ধ্বনি উৎপাদন করে তথ্যকে ভয়েস রূপান্তর প্রক্রিয়ায় উপস্থাপন হবে প্রযুক্তির এক বিশাল অবদান।

বাংলা ধ্বনির গবেষণা

তথ্য ও যোগাযোগপ্রযুক্তির বিশ্বব্যাপী প্রসারের সাথে সাথে বিজ্ঞান ও প্রযুক্তির বিভিন্ন ক্ষেত্রে, সামাজিক, অর্থনৈতিক, রাজনৈতিক তথা মানুষের জীবনের সব ন্তরে আরো যুগোপযোগী গবেষণা এবং বান্তবতার নিরিখে প্রয়োগের অনেক নতুন দিগন্ত উন্মোচিত হয়েছে। ধ্বনিবিজ্ঞান ও ধ্বনিতত্ত্ব নিয়ে গবেষণার ক্ষেত্রে এর কোনো ব্যতিক্রম হয়নি। গত চার দশকের অধিক সময় ধরে বিজ্ঞানীরা নিরলস গবেষণা করছেন ধ্বনিবিজ্ঞান ও ধ্বনিতত্ত্বের বিশ্লেষণ, সংশ্লেষণ এবং শনাক্ত করার নানা কৌশল নিয়ে। ইংরেজি, ফরাসী, আরবি, মালে, স্প্যানিশ, জাপানিজসহ বিভিন্ন ভাষার ধ্বনিসমূহের ওপর বিভিন্ন পরিমাপের গবেষণা চলছে। গবেষণালব্ধ ফলাফলের ভিত্তিতে পণ্য তৈরির প্রয়াসও উল্লেখযোগ্য। পাঠকদের এ সম্পর্কিত কিছু ধারণা দেয়ার চেষ্টা করা হয়েছে এই অংশে।

অন্যান্য বিদেশী ভাষার ধ্বনিভিত্তিক গবেষণার, বিশেষ করে কমপিউটার প্রযুক্তিভিত্তিক বিশ্লেষণ, সংশ্লেষণ ও শনাক্ত করার প্রয়োজনীয় গবেষণা কাজের মতো পুরনো না হলেও আমাদের বাংলা ভাষার ধ্বনিসমূহের গবেষণার কাজ খুব নতুনও নয়। বাংলা স্বরধ্বনিগুলোর বিশ্লেষণের প্রথম কাজ করেন আব্দুল কাদের পরামানিক ১৯৭৭ সালে জাপানে পিএইচডি গবেষণার কাজের অংশ হিসেবে। অত্যন্ত স্বল্প পরিসরের ১৯৭৭ সালের গবেষণায় আব্দুল কাদের বিচ্ছিন্ন বাংলা স্বরধ্বনির ধ্বনিমূলকে জাপানিজ স্বরধ্বনির সাথে এক তুলনামূলক পরিমাপ করেন। এই তুলনামূলক গবেষণা আজ বর্তমান প্রেক্ষাপটে অনেক বদলে গেছে। বাংলা ধ্বনি নিয়ে গবেষণার কাজ বাংলাদেশে শুরু করেন প্রফেসর ড. মো: আব্দুস সোবহান। আইআইটি খড়গপুরে পিএইচডি গবেষণার সময় ১৯৮৪ সালে বাংলা ধ্বনি নিয়ে গবেষণার কাজ শুরু করেন এবং পরবর্তী সময়ে ১৯৮৬ সালে রাজশাহী বিশ্ববিদ্যালয়ে শিক্ষকতা করার সময় বাংলা ধ্বনি নিয়ে অনেক গবেষণাকর্ম তত্ত্বাবধান ও পরিচালনা করেন। গনজের আলী ১৯৯০ সালে প্রফেসর সোবহানের তত্ত্বাবধানে বাংলা ধ্বনিসমূহের বিশ্লেষণ করেন এবং এ বিশ্লেষণে স্বল্প পরিসরে ডিজিটাল স্টোরেজ মেশিনের সহায়তায় ধ্বনিসমূহের বৈশিষ্ট্য পর্যবেক্ষণের কাজ করা হয়। অপর একটি গবেষণা কাজে এই লেখক ড. সৈয়দ আখতার হোসেন ১৯৯১ সালে প্রফেসর সোবহানের তত্ত্বাবধানে বাংলা ধ্বনিসমূহের অন্তর্গত ধ্বনিমূলের স্থায়িত্ব কাল এবং মৌলিক অনুনাদের পরিমাপ করেন। অপর একটি গবেষণায় এম এম রশিদ তালুকদার ১৯৯২ সালে বিচ্ছিন্ন বাংলা শব্দের অন্তর্গত ধ্বনিসমূহের বিস্তৃতি বিশ্লেষণ করেন। ১১টি স্বরধ্বনি ও ৩৯টি ব্যঞ্জনধ্বনির সীমিত শব্দের বিশ্লেষণ হয় এ কাজে। অপর একটি গবেষণায় এম লতিফুর রহমান ১৯৯২ সালে বাংলা ধ্বনির বর্ণালী এবং অনুনাদের বিশ্লেষণ করেন। এই কাজে বাংলা স্বরধ্বনির প্রথম তিনটি অনুনাদের বিচার ও বিশ্লেষণ করা হয়। বাংলা ধ্বনির বিশ্লেষণের পাশাপাশি গবেষকরা ধ্বনিবিশ্লেষক সফটওয়্যার তৈরিতে অগ্রগতি অর্জন করেছেন। এম.ই. হামিদ ১৯৯৩ সালে প্রফেসর সোবহানের তত্ত্বাবধানে বাংলা ধ্বনির প্রক্রিয়াকরণের সুবিধা নেয়ার জন্য সফটওয়্যার তৈরির গবেষণা করেন। এই কাজে বাক্যকে টুকরো করে ধ্বনিসমূহের অন্তর্গত বর্ণালী, অনুনাদসহ অন্যান্য বৈশিষ্ট্য পর্যবেক্ষণ করা হয়। একইভাবে এম জামাল উদ্দিন, সোয়েব আহমেদ সিদ্দিকী, এ কে দত্তসহ আরো অনেক গবেষক নিজস্ব স্বকীয়তায় বাংলা ধ্বনিসমূহের গবেষণার কাজ করেছেন। বাংলা ধ্বনির সংশ্লেষণের গবেষণার কাজ খুব সীমিত আকারে হয়েছে। সারওয়ার-ই-আলম ১৯৯৫ সালে বাংলা ধ্বনির সংশ্লেষণভিত্তিক একটি গবেষণার কাজ করেন। জানা মতে, এটাই বাংলা সংশ্লেষণের প্রথম কাজ। এ কাজে কনকেটেনেটিভ প্রক্রিয়ায় ধ্বনি সংশ্লেষণ করে তার অভ্যন্তরীণ বৈশিষ্ট্য পর্যবেক্ষণ করা হয়। একই সাথে তানভির প্রফেসর এম. এ. মোত্তালিবের তত্ত্বাবধানে বাংলা ধ্বনি সংশ্লেষণের কাজ করেছেন। বাংলা ধ্বনি সংশ্লেষণের কাজ খুব বেশি একটা হয়নি। এ ক্ষেত্রে এক বিন্তর সুযোগ রয়েছে ধ্বনি গবেষকদের। বাংলা ধ্বনির শনাক্ত করার কাজ খুব বেশি পুরনো নয়। মোহাম্মদ ইশতিয়াক শাহরিয়ার, রেজওয়ানা কুরসিয়া ও মনজুর মোর্শেদ ১৯৯৯ সালে বাংলা ধ্বনি শনাক্ত করার একটি গবেষণার কাজ করেন। এই গবেষণা কাজে স্নায়বিক নেটওয়ার্ক ব্যবহার করে বাংলা ব্যঞ্জনধ্বনিগুলোর শ্রেণীবিন্যাসও করা হয়।

এম. ফখরুজ্জামান প্রফেসর রমেশ চন্দ্র দেবনাথের তত্ত্বাবধানে ২০০২ সালে বাংলা ধ্বনিসমূহের শনাক্ত করার জন্য ধ্বনিসমূহের অভ্যন্তরীণ বৈশিষ্ট্য উদ্ঘাটন করার বিভিন্ন কৌশলের মধ্যে একটি তুলনামূলক গবেষণা করেন। একইভাবে বিভিন্ন সময়ে বিভিন্ন গবেষক নিজস্ব স্বকীয়তায় বাংলা ধ্বনি শনাক্ত করার কাজ করেছেন। উল্লেখ্য, বাংলা ধ্বনিভিত্তিক সব গবেষণার কাজেরই বাংলা ধ্বনিতত্ত্বের সাথে সামঞ্জস্যের অভাব রয়েছে। কমপিউটারভিত্তিক ধ্বনিতত্ত্বের কোনো প্রয়োগ এসব গবেষণায় হয়নি। অথচ বাংলা ধ্বনিকে কমপিউটার প্রক্রিয়াকরণে কমপিউটারভিত্তিক ধ্বনিতত্ত্বের প্রয়োগের কোনো বিকল্প নেই। আরো একটি উল্লেখযোগ্য বিষয় হলো, সমন্বিত প্রচেষ্টার অভাব এবং গবেষণার প্রয়োজনীয় ধ্বনি ডাটাবেজ। বাংলা ধ্বনি এবং ধ্বনিমূলের ডাটাবেজ আমাদের নিজেদের প্রয়োজনে সমন্বিত উদ্যোগে তৈরি করা একান্ত প্রয়োজন, যাকে বলা হয় Speech Corpusভিত্তিক ডাটাবেজ। উল্লেখ্য, এই লেখক প্রফেসর লুৎফুর রহমানের তত্ত্বাবধানে ঢাকা বিশ্ববিদ্যালয়ে পিএইচডি গবেষণায় বাংলা স্বরধ্বনি বিশ্লেষণ, সংশ্লেষণ ও শনাক্ত করার ওপর ব্যাপক গবেষণা করেন। এই গবেষণায় লেখক বাংলা স্বরধ্বনিগুলোকে শ্রেণীভুক্তকরণের মাধ্যমে ধ্বনি শনাক্ত করার কাজকে এগিয়ে নেয়ার নতুন দিকনির্দেশনা দেন।

বিগত বছর দুয়েক আগে ব্র্যাক বিশ্ববিদ্যালয়ে বাংলা ভাষার প্রক্রিয়াকরণের এক গবেষণা প্রতিষ্ঠান শুরু হয় ড. মুমিত খানের নির্দেশনায়। এর নাম CRBLP (Centre for Research on Bangla Language Processing)। সিআরবিএলপি-র গবেষণার মূল কাজ হলো : বাংলা টেক্সট প্রক্রিয়াকরণ, ধ্বনি প্রক্রিয়াকরণ, ছবি প্রক্রিয়াকরণ এবং তথ্য উদ্ঘাটন ও প্রক্রিয়াকরণ। এই গবেষণা প্রতিষ্ঠান এক সমন্বিত উদ্যোগ তৈরি করতে পারে। প্রতিষ্ঠানটি বর্তমানে বাংলা ধ্বনি সংশ্লেষণ এবং শনাক্ত করার কাজে সচেষ্ট। সিআরবিএলপি-কে আরো প্রয়োজনীয় পদক্ষেপ নিতে হবে সমন্বয়ের এবং তরুণ গবেষকদের বিভিন্ন বিশ্ববিদ্যালয়ে নিজ নিজ অবস্থানে গবেষণার প্রয়োজনীয় সহযোগিতা দেয়ার কাজে। সিআরবিএলপি সম্পর্কে আরো বিস্তারিত জানতে ভিজিট করুন http: //bracuniversity/net/research/crbp/ সাইটে।

কমপিউটারভিত্তিক ধ্বনিতত্ত্ব মূলত ধ্বনিতত্ত্ব এবং কমপিউটার বিজ্ঞানের এক সংমিশ্রণ। কমপিউটার বিজ্ঞানের নানা কলাকৌশল ও প্রয়োগের মাধ্যমে ধ্বনিতত্ত্বের বিভিন্ন সমস্যার সমাধান করাই এ বিষয়ের মূল প্রতিপাদ্য। ধ্বনিসমূহের অভ্যন্তরীণ সমস্যা ও প্রক্রিয়া বোঝার জন্য প্রাকৃতিক ভাষা বা ন্যাচারাল ল্যাঙ্গুয়েজ অধ্যয়ন করার কোনো বিকল্প নেই। তেমনি এই বিষয় থেকে লব্ধ জ্ঞানকে কমপিউটার প্রক্রিয়ার মাধ্যমে বিশ্লেষণ করার জন্য প্রয়োজন কমপিউটার বিজ্ঞান সম্পর্কে ধারণা ও শিক্ষা। প্রতিনিয়ত কমপিউটারভিত্তিক নানা কলাকৌশল কমপিউটারভিত্তিক ধ্বনিতত্ত্বকে আরো সমৃদ্ধ করছে। এর মধ্যে উল্লেখযোগ্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ বা ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, তথ্য উদ্ঘাটন ও আহরণ বা ইনফরমেশন এক্সট্রোকশন ব্যান্ড রিট্রিভাল, ডায়ালগ মডেলিং, স্টোরকাস্টিং মডেলিং ধ্বনি শনাক্ত করা ও সংশ্লেষণ এবং ধ্বনি ডাটাসমূহের প্রক্রিয়াকরণ।

ধ্বনিবিজ্ঞানের প্রয়োগ

প্রথমেই বলেছি গত চার দশকের বেশি সময় ধরে বিন্তর গবেষণার এই ক্ষেত্রে অর্জন খুব ছোট নয়। ইংরেজি ভাষার পাশাপাশি অন্যান্য ভাষা আমরা আমাদের দৈনন্দিন জীবনে সব ভাবের মাধ্যমে বিনিময় করে থাকি। আর আমাদের মতো কমপিউটার এবং একই ধরনের অন্যান্য প্রযুক্তি যদি ভাষার এবং ধ্বনির ব্যবহার করতে পারে, তবে সে ক্ষেত্রে আমাদের তথ্য বিনিময়ের প্রক্রিয়াটি সহজ হবে এবং বিশেষ করে আমাদের যে ৬০ শতাংশ মানুষের কাছে আমরা তথ্য বিনিময়ের এক প্রতিকূল পরিবেশে অবস্থান করছি, সেই অবস্থা আর থাকবে না। আমাদের এই ৬০ শতাংশ সাধারণ মানুষকে আমরা প্রতিনিয়ত তথ্য থেকে ধ্বনির রূপান্তর প্রক্রিয়াকরণে তথ্যসেবা দিতে পারবো। ডিজিটাল ডিভাইড কমিয়ে ফেলতে পারবো। সফল কমপিউটার প্রক্রিয়াকরণের ব্যাপক প্রয়োগ এবং মানুষের দৈনন্দিন জীবনের অনেক কাজকে সহজসাধ্য করা সম্ভব। পাঠকদের এর একটা সম্যক ধারণা এই অংশে দেয়ার চেষ্টা করছি।

ধ্বনির বিশ্লেষণ, সংশ্লেষণ এবং শনাক্ত করার মাধ্যমে আমরা ধ্বনিভিত্তিক প্রযুক্তি উদ্ভাবন করতে পারি। এই প্রক্রিয়া অব্যাহত। প্রথমে ধরা যাক, আজকের সবচেয়ে বহুল আলোচিত মোবাইলপ্রযুক্তির কথা। শহর থেকে গ্রাম অবধি মানুষের কাছে এ প্রযুক্তি তথ্যপ্রবাহের এক উজ্জ্বল দৃষ্টান্ত স্থাপন করেছে। তবুও আপনার টেলিফোন সেটটিতে নাম্বার বাটনের সহায়তায় ডায়ালিংয়ের কাজ করতে হয়। এই কাজকে সহজ করার জন্য প্রযুক্তিবিদরা ভাবছেন ‘ভয়েস ডায়ালিং’-এর কথা। অর্থাৎ আপনার সেটটি আপনার কথা শুনে সেই অনুযায়ী কাজ করবে। প্রযুক্তির ভাষায় ধ্বনি শনাক্তকরণের মাধ্যমে আপনার টেলিফোন সেটটি সব কাজ সম্পাদন করবে। একই সাথে বর্ণ থেকে ধ্বনি উৎপাদন করে তথ্যকে ভয়েস রূপান্তর প্রক্রিয়ায় উপস্থাপন হবে প্রযুক্তির এক বিশাল অবদান। তথ্যপ্রযুক্তির সেবাকে গ্রাম পর্যায়ে সাধারণ মানুষের জীবনযাত্রার মান উন্নয়নের ব্যবহারে মোবাইল ফোন টেকনোলজির কোনো বিকল্প নেই এবং এই প্রযুক্তিতে ধ্বনিভিত্তিক সেবারও কোনো বিকল্প নেই।

বলা দরকার

বাংলাদেশে ২০০৪ সালে বাংলার কমপিউটার প্রক্রিয়াকরণের গবেষণা এবং গবেষকদেরকে একটি প্লাটফর্মে আনার উল্লেখযোগ্য পদক্ষেপ নেয় ইন্ডিপেন্ডেন্ট বিশ্ববিদ্যালয়। ২০০৪ সালের ১৯ ফেব্রুয়ারি অনুষ্ঠিত হয় প্রথম জাতীয় কনফারেন্স শুধু বাংলাকে কমপিউটার প্রক্রিয়াকরণের ভিত্তিতে। প্রথম বছর কনফারেন্সে আসা অনেক তরুণ গবেষক বাংলা ভাষা নিয়ে গবেষণার দিকনির্দেশনা পান। এর পরের বছর ২০০৫ সালে একই সময় ইন্ডিপেন্ডেন্ট বিশ্ববিদ্যালয়ের সার্বিক ব্যবস্থাপনায় আরও ব্যাপক পরিসরে আবারো এই জাতীয় কনফারেন্স অনুষ্ঠিত হয় এবং দিনভর নবীন ও প্রবীণ গবেষকরা মুখর সময় কাটান। এর পরের বছর ২০০৬ সাল এই কনফারেন্স আন্তর্জাতিক পর্যায়ে উপনীত হয় এবং অনেক মূল প্রবন্ধ উপস্থাপনের মাঝে প্রবন্ধ পড়েন ড. বিদ্যুৎ বরণ চৌধুরী। ড. বিদ্যুৎ বরণ চৌধুরী কলকাতার Indian Statistical Institute-এর অধ্যাপক ও প্রধান গবেষক এবং বাংলা বর্ণ নিয়ে তার প্রখ্যাত গবেষণা শিল্পে রূপান্তরিত হয়েছে। এই আন্তর্জাতিক মানে উন্নীত কনফারেন্সটি ২০০৬ সালের পর আর অনুষ্ঠিত হয়নি। এই কনফারেন্সটি আবারো শুরু হলে হয়তো আমাদের তরুণ প্রজন্ম ডিজিটাল বাংলাদেশের স্বপ্ন বান্তবায়নে আরো একধাপ এগিয়ে যেতে পারতো।

আমাদের করণীয়

বিশ্বের সাথে তাল মিলিয়ে আমাদের ধ্বনির বিশ্লেষণ, সংশ্লেষণ এবং শনাক্ত করার প্রয়োজনীয় গবেষণার কাজ এক সম্মিলিত প্রয়াস এবং একটি নির্দিষ্ট মানদন্ডের ভিত্তিতে করতে হবে। ধ্বনির সার্বিক গবেষণার জন্য আমাদের ধ্বনি ডাটাবেজ সম্মনিত প্রচেষ্টায় তৈরি করতে হবে। এই ডাটাবেজকে রেফারেন্স ধরে আমাদের সব ধরনের বিশ্লেষণ, সংশ্লেষণ এবং শনাক্ত করার কাজ করতে হবে।

বাংলা একাডেমিকে আমাদের ধ্বনিভিত্তিক সব গবেষণা কাজের সাথে সম্পৃক্ত করতে হবে। কমপিউটার প্রক্রিয়াকরণে বাংলা ধ্বনিতত্ত্ব বা কমপিউটেশনাল ল্যাঙ্গুয়িস্টিক নিয়ে ঢাকা বিশ্ববিদ্যালয়ের ভাষাতত্ত্ব বিভাগের সাথে বাংলা ধ্বনিবিষয়ক গবেষকদের সম্পৃক্ত করতে হবে। বাংলা স্বরধ্বনি ও ব্যঞ্জনধ্বনিগুলোর একটা কেন্দ্রীয় ইনভেন্টরি তৈরি করতে হবে এবং প্রয়োজনীয় পরিমাপকে একটা সঠিক কাঠামোতে উপস্থাপন করতে হবে। যাতে করে আমরা বলতে পারি কমপিউটার প্রক্রিয়াকরণের কাজে আমাদের স্বরধ্বনি ও ব্যঞ্জনধ্বনিগুলোর বৈশিষ্ট্য কেমন। এজন্য আমাদের ধ্বনি গবেষকদের সব স্বরধ্বনি ও ব্যঞ্জনধ্বনিগুলোর স্বাভাবিকীকরণ বা Normalization নিয়ে গবেষণা প্রয়োজন। এখানে বলা প্রয়োজন ধ্বনি ও ধ্বনিভিত্তিক বৈশিষ্ট্য বয়স, আঞ্চলিকতা, নারী, পুরুষ বিভিন্ন কারণে পরিবর্তনশীল। আমাদেরকে যদি এসব বিভেদে ধ্বনি শনাক্ত করতে হয়, তাহলে আমাদেরকে বয়স, আঞ্চলিকতা বা নারী-পুরুষের প্রভাবকে আলাদা করতে সক্ষম হতে হবে, যা শুধু স্বাভাবিককরণ প্রক্রিয়ায় সম্ভব। এর পাশাপাশি বিভিন্ন কোম্পানির যেমন- মাইক্রোসফট, সান মাইক্রোসিস্টেমসসহ ধ্বনিভিত্তিক API-তে আমাদেরকে বাংলা ধ্বনির কমপিউটারভিত্তিক বিশ্লেষণ, সংশ্লেষণ এবং শনাক্ত করার প্রক্রিয়াকে সংযোজন করতে হবে। ধ্বনি নতুন প্যারা প্রয়োগের বিভিন্ন উল্লেখযোগ্য ক্ষেত্রগুলো হলো স্বাস্থ্যসেবা, বিমানবাহিনী ও সামরিক ঘাঁটি, কৃষিক্ষেত্র, শিল্প ও ব্যাণিজ্যক্ষেত্র এবং প্রতিবন্ধীদের জীবনের মান উন্নয়নে। ধ্বনিভিত্তিক সফটওয়্যার তৈরির গবেষণায় মাইক্রোসফট, সান মাইক্রোসিস্টেমসসহ বড় বড় কোম্পানি আত্মনিবেদিত। ধ্বনিভিত্তিক ডায়ালগ সফটওয়্যার তৈরির জন্য এসব কোম্পানি প্রোগ্রামারদের জন্য তৈরি করেছে Speech API, যা ধ্বনিভিত্তিক অ্যাপ্লিকেশন প্রোগ্রামারস ইন্টারফেস নামে পরিচিত। ধ্বনির সহায়ক ওয়েব ইঞ্জিন বা ইন্টারফেস তৈরির জন্য আছে Voice XML, যা শুধু ধ্বনি সহায়ক ওয়েবসাইট তৈরির জন্য প্রণীত হয়েছে। ভবিষ্যতের ওয়েবসাইটগুলো হবে আরো ধ্বনিনির্ভর এবং সফটওয়্যারগুলোর আরো স্বাভাবিক প্রক্রিয়ায় সঞ্চালন করবে। অতিসম্প্রতি গুগল তাদের প্রথম পরীক্ষামূলক সেবা বিনামূল্যে সবার জন্য উন্মুক্ত করেছে, যার নাম গুগল ধ্বনি সমন্বিত খোঁজা বা গুগল ভয়েস লোকাল সার্চ। এই সেবার মাধ্যমে ব্যবহারকারী আমেরিকার একটি নাম্বারে ডায়াল করে একটা নির্দিষ্ট শহরে একটা নির্দিষ্ট ব্যবসায়ের খোঁজ দেবেন ব্যবহারকারীর কথার ওপর ভিত্তি করে। হয় ব্যবহারকারীকে ব্যবসায়ের সাথে যোগাযোগ স্থাপনে সহায়তা করবেন, নতুবা এসএমএসের সহায়তায় তথ্য পাঠাবেন। এ নতুন সেবা ধ্বনি শনাক্ত করার প্রযুক্তির সাথে ওয়েব প্রযুক্তির এক সংমিশ্রণ ঘটিয়েছে।

সম্প্রতি মাইক্রোসফট Tellme Networks 800 মিলিয়ন ইউএস ডলারে কেনার ঘোষণা দেয়, যার মূল কাজ ধ্বনি শনাক্ত করার প্রযুক্তিকে ওয়েব প্রযুক্তির সাথে সম্পৃক্ত করা। Tellme Networks কয়েকটি কোম্পানিকে স্বয়ংক্রিয় ডিরেক্টরি সহযোগিতা সেবা দিয়েছে। Tellme কোম্পানির স্রষ্টা Angus Davis-এর উদ্ধৃতি দিয়ে বলেছেন- Voice is a great way to input information। পাঠকদেরকে গুগল-এর সহায়তায় Tellme সম্পর্কে আরো বিস্তারিত জানতে অনুরোধ করবো। বাংলা ধ্বনিভিত্তিক সফটওয়্যার তৈরিতে প্রয়োজনীর ধ্বনিভিত্তিক গবেষণা ও উন্নয়ন কাজের মাধ্যমে ডিজিটাল বাংলাদেশের সফল বান্তবায়নকে ত্বরান্বিত করবে। এই হোক আমাদের প্রত্যাশা।

কজ ওয়েব
পত্রিকায় লেখাটির পাতাগুলো
অনান্য লিঙ্কস
চলতি সংখ্যার হাইলাইটস