ভাষা প্ৰয়ুক্তিযে কথিত আৰু লিখিত ভাষাবোৰ বুজি পোৱা আৰু/অথবা সমন্বয ঘটোৱা কম্পিউটাৰ ছিষ্টেমবোৰৰ বিষযে
গৱেষণা কৰে| ইযাৰ ভিতৰত ভাষা সংসাধন (চিনাক্তকৰণ, অৰ্থবোধ আৰু সংশ্লেষণ), তথ্য় আহৰণ, হস্তলিপি
চিনাক্তকৰণ, মেছিন অনুবাদ, লিপি সাৰাংশ আৰু ভাষা সৃষ্টি আদিৰ দৰে বিষয সামৰি লোৱা হয |
কম্পিউটেশ্য়নেল ভাষাতত্ব (ছি এল) হ'ল ভাষাতত্ব আৰু মানৱ ভাষা ক্ষমতাৰ কম্পিউটেশ্য়নেল দিশবোৰৰ অধ্য়যনৰ সৈতে জড়িত কম্পিউটাৰ বিজ্ঞানৰ মাজৰ এটা বিষয | ই হ'ল এটা বোধশক্তি সম্বন্ধীয বিজ্ঞানৰ অংশ আৰু মানৱ বোধশক্তিৰ কম্পিউটেশ্য়নেল আৰ্হি অধ্য়যন কৰি থকা কম্পিউটাৰ বিজ্ঞানৰ কৃত্ৰিম বুদ্ধিমত্তা ( এআই) নামৰ শাখাটোৰ ক্ষেত্ৰখনত ই অধিক্ৰমণ কৰে | ছি এল দুটা উপাদানেৰে তৈযাৰী: প্ৰাযোগিক আৰু তাত্বিক | মানৱ ভাষা ব্য়ৱহাৰৰ নমুনা তৈযাৰৰ ব্য়ৱহাৰিক ফলাফল নিৰ্ণয কৰাৰ প্ৰতি ছি এলৰ প্ৰাযোগিক উপাদানৰ আগ্ৰহ অধিক| ইযাৰ লক্ষ্য় হ'ল মানৱ ভাষাৰ কিছু জ্ঞান থকা ছফ্টৱেৰ সামগ্ৰী সৃষ্টি কৰা |
নেছাৰেল লেংগুৱেজ ইন্টাৰফেছেছে প্ৰযোগকাৰীক কম্পিউটাৰত জাৰ্মান, ইংৰাজী নাইবা অন্য় ভাষাত সম্পৰ্ক স্থাপন কৰাৰ সুয়োগ দিযে| এনে ইন্টাৰফেছবোৰৰ কিছু অনুপ্ৰযোগ ক্ষেত্ৰ হ'ল ডাটাবেছ প্ৰশ্ন, লিপি আৰু তথাকথিত বিশেষজ্ঞ পদ্ধতিৰ পৰা তথ্য় পুনৰুদ্বাৰ ইত্য়াদি | কথিত ভাষা চিনাক্তকৰণ ক্ষেত্ৰখনত হোৱা শেহতীযা অগ্ৰগতিবোৰে বিভিন্ন ধৰণৰ স্বাভাৱিক ভাষা পদ্ধতিৰ প্ৰযোগসাধ্য়তা উন্নত কৰিছে |
মানুহ আৰু মেছিনৰ মাজৰ য়োগায়োগ সমস্য়াতকৈও বহু পুৰণি সমস্য়া হ ' ল দুজন বেলেগ বেলেগ ভাষাত কথা কোৱা মানুহৰ মাজত দেখা দিযা য়োগায়োগ সমস্য়া | প্ৰাযোগিক কম্পিউটেশ্য়নেল ভাষাতত্বৰ এটা মৌলিক লক্ষ্য় আছিল বিভিন্ন ভাষাৰ মাজত সম্পূৰ্ণস্বযংক্ৰিয অনুবাদৰ সুবিধা সৃষ্টি | কম্পিউটেশ্য়নেল ভাষাতত্বই মানৱ অনুবাদকৰ কাম উজু কৰি তোলা আৰু উত্পাদনশীলতা উন্নত কৰিব পৰা ছফ্টৱেৰ ছিষ্টেম তৈযাৰ কৰিছে | য়দিও অদূৰ ভৱিষ্য়তে মানৱ ভাষা ক্ষমতাৰ সফল কৃত্ৰিম ৰূপান্তকৰণ আশা কৰা হোৱা নাই , তথাপিও শব্দ সংসাধক কাৰ্য়সূচীবোৰৰ বাবে ব্য়াকৰণ পৰীক্ষকৰ দৰে দৈনন্দিন কাম-কাজ সুচল কৰি তোলা পদ্ধতিবোৰৰ আৰ্হি তৈযাৰ , বাস্তৱ ৰূপ দিযা তথা তদাৰক কৰা ইত্য়াদি অনেক তাত্ক্ষণিক গৱেষণা লক্ষ্য়ৰ ওপৰত কম্পিউটেশ্য়নেল ভাষাতত্বই কাম কৰি আছে |
তাত্বিক ছি এল-এ আনুষ্ঠানিক তত্বৰ সৈতে জড়িত বিষযবোৰ অধ্য়যন কৰে | ই এজন মানুহক ভাষা এটা সৃষ্টি কৰিবলৈ আৰু বুজিবলৈ কেনেধৰণৰ ভাষা বিজ্ঞান সম্পৰ্কীয জ্ঞানৰ প্ৰযোজন হয তাৰ আনুষ্ঠানিক তত্ব বিচাৰ কৰি চায | কম্পিউটেশ্য়নেল ভাষাতত্বই মানৱ ভাষা ক্ষমতাৰ দিশবোৰক কৃত্ৰিম ৰূপ প্ৰদান কৰি আনুষ্ঠানিক আৰ্হি বিকশাই তোলে আৰু সেইবোৰ কম্পিউটাৰ প্ৰ'গ্ৰেমৰূপে প্ৰযোগ কৰে | এই প্ৰ'গ্ৰেমবোৰে সূত্ৰসমূহৰ মূল্য়াযন আৰু ভৱিষ্য়ত বিকাশৰ আধাৰ স্থাপন কৰে| ভাষা বিজ্ঞানৰ সূত্ৰবোৰৰ উপৰি ভাষা
বিজ্ঞানৰ ক্ষমতাক কৃত্ৰিম ৰূপ দিযাত বোধশক্তি সম্পৰ্কীয মনোবিজ্ঞানৰ তথ্য়বোৰেও এক গুৰুত্বপূৰ্ণ ভূমিকা পালন কৰে | মনোবিজ্ঞানৰ
মতে, প্ৰধানত: মনোভাষাতাত্বিক অঞ্চলৰ জৰিযতে মানৱ ভাষা প্ৰযোগ ক্ষমতা গঠনকাৰী বোধশক্তি সম্পৰ্কীয প্ৰক্ৰিযাবোৰ পৰীক্ষা-
নিৰীক্ষা কৰি চাব পাৰি | মানৱ প্ৰকৃতি, স্বাভাৱিক আৰু আচৰণ সম্পৰ্কীয বিজ্ঞান তথা অভিয়ান্ত্ৰিক পদ্ধতি আৰু কাৰ্য়-কৌশলৰ সংমিশ্ৰণত কম্পিউটেশ্য়নেল ভাষাতত্বৰ বিশেষ আকৰ্ষণ লুকাই থাকে |
লিংগুইছষ্টিক ডাটা কনছ'ৰটিযামৰ লিংগুইছষ্টিক এনোটেশ্য়ন টুলছ্-ৰ ৱেবপেজ http://www.ldc.upenn.edu/annotation-ত ইযাৰ বিস্তৃত বিৱৰণ পঢ়িবলৈ পাব| ইযাৰ মূল আলোচ্য় বিষয ভাষা য়দিও লিপিৰ সৈতে কাম কৰিব পৰাকৈ অন্য় তথ্য়ও সন্নিৱিষ্ট কৰা হৈছে |
ভাষা সংশ্লেষণ প্ৰ'গ্ৰেমবোৰে লিখিত লিপিক স্বযংক্ৰিযভাৱে সৃষ্টি হোৱা কৃত্ৰিম কথিত ভাষালৈ পৰিৱৰ্তিত কৰে| ভাষা সংশ্লেষণক প্ৰাযেই টেক্সট টু স্পীছ মানে লিপিৰ পৰা ভাষা ৰূপান্তৰ (TTS) আখ্য়াৰে বুজোৱা হয|
এই প্ৰক্ৰিযাটোৰ কেইবাটাও পৰ্য়াযক্ৰমিক নিদেৰ্শনা আছে| ভাষাৰ ব্য়ৱহাৰৰ ওপৰত এই নিৰ্দেশনাবোৰৰ বাচনি নিৰ্ভৰশীল | আটাইতকৈ সহজ নিযমটো হ'ল মানুহ এজনক প্ৰযোজনীয কথাখিনি ক'বলৈ দি সেযা বাণীৱদ্ধ কৰাটো | অৱশ্য়ে সীমিত সংখ্য়ক বাক্য়াংশ নাইবা বাক্য়ৰ ক্ষেত্ৰতহে এই ব্য়ৱস্থাটো কাৰ্য়কৰী হয, য়েনে -ৰে'লৱে ষ্টেশ্য়নত ঘোষিত সংবাদ নাইবা টেলিফোনৰ জৰিযতে দিযা সূচীৰ তথ্য় | ভাষা সংশ্লেষণৰ উত্কৰ্ষতা মাতৰ বাণীৱদ্ধ ৰূপটোৰ গুণগত মানৰ ওপৰত নিৰ্ভৰশীল | কৃত্ৰিম ভাষাৰ নিকৃষ্ট মানৰ বাণীবন্ধনে কোৱা কথাখিনি ক্ষুদ্ৰ ক্ষুদ্ৰ অংশত ভাঙিবলৈ বাধ্য় কৰে | ইউনিটবোৰ য়িমানে সৰু হ'ব সংখ্য়াত সিমানে কম হ'ব আৰু তাৰ মানো নিম্ন হ'ব | এটা প্ৰাযেই ব্য়ৱহৃত ইউনিট হ'ল ফ'নেম, ভাষাবিজ্ঞানৰ ক্ষুদ্ৰতম ইউনিট | পশ্চিম ইউৰোপীয ভাষাবোৰত ভাষাৰ ব্য়ৱহাৰৰ ওপৰত নিৰ্ভৰশীল প্ৰায 35-50 টা ফ'নেম আছে, মানে 35-50 টা একক বাণীবন্ধন | এইবোৰক এটা সলসলিযাকৈ কোৱা ভাষালৈ ৰূপান্তৰিত কৰিবলৈ এক একক উপাদানবোৰ কোনো বাধা নোপোৱাকৈ সঞ্চাৰিত কৰিব লাগিব| সেযেহে ইযাৰ ইন্টেলেজিবিলিটি নিম্ন হয, প্ৰযোজনীয মেম'ৰীৰ পৰিমাণ সামান্য়|
এই সমস্য়াৰ সমাধান হ'ল ডাইফোনৰ ব্য়ৱহাৰ| সঞ্চাৰৰ সমযত ছোৱা ছোৱা কৰাতকৈ, ফোনেমবোৰৰ কেন্দ্ৰত
কৰ্তন কৰা হয, ফলত সঞ্চাৰণ অব্য়াহত থাকে| ই প্ৰায 400 উপাদান( 20*20) আগবঢ়ায, মান উন্নত হয | ইউনিটবোৰ য়িমানে দীঘল হ'ব, সিমানে অধিক উপাদান থাকিব | গুণ উন্নত হয, অধিক মেম'ৰীৰ প্ৰযোজন হয | ব্য়ৱহাৰ হোৱা অন্য় ইউনিটবোৰ হ'ল অৰ্ধ-শব্দাংশ,
শব্দাংশ, শব্দ নাইবা এইবোৰৰ মিশ্ৰিত ৰূপ, মানে শব্দ বুত্পত্তি আৰু শব্দৰূপ নাইবা ধাতুৰূপ সমাপ্তি | 'মিউজিযাম অব স্পীছ এনালাইচিছ এণ্ড ছিনথেছিছে' প্ৰমাণ কৰিছে য়ে কৃত্ৰিম ভাষা পদ্ধতিৰ উদ্ভাৱন আজিৰ পৰা প্ৰায 150 বছৰ পুৰণি | চাব পাৰে:
(http://mambo.ucsc.edu/psl/smus/smus.html)
ভাৰতীয মানক ব্য়ুৰ'ই 7 নাইবা 8 বিট কেৰেক্টাৰ ব্য়ৱহাৰ কৰাৰ সুবিধা প্ৰদান কৰা আৰু সকলো কম্পিউটাৰ তথা সংয়োগ মাধ্য়মৰ ব্য়ৱহাৰৰ বাবে 'ইস্কী'(ইণ্ডিযান স্ক্ৰীপ্ট কোড ফৰ ইনফৰ্মেশ্য়ন ইন্টাৰছেঞ্জ)নামৰ এটা নিযামক মানক তৈযাৰ কৰিছে | এটা 8 বিট পৰিস্থিতিত, নিম্ন 128 টা কেৰেক্টাৰ হ'ল IS10315:1982(ISO 646 IRV)-ৰ সংজ্ঞাৰ অনুৰূপ| তথ্য় আন্তঃপৰিৱৰ্তনৰ বাবে থকা 7
বিট কোডৰ কেৰেক্টাৰ ছেটটোক এএছছিআইআই কেৰেক্টাৰ ছেট বুলিও জনা য়ায | আটাইবোৰ ভাৰতীয লিপিৰে শীৰ্ষৰ 128 টা কেৰেক্টাৰৰ আধাৰ হ'ল প্ৰাচীন ব্ৰাহ্মী লিপি| এটা 7 বিট পৰিস্থিতিত, কন্ট্ৰোল কোড SI-এ ইস্কী কোড ছেট সক্ৰিয কৰে আৰু কন্ট্ৰোল কোড SO-ই এএছছিআইআই কোড ছেট পুনৰবাচনি কৰে | ভাৰতত 22 টা আনুষ্ঠানিকভাৱে স্বীকৃত ভাষা আছে| পাৰ্ছো- আৰবিক লিপিৰ বাহিৰে বাকী আন 10টা ভাৰতীয ভাষাত ব্য়ৱহৃত লিপিযেই প্ৰাচীন ব্ৰাহ্মী লিপিৰ পৰা বৰ্তমানৰ ৰূপ ধাৰণ কৰিছে আৰু এইবোৰৰ
এটা উমৈহতীযা ধ্বনিতাত্বিক গঠন আছে, ফলত এটা উমৈহতীযা কেৰেক্টাৰ ছেট তৈযাৰ কৰিব পৰা গৈছে | বিভিন্ন ভাৰতীয লিপি ফন্ট আৰু ডিচপ্লে এট্ৰিবিউটছ্ বাচনি কৰিবলৈ এটা বৈশিষ্ট্য় বাচনি কাৰ্য়-প্ৰণালী তৈযাৰ কৰা হৈছে| এটা কাৰ্য়-প্ৰণালী প্ৰসাৰে ইস্কী কোডৰ সৈতে অধিক কেৰেক্টাৰ ব্য়ৱহাৰ কৰাৰ সুয়োগ দিযে | ইস্কী কোড তালিকাখন হ'ল ব্ৰাহ্মীভিত্তিক ভাৰতীয লিপিবোৰৰ বাবে প্ৰযোজনীয আটাইবোৰ কেৰেক্টাৰ সস্বলিত 'ছুপাৰ ছেট' | সুবিধাৰ বাবে মানকৰূপে চৰকাৰী লিপি দেৱনাগৰীৰ আখৰবোৰ ব্য়ৱহাৰ কৰা হৈছে | ভাৰতীয মানক ব্য়ুৰ'ই জাৰি কৰা মানক সংখ্য়া ISI319:1991 হ'ল তথ্য় আন্তঃপৰিবৰ্তনৰ কাৰণে থকা শেহতীযা ভাৰতীয মানক আৰু
ভাৰতীয ভাষাবোৰত তথ্য় প্ৰয়ুক্তি সামগ্ৰী বিকশাই তোলাৰ ক্ষেত্ৰত এই নিযামক মানক মানি চলা হয |
এলফাবেটিক কোড ফৰ ইনফৰ্মেশন ইন্টাৰছেঞ্জ('এই- কী' বুলি উচ্চাৰিত)| এইটো এটা 8-বিট কোড, তলৰ অৰ্ধাংশত
এএছছিআইআই কেৰেক্টাৰ সংয়োজিত থাকে | ওপৰৰ অৰ্ধাংশত 'এই- কী' কেৰেক্টাৰবোৰ থাকে | পিচি-'এই- কী' স্ক্ৰীপ্ট কোড হ'ল
'এই- কী' স্ক্ৰীপ্ট কোডৰ এটা ভাৰ্ছন য়'ত আইবিএম-পিছি-ৰ সৈতে সুসংগতি বজাই ৰাখিবলৈ ওপৰৰ অৰ্ধাংশত কেৰেক্টাৰবোৰ খণ্ড খণ্ড কৰা হয | এনে কৰাতো জৰুৰী য়াতে লাইন ড্ৰইং কেৰেক্টাৰবোৰৰ কোনো ক্ষতি নহয | এইবোৰ কেৰেক্টাৰ ছেটৰ ওপৰৰ অৰ্ধাংশৰ
মাজত থাকে |
জটিল লিপিৰ উচিত উপস্থাপন সুনিশ্চিত কৰিবলৈ তলত দিযা উপকৰণবোৰৰ প্ৰযোজন হয:
এছিআইআই: এলফাবেটিক কোড ফৰ ইনফৰ্মেশ্য়ন ইন্টাৰছেঞ্জ | এই কম্পিউটাৰ কোডটোৰ দ্বাৰা এখন বৰ্ণমালাৰ মৌলিক আখৰবোৰ উপস্থাপন কৰা হয| বেছিভাগ বৰ্ণমালাৰে মৌলিক আখৰ আৰু চিহ্নৰ(ছাইনিজৰ দৰে প্ৰতীক অক্ষৰ লিপিক বাদ দি) সংখ্য়া হ'ল 96 -টাতকৈ কম | এই মৌলিক আখৰকেইটা ইটোৰ সৈতে সিটো জোৰা লগাই এখন বৰ্ণমালাৰ আটাইবোৰ আখৰৰ সম্ভাৱ্য় আকৃতিবোৰ প্ৰকাশ কৰিব পাৰি | এছিআইআই কোড এছিআইআই কীবোৰ্ড অ'ভাৰলে-ৰ মাধ্য়মেৰে টাইপ কৰিব পাৰি | য়িকোনো সাধাৰণ ইংৰাজী কীবোৰ্ডত এই এছিআইআই অ'ভাৰলে খাপ খাই পৰে | প্ৰতিটো এছিআইআই কেৰেক্টাৰেই এই কীবোৰ্ড অ'ভাৰলে-ত বিশেষ স্থান দখল কৰি আছে|
'ইস্ফোক': ইনটেলিজেন্স বেছড্ স্ক্ৰীপ্ট ফন্ট কোড | 'ইস্ফোক' হ'ল বৰ্ণমালা এখনৰ বৰ্ণবোৰৰ মৌলিক আকৃতি সন্নিৱিষ্ট এক সাংকেতিক কেৰেক্টাৰ ছেট | এই আকৃতিবোৰ ৰৈখিকভাৱে ওপৰা ওপৰিকৈ ব্য়ৱহাৰ কৰি লিপিত য়িকোনো শব্দ ৰচনা কৰিব পৰা য়ায | প্ৰতিটো 'ইস্ফোক' কেৰেক্টাৰেই হ'ল জিগছ' পাজলৰ দৰে ; ই স্বযংসম্পূৰ্ণ আখৰ নহ'বও পাৰে | প্ৰতিটো 'ইস্ফোক' ছেটত সৰ্বাধিক 188 টা কেৰেক্টাৰ থাকিব পাৰে | অধিকাংশ বৰ্ণমালাৰ বাবে ইমানেই য়থেষ্ট, দুখনমান বৰ্ণমালাক অধিক কেৰেক্টাৰ লাগে|
'ইস্ফা'- ইনটেলিজেন্স বেছড স্ক্ৰীপ্ট টু ফন্ট এলগ'ৰিথম | সদায মৌলিক 'এই-কী' কেৰেক্টাৰ অনুসৰিহে শব্দ এটা টাইপ কৰা হয | ইযাক মৌলিক 'ইস্ফোক' আকৃতি প্ৰযোগ কৰি প্ৰদৰ্শিত কৰা হয. 'এই-কী' কোডবোৰক সঠিক'ইস্ফোক' কোডলৈ ৰূপান্তৰিত কৰিবলৈ এটা কম্পিউটাৰ নিৰ্দেশনাৰ প্ৰযোজন হয | ইযেই হ'ল 'ইস্ফা এলগ'ৰিথম' |
'এই -কী' (এল্ফাবেট কোড ফৰ ইনফৰ্মেশ্য়ন ইন্টাৰছেঞ্জ) কোডত 'এই -কী' বোৰ্ডত থকা আটাইবোৰ মৌলিক কেৰেক্টাৰ থাকে | য়েনে, 'এই -কী' ভাৰতীয কোড আৰু কীবোৰ্ডত 10 টা ভাৰতীয লিপিৰ বাবে প্ৰযোজনীয কেৰেক্টাৰবোৰ পোৱা য়ায: অসমীযা, বাংলা, দেৱনাগৰী, গুজৰাটী, কন্নড়, মালযালম, উড়িযা, পঞ্জাৱী, তামিল আৰু তেলুগু | মৌলিক কেৰেক্টাৰবোৰ এনে এটা ক্ৰমত ৰখা হয য়ে প্ৰত্য়ক্ষ বাচনিৰ দ্বাৰা প্ৰত্য়াশিত আখৰ পাব পাৰি | গোটেইবোৰ লিপিৰ ক্ষেত্ৰতে এই কথাটো প্ৰায একে | প্ৰদৰ্শিত কৰিবলৈ এই 'এই -কী' কোডবোৰ 'ইস্ফোক' কোডলৈ পৰিৱৰ্তিত কৰিব লাগে | নিৰ্বাচিত লিপিৰ বাবে এই কামটো 'ইস্ফা এলগ'ৰিথম'-ৰ মাধ্য়মেৰে কৰা হয | য়িকোনো এই-কী ৰচনা এই লিপিবোৰৰ ভিতৰৰ য়িকোনো লিপিতে প্ৰদৰ্শিত কৰিব পাৰি| কেৱল লিপি বাচনি কৰিযেই অন্য় এটা লিপিলৈ লিপ্য়ান্তৰ কৰিব পাৰি | ৰচনাৰ উত্তম স্থানান্তৰৰ বাবে সংয়োগ মাধ্য়মৰ টেলেক্ম-ৰ দৰে মেছিনে 'এই -কী' কোড ব্য়ৱহাৰ কৰে | এএলপি ৱৰ্ড প্ৰ'ছেছ'ৰে আভ্য়ন্তৰীণভাৱে 'এই -কী' কোড ব্য়ৱহাৰ কৰি আক্ষৰিক স্তৰত সঠিক সম্পাদন আৰু বানানৰ শুদ্ধতা নিশ্চিত কৰে | বৰ্তমান সক্ৰিয হৈ থকা উইণ্ড' অনুপ্ৰযোগসমূহে 'এই -কী' কোড পোনে পোনে কামত প্ৰযোগ কৰিব নোৱাৰে, প্ৰদৰ্শন নিশ্চিত কৰিবলৈ ইযাৰ বাবে এটা ইন্টেলিজেন্ট এলগ'ৰিথমৰ প্ৰযোজন | বৰ্তমানৰ উইণ্ড' অনুপ্ৰযোগসমূহে অৱশ্য়ে 'ইস্ফোক' কোড কামত খটুৱাব পাৰে| কোডবোৰ এই উদ্দেশ্য়েৰেই তৈযাৰ কৰা হৈছিল| য়েতিযাই লিপি এএলপি-ৰ পৰা উইণ্ড' অনুপ্ৰযোগলৈ স্থানান্তৰ কৰিবলগীযা হয,
তেতিযাই 'এই -কী' আৰু 'ইস্ফোক' কোডৰ মাজৰ ৰূপান্তৰ প্ৰযোজনীয হৈ পৰে| 'এই -কী' কীবোৰ্ড ব্য়ৱহাৰ কৰি এটা উইণ্ড' অনুপ্ৰযোগৰ পৰিধিৰ ভিতৰত 'ইস্ফোক' লিপি প্ৰত্য়ক্ষভাৱে টাইপ কৰিব পাৰি| ইযাৰ বাবে 'এই -কী' কোডক আভ্য়ন্তৰীণভাৱে
'ইস্ফোক' কোডলৈ সলনি কৰিব পৰা 'কাষ্ট'ম কীবোৰ্ড ড্ৰাইভাৰ' ব্য়ৱহাৰ কৰা হয |
লিপি বৰ্ণ ছেট | এই প্ৰাথমিক কেৰেক্টাৰ ছেটত অধিকাংশ ভাষাৰে বৰ্ণসমূহ, প্ৰতীকসমূহ আৰু সঘনাই ব্য়ৱহৃত সংখ্য়াবোৰ থাকে | দুটামান বিশেষ পৰিস্থিতি ভেদে, আটাইবোৰ 'ইস্ফোক' কেৰেক্টাৰ ছেটতে এই প্ৰতীকৰ ছেটটো একে হয |
মেট্ ছিং ইংলিছ কেৰেক্টাৰ ছেট | ইংৰাজী ফন্ট জোৰা লগাবলৈ ব্য়ৱহৃত ই হ'ল এটা সংগী বৰ্ণ ছেট | তলৰ অৰ্ধাংশত এএছছিআইআই কেৰেক্টাৰবোৰ থাকে আৰু ওপৰৰ অৰ্ধাংশত ৰোমান লিপ্য়ান্তৰৰ বাবে ধ্বনি কেৰেক্টাৰবোৰ থাকে |
ৰিপূৰক বৰ্ণ ছেট | সাধাৰণতে ব্য়ৱহৃত নোহোৱা সন্ধিয়ুক্ত আখৰ প্ৰতীক সম্বলিত এই পৰিপূৰক কেৰেক্টাৰ ছেটতো হ'ল মূল লিপি|
এই অধ্য়াযত জটিল লিপিবোৰ সাকাৰ কৰিবলৈ প্ৰযোজনীয মৌলিক দৰ্শনবোৰ উল্লেখ কৰা হৈছে | লিপি অনুবাদ দৰ্শন |
শব্দ এটা উচ্চাৰণ কৰাৰ ধৰণ অনুসৰি মূদ্ৰণ কৰাতো স্বাভাৱিক আৰু য়ুক্তিসংগত | শব্দ এটাৰ উচ্চাৰণ প্ৰক্ৰিযাটোত উচ্চাৰণৰ ক্ৰম অনুসৰি আটাইবোৰ মৌলিক আখৰ সংয়ুক্ত থাকে | প্ৰযোজনীয বিশেষ প্ৰতীকেৰে সৈতে বৰ্ণমালাৰ এখনৰ মৌলিক আখৰবোৰেৰে 'এই-কী' (এলফাবেট কোড ফৰ ইনফৰমেশ্য়ন ইন্টাৰছেঞ্জ) গঠিত | 'এই-কী' কোডৰ আখৰবোৰ সিহঁতৰ আক্ষৰিক বাচনি ক্ৰম অনুসৰি সজোৱা থাকে| 'এই-কী' কোডত এএছছিআইআই কেৰেক্টাৰ ছেটো সংয়োজিত থাকে |
টা লিপিত থকা মৌলিক আকাৰবোৰ ৰৈখিকভাৱে সান-মিহলি কৰি এটা শব্দ কম্পোজ কৰিব পাৰি |
ইস্ফোক-এ এই মৌলিক আকৃতি সম্বলিত লিপিৰ প্ৰতিকুলে কাম কৰে | পোনপটীযা টাইপিঙৰ বাবে ই অতি অসুবিধা সৃষ্টি কৰিব পাৰে |
শব্দ এটা প্ৰদৰ্শিত কৰিবলৈ এটা ইন্টেলিজেন্ট স্ক্ৰীপ্ট টু ফন্ট এলগ'ৰিথমে (ইস্ফা) 'এই-কী' বানান বুজি লৈ ইযাৰ বাবে প্ৰযোজনীয 'ইস্ফোক' কোড ছিকুযেন্স সৃষ্টি কৰে | ইংৰাজীৰ দৰে সহজ লিপিৰ ক্ষেত্ৰত এএছছিআইআই কোডেই 'এই-কী' আৰু 'ইস্ফোক' দুযোটা কোডৰ বাবে য়থেষ্ট |
অৱশ্য়ে ভাৰতীয লিপিবোৰৰ দৰে অত্য়ন্ত জটিল অনা-ৰৈখিক লিপিবোৰৰ বাবে পৃথক পৃথক 'আই-কী', 'ইস্ফোক' কোড আৰু 'ইস্ফা এলগ'ৰিথম'-ৰ প্ৰযোজন হয |
'ইস্ফোক' মানক
ফন্টৰ আৰ্হি তৈযাৰ সূচল কৰি তুলিবলৈ মৌলিক আকাৰ আৰু গঠন উপাদানৰ বাবে |
লিপি মানক
প্ৰযোজনীয মৌলিক আকাৰৰ সংজ্ঞাৰে ইস্ফোক-এ লিপি এটাৰ আধুনিক অনুবাদ শৈলী উপস্থাপন কৰে |
লিপিৰ একাধিক প্ৰকাৰৰ ফন্টক উপস্থাপন কৰিব পৰাকৈ মৌলিক আকৃতিবোৰ বাচনি কৰা হয |
এটা লিপিৰ 'ইস্ফোক'ক 'ইস্ফা'ৰ সৈতে সংয়ুক্ত কৰিব পাৰি, ইযাৰ জৰিযতে মৌলিক আকৃতিবোৰ ব্য়ৱহাৰ কৰি শব্দ এটা গঠন কৰা মানক অনুৰূপ উপাযবোৰ গম পোৱা য়ায |
এটা লিপিৰ বাবে বিকশাই তোলা সকলোবোৰ ফন্টেই পাৰস্পৰিকভাৱে মিলাব পৰা য়ায |
প্ৰযোগকাৰীযে মানপচন্দৰ ফন্টত লেখনি এটা চাব পাৰে |
য়িহেতু ইস্ফোক ফন্টবোৰ ৰৈখিকভাৱে তৈযাৰ কৰা হৈছে, সেযেহে এইবোৰ বৰ্তমানে সক্ৰিয হৈ থকা ইংৰাজী অনুপ্ৰযোগৰ সৈতে মিলাই ব্য়ৱহাৰ কৰিব পাৰি আৰু আজিকালিৰ লেজাৰ প্ৰিন্টাৰ তথা টাইপছেটাৰত ছপা কৰিব পাৰি |
ইস্ফোকে এম এছ- উইণ্ড' আৰু মেছিনটোশ্বৰ দৰে গ্ৰাফিক- অ'ৰিযেন্টেত পৰিৱেশত জটিল লিপি অন্তভুৰ্ক্ত কৰিবৰ বাবে কোট ছেট য়োগান ধৰিব পাৰে| এখন 'এই-কী' কীবোৰ্ডৰ মাধ্য়মেৰে স্বতঃলব্ধ মানৱীয আন্তঃৰূপ এটাৰ সৈতে ইস্ফোক-এ সবাতোকৈ পৰিস্কাৰ
লিপি অনুবাদৰ সুবিধা আগবঢ়ায |
বেছিভাগ প্ৰধান তথ্য় প্ৰয়ুক্তি কোম্পানীযে আগবঢ়োৱা সমৰ্থনৰ পৰিপ্ৰেক্ষিতত সমগ্ৰ বিশ্বই ইউনিকোডক লাহে লাহে তথ্য় আন্তঃপৰিবৰ্তনৰ বাবে নিৰূপিত মানক হিচাপে গ্ৰহণ কৰিবলৈ আৰম্ভ কৰিছে| ভাৰতীয ভাষাৰ বাবে ইউনিকোডত ইস্কী-88 প্ৰযোগ কৰা হয, শেহতীযা আনুষ্ঠানিক মানক ইস্কী-91 প্ৰযোগ কৰা নহয | ভাৰতীয ভাষাৰ লিপিবোৰৰ সঠিক কোড নিৰ্ধাৰণৰ বাবে প্ৰযোজনীয শুধৰণিৰ কাৰণে ভাৰত চৰকাৰে 'ইউনিকোড কনছ'ৰটিযাম' উপস্থাপন কৰা উচিত বুলি ভাবিছে | সেযেহে তথ্য় প্ৰয়ুক্তি বিভাগে ভোট দিযাৰ অধিকাৰ লাভ কৰি 'ইউনিকোড কনছ'ৰটিযাম'ৰ পূৰ্ণ সদস্য় পদ লাভ কৰিছে |
16 বিট (2 বাইট) ইউনিকোড
ইউনিকোড মানক হ'ল বিশ্বজনীন বৰ্ণ এনকোডিং মানক| কম্পিউটাৰ প্ৰ'চেছিঙৰ বাবে লিপি উপস্থাপনত ইযাক ব্য়ৱহাৰ কৰা হয| ইউনিকোড মানক পৃথিৱীৰ সকলোবোৰ লিখিত ভাষাৰ ক্ষেত্ৰত ব্য়ৱহৃত সকলোবৰ বৰ্ণকে এনকোড কৰিবলৈ সক্ষম | ইউনিকোড মানকে বৰ্ণ এটাৰ তথ্য় আৰু ব্য়ৱহাৰৰ ধৰণ বুজাই দিযে | ইউনিকোড মানক ভিন্ন ভাষাৰ লিপি ব্য়ৱহাৰ কৰা কম্পিউটাৰ প্ৰযোগকাৰী, ব্য়ৱসাযৰ সৈতে জড়িত লোক, ভাষাতাত্বিক, গৱেষক, বিজ্ঞানী, গণিতজ্ঞ আৰু কাৰিকৰী বিভাগৰ লোকৰ বাবে অতি উপয়োগী | ইউনিকোডে ব্য়ৱহাৰ কৰা 16 বিটৰ এনকোডিংটোৱে 65000 বৰ্ণতকৈও অধিক (65536) বৰ্ণৰ কোড পইন্ট জনাত সহায কৰে| ইউনিকোড মানকে প্ৰতিটো বৰ্ণকে একোটা একক সাংখ্য়িক মাত্ৰা আৰু নাম প্ৰদান কৰে| ইউনিকোড মানক আৰু ISO10646 মানকে ইউ টি এফ-16 নামৰ এটা কাৰ্য়-প্ৰণালী প্ৰসাৰ তৈযাৰ কৰে, য়িটোৱে দহ লাখতকৈও অধিক বৰ্ণ এনকোডিং-ত সহায কৰে | বৰ্তমান ইউনিকোড মানকে 49194-টা বৰ্ণৰ বাবে কোড আগবঢ়াই আছে |
কেৰেক্টাৰ এনকোডিং সুস্থিৰতা বৰ্তাই ৰাখিবলৈ 'ইউনিকোড কনছ'ৰটিযামে' কেইটমান নীতি য়ুগুত কৰিছে, ইযাৰ অধীনত কোনো বৰ্ণ মছি পেলাব পৰা নায়াব, বৰ্ণ নাম সলনি কৰিব পৰা নায়াব | কেৱল বৰ্ণটীকাৰ শেহতীযা সংয়োজন সম্ভৱ |
1. এটা বৰ্ণ এবাৰ এনকোডেড হোৱাৰ পিছত ইযাক স্থানান্তৰিত অথবা আঁতৰাই পেলাব পৰা নায়াব |
2 এবাৰ এটা বৰ্ণ এনকোডেড হোৱাৰ পিছত ইযাৰ বৰ্ণ নাম সলনি কৰিব পৰা নায়াব |
3. এবাৰ এটা বৰ্ণ এনকোডেড হোৱাৰ পিছত ইযাৰ মৌলিক নীতি সম্বন্ধীয য়ুক্ত শ্ৰেণী আৰু বিয়োজন (মৌলিক নীতি সম্বন্ধীয অথবা সুসংগতি) কৰিব পৰা নায়াব য়দিহে ই স্বাভাৱিককৰণ প্ৰভাৱিত কৰাৰ সম্ভৱনা থাকে |
4. এবাৰ এটা বৰ্ণ এনকোডেড হোৱাৰ পিছত ইযাৰ প্ৰ'পাৰ্টি সমূহ পৰিৱৰ্তন কৰিব পৰা য়ায য়দিও বৰ্ণটোৰ পৰিচযৰ সাল-সলনি কৰিব পৰা নায়াব |
5. ইউনিকোড কেৰেক্টাৰ ডাটাবেছত কিছুমান প্ৰ'পাৰ্টি ভেল্য়ুৰ গঠন সাল-সলনি কৰিব পৰা নায়ায |
'ইউনিকোড' -এ এটা 16 বিট এনকোডিং ব্য়ৱহাৰ কৰে, য়িটোৱে 65000-তকৈও অধিক বৰ্ণৰ(65536) কোড পইন্ট জনাত সহায
কৰে | ইউনিকোড মানকে প্ৰতিটো বৰ্ণকে একোটা বিশেষ সাংখ্য়িক মাত্ৰা আৰু নাম প্ৰদান কৰে | ইউনিকোড মানক পৃথিৱীৰ সকলোবোৰ লিখিত ভাষাৰ ক্ষেত্ৰত ব্য়ৱহৃত সকলোবোৰ বৰ্ণকে এনকোড কৰিবলৈ সক্ষম |
' ইস্কী' -এ এটা 8 বিট' কোড ব্য়ৱহাৰ কৰে | ই হ' ল 7 বিট সম্বলিত এএছছিআইআই কোডৰ এটা বিস্তাৰ, য়'ত ব্ৰাহ্মী লিপিৰ পৰা ওলোৱা 10 টা আধুনিক ভাৰতীয লিপিৰ বাবে প্ৰযোজনীয মৌলিক আখৰবোৰ অন্তভুৰ্ক্ত কৰা থাকে| ভাৰতত মুঠ 22 টা আনুষ্ঠানিক স্বীকৃতিপ্ৰাপ্ত ভাষা আছে | পাৰ্ছো -আৰবিক লিপিৰ বাহিৰে বাকী 10 টা ভাৰতীয ভাষাৰ বাবে ব্য়ৱহৃত লিপিযেই প্ৰাচীন ব্ৰাহ্মী লিপিৰ পৰা ওলোৱা | সেযেহে ইহঁতৰ এটা উমৈহতীযা ধ্বনিতাত্বিক গঠন আছে, য়িটোৰ বাবে এই লিপিবোৰৰ এটা উমৈহতীযা বৰ্ণ ছেট তৈযাৰ কৰাতো সম্ভৱপৰ হৈছে | ব্ৰাহ্মী লিপিভিত্তিক ভাৰতীয লিপিবোৰৰ বাবে প্ৰযোজনীয আটাইবোৰ বৰ্ণ সম্বলিত 'ইস্কী' কোড তালিকাখন হ'ল এটা 'ছুপাৰ ছেট' | সুবিধাৰ বাবে, মানক হিচাপে চৰকাৰী লিপি দেৱনাগৰীৰ আখৰবোৰ ব্য়ৱহাৰ কৰা হৈছে |
কীবোৰ্ড লে'আউট তিনি প্ৰকাৰৰ আছে |
1. ৰোমানইজ্ড লে'আউট : ৰোমানইজ্ড লে'আউটত ধ্বনিতাত্বিক ইংৰাজী মেপিংবোৰ হিন্দী লিপি মুদ্ৰণ কৰিবলৈ ব্য়ৱহাৰ কৰা হয | য়েনে- raamaa কী কেইটা (নাইবা rAmA)ব্য়ৱহাৰ কৰি হিন্দীত 'ৰামা' শব্দটো পাব পৰা য়ায |
2. টাইপৰাইটাৰ লে'আউট : এই লে'আউটটো হিন্দী টাইপৰাইটাৰ লে'আউটৰ দৰে একে আৰু হিন্দী মুদ্ৰক তথা হিন্দী টাইপৰাইটাৰ লে'আউটৰ সৈতে পৰিচিত লোকৰ বাবে উপয়োগী | টাইপৰাইটাৰ লে'আউট আৰু কী ছিকুযেন্স ছাৰ্টছ্ |
3. ডিঅ'ই ধ্বনিতত্ব : এই লে'আউট ভাৰত চৰকাৰৰ ইলেক্ট্ৰ'নিকছ্ বিভাগে (DOE) তৈযাৰ কৰিছে | এই লে'আউটটোৰ সুবিধা হ'ল আটাইবোৰ ভাৰতীয ভাষাৰ বাবে ই একে | য়েনে, K আখৰৰ কীটোৱে সকলোবোৰ ভাৰতীয ভাষাৰে 'Ka' আখৰটো সূচায | কীবোৰ্ড লে'আউট আৰু কী ছিকুযেন্স ছাৰ্ট ব্য়ৱহাৰ কৰি সঠিক কী জোট বিচাৰি উলিযাব পাৰি |
ইস্কী প্লাগ-ইনৰ লক্ষ্য় হ'ল-
য়িকোনো লিপি
য়িকোনো ফন্ট
য়িকোনো প্লেটফৰ্ম
য়িকোনো ব্ৰাউজাৰ ব্য়ৱহাৰ কৰাৰ স্বাধীনতা প্ৰদান কৰা আৰু কাৰ্য়দক্ষতাৰ ক্ষেত্ৰত কোনো আপোচ নকৰাকৈ নাইবা কোনো অতিৰিক্ত ব্য়য অবিহনে ভাৰতীয ভাষাসমূহত ৱেব চাৰ্ছ কৰাৰ সুবিধা দিযা | বৰ্তমানৰ সংস্কৰণটোৱে ইযাকে দৰ্শাইছে য়ে আমি আমাৰ লক্ষ্য়ৰ পৰা বেছি দূৰত নাই ; আমাক কেৱল ভাৰতৰ সকলো লোকৰে সহায-সহয়োগিতাৰ প্ৰযোজন |
ইয়েতিযা এটা ক্লাযেন্ট এণ্ড ব্ৰাউজাৰে ছাৰ্ভাৰলৈ ইস্কী ফাইল (extension.isc) অনুৰোধ
প্ৰেৰণ কৰে, তেতিযা ছাৰ্ভাৰে মাইম টাইপৰ(text/iscii) সৈতে ডাটা প্ৰেৰণ কৰি প্ৰত্য়ুত্তৰ দিযে | তাৰপিছত এই ইনপুট ছিষ্টেমটো নিযন্ত্ৰণ কৰিবলৈ ক্লাযেন্ট এণ্ড ব্ৰাউজাৰে ইস্কী প্লাগ ইন
সক্ৰিয কৰে | ইস্কী প্লাগ ইনে আহি থকা ইস্কী প্ৰবাহক ফন্ট গ্লিফ ছিকুযেন্সলৈ
পৰিৱৰ্তিত কৰি ইযাক ব্য়ৱহাৰকাৰীযে বুজি পোৱা ইউজাৰ ডিফাইণ্ড ফন্টৰ ৰূপ দিযে | ইস্কী প্লাগ ইনে ফৰ্মৰ ক্ষেত্ৰত ইউজাৰ ডিফাইণ্ড ফন্টৰ সৈতে এখন গোপন ক্ষেত্ৰও
সংলগ্ন কৰে | য়েতিযা এনে ফৰ্ম জমা কৰা হয তেতিযা ছাৰ্ভাৰে ফন্টৰ নাম আৰু ইযাৰ ফিল্ড ভেল্য়ু ক'ত এনকোড কৰা হৈছে সেযা
ধৰিব পাৰে |
তলৰ ৱেবছাইটটোৰ পৰা ইস্কী প্লাগ-ইন বিনামূলীযাকৈ ডাউনলোড কৰিব পাৰে- http://www.iiit.net/ltrc/iscii/index.html