पृष्ठभूमि
सीडी का अनुरोध
सेवाएँ
भारतीय भाषाओं के लिए प्रौद्योगिकी विकास



मानव के बीच आपस में कई तरीकों से संपर्क होता है, जिनमें दृश्य तथा श्रवण पद्धति प्राथमिक पद्धति हैं। इस समय, मानव-मशीन संपर्क का प्रधान माध्यम मानव की सुविधा की बजाय मशीन की सुविधा पर अधिक निर्भर है। माउस तथा कुंजीपटल प्रमुख इनपुट युक्तियाँ हैं तथा विजुअल प्रदर्श यूनिट मुख्य आउटपुट युक्ति है। ऐसे इंटरफेस का प्रयोग करने के लिए विशेष कौशल तथा मानसिक अभिवृत्ति की आवश्यकता होती है, जिससे कई लोग संपन्न नहीं होते हैं। आपसी संपर्क के इस मशीन-केन्द्रित मोड को मानव-केन्द्रित इंटरफेस में बदलना जरूरी है जिससे कंप्यूटरों की शक्ति के लाभ सभी को मिल सकें। हालाँकि सूचना अपने सामने देखने से जो सूचना प्राप्त होती है वह अधिक प्रभावी होती है, तथापि सूचना प्रेषित करने के लिए वाणी सबसे आसान साधन है। कंप्यूटर तथा दूरसंचार प्रणालियों के समाहार के कारण शाब्दिक संव्यवहार आज ज्यादा शक्तिशाली हो गया है, जिनकी सहायता से लोग किसी दूर स्थान पर स्थित कंप्यूटरों से सूचना प्राप्त कर सकते हैं ।

शाब्दिक संव्यवहार में प्रकृत भाषा शामिल है, और इसके कारण सूचना प्रौद्योगिकी के क्षेत्र में भाषा- विज्ञान का महत्व बढ़ गया है। इसलिए, कंप्यूटर पर मानव-केन्द्रित इंटरफेस आज की आवश्यकता है। मनुष्य को एक अनूठी विशेषता से संपन्न किया गया है - भाषा - जिसकी सहायता से वह सूचना, चिंतन तथा विचारों का आपस में आदान-प्रदान बिना किसी परिश्रम के कर लेता है। प्रकृत भाषा के प्रयोग से मानव मशीन संपर्क में मानव भाषा प्रौद्योगिकी के कई पहलू शामिल हैं : वाणी समन्पीडन, पहचान एवं वाणी तथा लिपि की समझ, मशीनी अनुवाद, पाठ सृजन, वाणी तथा घसीट कर लिखी जाने वाली लिपि का संश्लेषण। मशीन के साथ सम्पर्क स्थापित करने के लिए भाषा के दोनों रूप, बोली जाने वाली तथा लिखी जाने वाली, उपयोगी हैं।

कंप्यूटर पर भारतीय भाषाओं पर कार्य करने की सुविधा पिछले दो दशकों के उपलब्ध कराई जा रही है, जिनमें विभिन्न प्लेटफार्मों तथा प्रचालन प्रणालियों पर डेटा संसाधन, शब्द संसाधन, डेस्क टॉप प्रकाशन आदि सहित विभिन्न प्रकार के कार्य शामिल हैं।

सूचना प्रौद्योगिकी विभाग ने किसी प्रकार के भाषायी अवरोध के बिना मानव-मशीन संपर्क की सुविधा प्रदान करने के प्रयोजन से सूचना संसाधन साधनों का विकास करने; बहुभाषी ज्ञान स्रोतों का निर्माण एवं अभिगम करने; तथा अभिनव प्रयोक्ता उत्पादों एवं सेवाओं के विकास के लिए उनका एकीकरण करने के उद्देश्य से टीडीआईएल (भारतीय भाषाओं के लिए प्रौद्योगिकी विकास) कार्यक्रम आरंभ किया। कार्पोरा तथा शब्दकोश जैसे भाषा-विज्ञान संसाधनों के विकास; तथा फोंट, पाठ संपादक, वर्तनी परीक्षक, ओसीआर और पाठ-से-वाणी जैसे मूलभूत सूचना संसाधन साधनों के विकास के लिए परियोजनाओं को धनराशि उपलब्ध कराई गई। मानक भी तैयार किए गए हैं।

भारतीय भाषा प्रौद्योगिकी के उत्पादों तथा सेवाओं का विकास करने के लिए देश के विभिन्न स्थानों पर निजी, सार्वजनिक एवं सरकारी स्तर पर विविध प्रयास किए गए हैं। स्रोत केन्द्रों तथा कॉयलनेट केन्द्रों द्वारा विकसित भाषा प्रौद्योगिकियों तथा साधनों को तेज़ी से प्रयोग में लाना आवश्यक है जिससे उनकी उपयोगिता के बारे मे प्रतिक्रिया मिल सके और उन्हें उत्पादन के लिए उपलब्ध कराया जा सके। अनुसंधान एवं विकास का प्रभाव पूरे समाज पर पडना चाहिए। इसका तात्पर्य यह है कि अनुसंधान के प्रयासों को प्रयोगशालाओं तक सीमित न रखकर इनका नियोजन तेज़ी से किया जाना चाहिए, जिनपर अंतत: प्रयोक्ताओं की प्रतिपुष्टि तथा उनके अनुभव की जानकारी प्राप्त हो सकेगी तथा उनमें अधिक परिशोधन किया जा सकेगा ।

सरकार ने अगले एक वर्ष में निम्नलिखित उत्पाद तथा समाधान सार्वजनिक डोमेन में उपलब्ध कराने की पूरी तैयारी कर ली है :

  • सभी भारतीय भाषाओं में नि:शुल्क फोंट (टीटीएफ तथा ओटीएफ) एवं शब्द संसाधक। पहले कदम के रूप में, सार्वजनिक डोमेन में नि:शुल्क रूप से उपलब्ध कराने के उद्देश्य से शास्त्रीय भाषा तमिल के लिए लोकप्रिय ट्रू टाइप फोंटों (टीटीएफ) का चयन प्रकाशन उद्योग के साथ विचार-विमर्श करके किया गया है। विण्डोज़ 95/विण्डोज़ 98/विण्डोज़ एनटी प्लेटफार्म वाली प्रणालियों पर टीटीएफ फोंटों का प्रयोग व्यापक रूप से हो रहा है। विण्डोज़ 2000/एक्सपी/2003 तथा लिनक्स प्लेटफार्मों के ओटीएफ (ओपन टाइ फोंट) जारी किए जा रहे हैं। यह अपनी तरह का पहला प्रयास है और शब्द संसाधक (वर्तमान एवं नए) इन फोंटों का प्रयोग कर सकेंगे। इसके परिणामस्वरूप, प्रयोक्ताओं को डेटा प्रविष्टि के लिए इंसक्रिप्ट, फोनेटिक तथा टाइपराइटर कुंजीपटल वाले और अधिक फोंट उपलब्ध होंगे।
  • सूचना निष्कर्षण, पुन:प्राप्ति एवं अंकीयकरण के लिए सभी भारतीय भाषाओं में प्रकाशिक अक्षर पहचान (ओ सी आर)। ओ सी आर स्कैन किए गए प्रतिरूपों (मुद्रित पृष्ठों को स्कैनर के माध्यम से स्कैन किया जा सकता है) को संपादन योग्य पाठ में परिवर्तित करता है ताकि उसका प्रयोग अन्य अनुप्रयोगों के लिए किया जा सके और तदनुसार संशोधित किया जा सके। प्रकाशन उद्योग इसका एक प्रमुख लाभग्राही है, जो पुन: मुद्रण तथा नए प्रकाशन तैयार करने के लिए इसका प्रयोग कर सकता है।
  • रेलवे सूचना, स्वास्थ्य की देखभाल, कृषि, आपदा प्रबंध तथा सार्वजनिक उपयोगिता की अन्य सेवा जैसी प्रणालियों के लिए वाणी इंटरफेस। इससे सर्वसाधारण को उन्नत प्रौद्योगिकियों का लाभ प्राप्त करने में सहायता मिलेगी। प्रणाली के साथ संपर्क करने के प्रयोजन से मनुष्य की वाणी की पहचान करने तथा सूचना के निष्कर्षण के लिए उसे पाठ में परिवर्तित करने के लिए वाक् इंजन का प्रयोग किया जा सकता है। पाठ से वाणी का प्रयोग इंटरनेट से सूचना प्राप्त करने जैसे अनुप्रयोगों के लिए दृष्टिहीन व्यक्तियों को पाठ पढ़कर सुनाने के लिए किया जा सकता है।
  • भारतीय भाषाओं के लिये इंटरनेट अभिगम साधन जैसे कि ब्राउज़र, खोज इंजन तथा ई-मेल। इनसे, भारतीय भाषाओं में ईमेल भेजना संभव होगा और खोज इंजन अन्य भारतीय भाषाओं में सूचना खोजने की सहायता उपलब्ध कराएगा और साथ ही किसी भी एक भारतीय भाषा में पूछताछ भी उपलब्ध कराएगा।
  • भारतीय भाषाओं तथा अंग्रेजी के बीच ऑन-लाइन अनुवाद सेवा साधन। इससे लोगों को अंग्रेजी तथा किसी भी भारतीय भाषा में उपलब्ध किसी सूचना-सामग्री का अनुवाद अपनी पसंद की लक्षित भारतीय भाषा में करने की सहायता प्राप्त होगी।

उत्पाद/सेवाएँ टीडीआईएल डेटा केन्द्रों के माध्यम से ऑन-लाइन हेल्प डेस्क के साथ उपलब्ध करवाए जा रहे हैं।

निम्नलिखित के माध्यम से अनुसंधान, उत्पादन, नियोजन तथा सहायता को प्रेरित करने के उद्देश्य से, टीडीआईएल-डीसी (भाषा प्रौद्योगिकी उपयोगिता वितरण चैनल) के लिए सरकार की एक मिशन-उन्मुख एवं समयबद्ध कार्यकलाप योजना है

  • विकसित प्रौद्योगिकियों को बाजार में उपलब्ध कराना
  • उत्पाद तैयार करने के लिए प्रौद्योगिकियों का दर्जा बढ़ाना अथवा उनमें परिशोधन करना
  • आवश्यकता पर आधारित नई प्रौद्योगिकियों का विकास करना

    उपर्युक्त को हासिल करने लिए, निम्नलिखित कदम उठाए जा रहे हैं

    क. टीडीआईएल डेटा केन्द्रों के माध्यम से भाषा प्रौद्योगिकियों/साधनों का चरणबद्ध वितरण
    ख. विकसित साधनों, प्रौद्योगिकियों, उत्पादों तथा सेवाओं का अधिग्रहण
    ग. भाषा प्रौद्योगिकी के क्षेत्रों में सरकार के प्रयासों के बारे में जागरूकता पैदा करना और उपलब्ध साधनों एवं प्रौद्योगिकियों के माध्यम से प्रचार-प्रसार
    घ. प्रयोक्ताओं को साधनों, उपयोगिताओं, उत्पादों आदि को नि:शुल्क रूप से डाउनलोड करने की सुविधा प्रदान करना
    ङ. भाषा प्रौद्योगिकी में निजी-सार्वजनिक भागीदारी को बढ़ावा देना
    च. विशिष्ट अनुप्रयोग क्षेत्रों के मिशन आरंभ करना

Constituents of Framework

TDIL Data Centre
800 X 600 पर बेहतर प्रदर्शित
© सूचना प्रौद्योगिकी विभाग, संचार एवं सूचना प्रौद्योगिकी मंत्रालय, भारत सरकार || वेवसाइट एवं डेटा सेंटर प्रबंधन : सी-डैक, नौएडा