www.hamarivani.com

गुरुवार, 3 अगस्त 2017

मशीन अनुवाद - 1


                                   हिंदी भले ही विश्व में सर्वाधिक बोली जाने वाली भाषा न हो लेकिन हिंदी भारत की प्रमुख भाषा है और भारत का प्रतिनिधित्व करने वाली एकमात्र  भाषा भी है. हम अपने देश , प्रदेश, शहर, गाँव और गली मोहल्ले  में तो इसी को सुनते हुए पले बढे हैं और इसी लिए  इसकी प्रगति , प्रचार एवं प्रसार भी हमें बहुत प्रिय है.

                                हिंदी मुझे भी प्रिय है और तभी इसके सहज और सुलभ प्रयोग के लिए चल रहे एक विशाल अभियान "मशीन अनुवाद" से मैं इसके आई आई टी में आरम्भ होने के प्रथम प्रयास १९८७ से जुड़ी और उस समय से जब कि हमारे समूह के संयुक्त प्रयासों से एक अलग रोमन का निर्माण किया ( जो आज आई आई टी कानपुर रोमन के नाम से जानी जाती है) . इस अभियान को शैश्ववास्था से लेकर आज इसके पूर्ण परिपक्व होने तक के सफर की मैं साक्षी रही हूँ और इससे निरंतर सम्बद्ध हूँ. इसको सिर्फ संगणक विज्ञान ( computer science ) और हिंदी का समागम नहीं माना जा सकता है बल्कि इसके लिए प्रबुद्धजनों ने पाणिनि की अष्टाध्यायी से लेकर तमाम व्याकरण के उद्गम शास्त्रों का अध्ययन करके इसको सही दिशा प्रदान की है. इसमें कंप्यूटर  इंजीनियर और भाषाविज्ञ दोनों की ही महत्वपूर्ण भूमिका रहती है. सबसे अधिक तो इसमें रूचि रखने वालों की भूमिका होती है.

                             इसमें मशीन तो वही करती है जो उसको दिशा निर्देश प्राप्त होता है और ये दिशा निर्देश इतने स्पष्ट और पारदर्शी होने चाहिए कि मशीन  को शब्द से लिंग, वचन और पुरुष के भेद का स्पष्ट ज्ञान प्राप्त हो सके. इसके मध्य की प्रक्रिया इतनी जटिल और पेचीदी होती है कि  कई चरणों में कई रूपों में इसको स्पष्ट करना पड़ता है ताकि हम सही अनुवाद प्राप्त कर सकें.

                           मशीन अनुवाद को सिर्फ अंग्रेजी से हिंदी में ही नहीं अपितु हिंदी से अंग्रेजी के लिए भी तैयार किया गया है. जिससे कि हम एक साहित्य की दिशा में नहीं बल्कि विज्ञान , मेडिकल, वाणिज्य आदि सभी क्षेत्रों की सामग्री को अपनी भाषा में अनुवाद कर सकें और हिंदी को समृद्ध बना सकें. अगर हिंदी जानने वाले अन्य क्षेत्रों की जानकारी प्राप्त कर उसे अपनी भाषा में चाहे तो इसके प्रयोग से ये संभव है. अन्य भारतीय भाषाओं के लिए भी हम इस को प्रयोग कर सकते हैं.

                         इसके प्रयोग के बढ़ने के साथ साथ ही इसका शब्दकोष (lexicon )  समृद्ध करना होता है क्योंकि सीमायें बढ़ाने से उसके ज्ञान और शब्द कोष भी बढ़ता जाता है. जो शब्द शब्दकोष में नहीं होंगे उनको लिप्यान्तरण के द्वारा दर्शाया जाता है. इसकी आतंरिक प्रक्रिया इतनी विस्तृत है कि उसको समझाना बहुत ही दुष्कर कार्य है. इसके लिए सरकार द्वारा अपेक्षित सहयोग मिला होता तो इसका विकसित स्वरूप कुछ और ही होता.

                       यद्यपि गूगल भी अपनी अनुवाद प्रणाली को प्रस्तुत कर चुका है और लोग इसका प्रयोग कर रहे हैं लेकिन अगर गुणवत्ता की दृष्टि से देखें तो गूगल हमारी प्रणाली के समक्ष कहीं भी नहीं ठहरता. इसका तुलनात्मक अध्ययन हमने अपने कार्य की महत्ता को दर्शाने  के लिए किया है और उसको भविष्य में होने वाले कार्यों के लिए प्रमाण स्वरूप सरकार के समक्ष भी रखा है. अपनी कुछ वैधानिक सीमाओं के चलते इसको प्रकट करना संभव नहीं है. फिर भी बहुत जल्दी अपनी सीमाओं के साथ इसके प्रयोगात्मक स्वरूप को राजभाषा के माध्यम से प्रस्तुत अवश्य करूंगी.
*ये लेख तब लिखा गया था , जब कि मैं इस परियोजना की अंग थी और अब ये बंद हो चूका है लेकिन जो कार्य उस समय किये गए उसकी साक्षी और कार्य प्रणाली को जानने वाली होने के नाते सारे  साक्ष्य और जानकारी 
वास्तविक है।

4 टिप्‍पणियां:

  1. इतनी अच्छी परियोजना क्यों बंद हुई, जबकि इसे निरंतर चलनी वाली परियोजना होनी चाहिए थी।

    जवाब देंहटाएं
  2. आपकी इस पोस्ट को आज की बुलेटिन ’राष्ट्रकवि का जन्मदिन और ब्लॉग बुलेटिन’ में शामिल किया गया है.... आपके सादर संज्ञान की प्रतीक्षा रहेगी..... आभार...

    जवाब देंहटाएं
  3. जानकारी पढ़कर अच्छा लगा। उम्मीद थी कि गूगल जैसी सर्वग्रासी कंपनियों को खांटी भारतीय मेधा उत्तर देगी, लेकिन आलेख के अंत में यह उम्मीद टूट गई। बहुत दुख हुआ। यह परियोजना क्यों बंद हुई, खुलासा कर सकें तो अच्छा।

    जवाब देंहटाएं

ये मेरा सरोकार है, इस समाज , देश और विश्व के साथ . जो मन में होता है आपसे उजागर कर देते हैं. आपकी राय , आलोचना और समालोचना मेरा मार्गदर्शन और त्रुटियों को सुधारने का सबसे बड़ा रास्ताहै.