www.hamarivani.com

गुरुवार, 31 अगस्त 2017

मशीन अनुवाद - 6

          मशीन अनुवाद का सफर कुछ अधिक लम्बा हो चुका है फिर भी बहुत कुछ शेष है. यह एक अंतहीन सफर ही तो है जिसको मैं अपने कार्यकारी समूह के साथ और विभिन्न संस्थानों  के साथ मिल कर विगत 22 वर्षों  से  करती चली आ रही हूँ. इस लम्बे सफर में मैंने जिन भाषाओं को इस मशीन अनुवाद के लिए प्रयोग किया है - वे हैं, कन्नड़, तुलुगु, मलयालम, उर्दू, पंजाबी, बंगला हिंदी  , इसके अतिरिक्त गुजराती, संस्कृत में भी इसको प्रयोग करके देखा गया है लेकिन इसको विस्तृत रूप में हमने नहीं किया है. इस सबमें हमारी स्रोत भाषा अंग्रेजी रही है और लक्ष्य भाषाएँ ऊपर अंकित कर ही दी गयीं है,.
                   इस विषय में एक सवाल ये हो सकता है कि क्या आपको ये सारी भाषाएँ आती हैं या फिर इनके बारे में पूर्ण ज्ञान है? तो इसमें मेरा उत्तर नहीं में होगा. मेरा सिर्फ अंग्रेजी और हिंदी भाषा पर ही अधिकार है. और अंग्रेजी से हिंदी अनुवाद में तो मैंने इतने वर्षों में बहुत कुछ किया और सीखा. कैसे मैं बेहतर अनुवाद और बेहतर से बेहतर शब्दों का चयन करके अनुवाद प्रस्तुत कर सकती हूँ और उसके विस्तार के लिए भी मेरा अथक प्रयास रहा है.
                  अन्य भाषाओं के सन्दर्भ में यह कहूँगी कि इसके लिए अन्य भाषाओं के भाषाविद हमारे सहयोगी रहे हैं और कुछ तो पी एच ड़ी छात्र रहे हैं जिन्होंने इसको ही अपने शोध का विषय चुना और एक नई और सार्थक दिशा में कार्य किया. इससे हमें कुछ बहुत अच्छे लाभकारी परिणाम भी मिले. कन्नड़ में मशीन अनुवाद के द्वारा जो सॉफ्टवेर तैयार किया गया वह अपने आप में सम्पूर्ण था और उसके परीक्षण के लिए हमने कन्नड़ के बहुत से लेख, कहानी और यहाँ तक कि उपन्यास भी अनुवादित करके पढ़े. उस समय उसमें पोस्ट एडिटिंग की आवश्यकता पड़ती थी क्योंकि वह हमारे प्रयास की  शैशवावस्था थी . लेकिन फिर उसके द्वारा हम को कन्नड़  साहित्य पढ़ने को मिला तो हमें लगा कि हमारे देश कि अनेकता में एकता वाली बात इससे सत्य सिद्ध हो रही है.हम सबके बारे में अधिक से अधिक जानकारी प्राप्त कर सकते हैं और अपने और उनके साहित्य और अन्य उपलब्ध विषयों की जानकारी प्राप्त करने में पूर्ण रूप से सक्षम हो सकते हैं.
                    आज जब कि हम बहुत आगे निकल चुके हैं तब हम कई भाषाओं के कार्य कर रहे हैं. सम्पूर्ण देश में तो ये मशीन अनुवाद का कार्य लगभग सभी भाषाओं में हो रहा है और इसमें सरकारी संस्थान "CDAC " जैसे संस्था भी सम्पूर्ण देश में सक्रिय है. 
                    अगर हम मशीन अनुवाद की उपयोगिता की दृष्टि से देखें तो इसका शोध की दृष्टि से सर्वाधिक उपयोग है. शोध के लिए सिर्फ एक भाषा के कार्य से ही हम अपने कार्य को सम्पूर्ण समझ लें ऐसा नहीं है. बल्कि विभिन्न क्षेत्रों में होने वाले शोध  के लिए हमें जापानी, जर्मन , फ्रेंच आदि भाषाओं के शोधों को देखने कि आवश्यक पड़ती  है तो इनको अंग्रेजी में और अंग्रेजी से भारतीय भाषाओं में अनुवादित करके देखा जा सकता है. जब हम अपने ही देश की सभी भाषाओं से अवगत नहीं है तो विदेशी भाषाओं में पारंगत होने कि बात तो सोची ही नहीं जा सकती है. यही नहीं हमारे देश में ही विभिन्न भाषाभाषी लोग अंग्रेजी भाषा में पूर्ण ज्ञान नहीं रखते हैं तो उनको इसके लिए मशीन अनुवाद के द्वारा अपनी भाषा में अनुवादित करके पढ़ने , शोध करने या फिर साहित्य में रूचि रखने वाले लोग अन्य भाषाओं के साहित्य को पढ़ सकते हैं. 
                  ग्रामीण अंचलों में अधिकांश लोग आज भी अपनी भाषा के अतिरिक्त कुछ भी नहीं जानते हैं और सिर्फ इसी कारण से वे अपने अधिकारों और सुविदाओं से अनभिज्ञ रहते हैं. ज्ञान के प्रचार प्रसार के लिए अगर कुछ केंद्र स्थापित करके इस सुविधा को वहाँ पहुँचाया जाय तो वे अपने निम्न जीवन स्तर को ऊपर उठाने के साधनों और सुविधाओं से भी अवगत होते रहेंगे. अभी अधिकांश भागों में सरकारी फरमान अंग्रेजी में ही आते हैं और वे आम लोगों कि पहुँच से बाहर होते हैं इस के लिए उनकी अपनी भाषा में अनुवादित होकर अगर उन्हें पढ़ने को मिले तो वे एक जागरुक नागरिक और सक्रिय सहभागिता के अधिकारी बन सकते हैं. राष्ट्र हित में , जन हित में इसकी भूमिका बहुत अहम् है बस आवश्यकता है की हम इसको जन समान्य की पहुँच की वस्तु बना कर प्रस्तुत कर सकें . इसके लिए सरकारी सहयोग अपेक्षित है .

मंगलवार, 22 अगस्त 2017

मशीन अनुवाद - 5


              मशीन अनुवाद सिर्फ सीधे सीधे वाक्यों के अतिरिक्त भी होता है. अगर हम किसी भी शासकीय पत्र को लें तो उसके लिखने का तरीका और उसकी शब्दावली अलग होती है. इसमें हर शब्द का एक अलग अर्थ हो सकता है. इसके लिए एक अलग शासकीय शब्दों का भण्डारण करते हैं और जब ऐसे पत्रों का अनुवाद होता है तो उसी को प्रयोग करते हैं. वैसे भी हम दैनिक जीवन में भी शासकीय शब्दावली को अलग प्रयोग में लाते हैं बल्कि सिर्फ शासकीय ही क्यों? मेडिकल , फिजिक्स , केमिस्ट्री सभी विषयों के लिए अलग शब्दावली का प्रयोग होता है.
             साधारण में हम " To " का प्रयोग परसर्ग के रूप में करते हैं और इसका अर्थ "को/से"  से लेते हैं लेकिन पत्रावली की भाषा में हम इसको "सेवा में" या "प्रति" के रूप में लेते हैं. मशीन अनुवाद में भी अगर हम पत्रों का अनुवाद करते हैं तो इसको ही प्रयोग करते  हैं.
             इसके साथ ही हम पत्र  में  यदि संक्षिप्त संकेतों का प्रयोग भी करते हैं तो उसका  विस्तृत रूप अनुवाद में प्राप्त होता है.
अंग्रेजी में हम "Ref :" ही लिखते हैं लेकिन अनुवाद करने के लिए मशीन इसको इसके पूर्ण रूप में विस्तृत करके ही अनुवाद देती है. "Ref :" का अनुवाद हमें "सन्दर्भ " ही मिलेगा कुछ और नहीं. सम्पूर्ण पत्र की भाषा को ये शासकीय भाषा में ही अनुवाद करती है.
           इससे हमें ये फायदा होता है कि कई स्थानों पर आने वाले पत्रों की भाषा और अंग्रेजी का गहन ज्ञान न रखने वाले लोगों के लिए भी ये सहज हो  जाता है कि अन्य विभागों से प्राप्त हुई सामग्री का वे अनुवाद करके ठीक से समझ सकते हैं. यहाँ भी द्विअर्थी शब्दों के लिए वही नियम प्रयोग में लाया जाता है  जैसे  कि  अगर हम शासकीय सामग्री का अनुवाद कर रहे हैं तो उसके लिए शासकीय शब्दकोष को प्रयोग करते हैं ताकि उससे अधिक विकल्प प्राप्त न हों.
                       जब हम हिंदी से अंग्रेजी में अनुवाद की बात करते हैं तो   एक प्रश्न हमसे पूछा जाता है कि क्या हमारी मशीन "गया गया गया" का सही अनुवाद दे सकती है. तो हमारा यही उत्तर होता है कि हाँ वो एकदम सही अनुवाद ही प्रस्तुत करेगी. वाक्य विन्यास के अनुसार ही अनुवाद भी होता है. इसमें प्रथम शब्द कर्ता  दूसरा कर्म और तीसरा क्रिया होगा. अतः हमें प्राप्त होने वाला अनुवाद "Gaya went to Gaya " ही होगा. यहाँ हम यह भी बता दें कि अगर कोई शब्द संज्ञा है और उसको हम व्यक्ति , स्थान और क्रिया तीनों रूपों में प्रयोग करते हैं तो भी हमारी मशीन उसको सही ढंग से प्रस्तुत कर देती है.
                       हाँ इसकी कुछ सीमायें भी हैं क्योंकि मशीन को पढ़ाने में हमने व्याकरण की शुद्धता पर भी ध्यान दिया है. इस लिए अगर हम कोई वाक्य अगर गलती से भी गलत लिख देते हैं तो वह हमें ये निर्देश देती है. " frame the sentence again " 
आज कल जो हमारी  मीडिया की भाषा हो गयी है या फिर हम जिसे fluent english कहते हैं उसमें व्याकरण की शुद्धता पर अधिक ध्यान नहीं दिया जाता है.  अगर हम कभी किसी समाचार पत्र का कोई समाचार डालकर अनुवाद चाहते हैं तो हमें इस सीमा का ध्यान रखना होता है और अगर नहीं रखते हैं तो मशीन हमको याद दिला देती है. हर मशीन की अपनी सीमा होती है. चाहे हम उससे भौतिक कार्यों के लिए प्रयोग करें या फिर सॉफ्टवेयर  जैसी  चीज को प्रयोग करें. सीमा का तो हमें हर स्थान पर ध्यान रखना ही पड़ेगा. उसको हम उसकी कमजोरी नहीं मान सकते हैं बल्कि मनुष्य अधिक त्वरित कार्य करने वाली मशीन भले मनुष्य के वर्षों के प्रयास का फल हो फिर भी वह अगर मानव भूल का शिकार है तो वह उसको शुद्ध करके हमें नहीं दे सकती है. नियमानुसार वह इस बात के लिए इंगित कर सकती है और हमारे वाक्य को फिर से विन्यास कि सलाह दे सकती है.  वह मनुष्य से  द्रुत गति से काम करके वह मनुष्य के कार्य की गति को बढ़ा ही रही है. मानव भूल जैसी बात के लिए इसमें कोई स्थान नहीं होता है क्योंकि वह जो भी हमने उसको सूचनाएं दे रखी हैं वह उन्हीं को प्रयोग करके हमें प्रदान कर देती है. 
                मशीन अनुवाद कैसे हमारे लिए दिन पर दिन उपयोगी बनता जा रहा है, इसको हम आगामी अंशों में देख सकेंगे.

बुधवार, 9 अगस्त 2017

मशीन अनुवाद - 4.

               मशीन अनुवाद की दृष्टि से हमारे अनुवाद के क्षेत्र का इतना विस्तृत दायरा है कि उसके अनुरुप इसको सक्षम बनाने  का कार्य सतत ही चलता रहेगा। हमारे दैनिक जीवन में और तमाम विषयों के अनुसार नए नए शब्दों का निर्माण होता रहता है और हम रोजमर्रा के जीवन में उनके लिए कुछ और ही प्रयोग करते हैं। आज हम संज्ञा रूपों के बारे में चर्चा करेंगे। एक संज्ञा और अनेक संज्ञाओं के संयोजन से बने शब्दों का अपना कुछ अलग ही प्रयोग होता है। संज्ञा रूप भी कई तरीके से बन जाते हैं। उनको हम सहज ही प्रयोग करें  तो उनके उस रूप को नहीं पाते हैं जिन्हें हम पत्रकारिता या फिर हिंदी के लिए उचित मानते हैं। अगर हम दो शब्दों के संज्ञा रूप की बात करें तो इनमें एक विशेषण और एक संज्ञा का मेल भी संभव है और कई बार उसकी जरूरत ही नहीं पड़ती कि हम उसको संज्ञा रूप बनायें।
अगर हम अंग्रेजी में "working " को लें तो ये क्रिया का एक रूप है और एक विशेषण भी है। इस विशेषण का प्रयोग अलग अलग संज्ञा के साथ अलग अलग भी हो सकता है।  उस स्थिति में हम या तो मशीन को सारे संयुक्त शब्दों को शब्दकोष में शामिल करके उसके खोजने के कार्य को और अधिक लम्बा कर दें या फिर उसको इस तरह  से प्रस्तुत करें कि मशीन अपने कार्य को कम समय में और सही रूप में प्रस्तुत कर सके।
उदाहरण के लिए:
working women       कामकाजी महिला
working  hours         कार्यकारी घंटे
working condition कार्य की शर्तें / चालू हालत
                प्रथम संज्ञा रूप में हम कामकाजी के सन्दर्भ में बात कर रहे हैं। दूसरे रूप में  इसका अर्थ कार्यकारी घंटे और तीसरे में हम इसको सन्दर्भ के अनुसार ही अर्थ को ले पायेंगे यानि कि अगर हम किसी मशीन के लिए बात कर रहे हैं तो working condition का अर्थ "चालू हालत" होगा और अगर किसी नौकरी या कार्य के बारे में इसको देख रहे हैं तो इसका अर्थ " कार्य की शर्तें "होगा।
कहीं हम संज्ञा समूह के अनुसार ही निर्देश देते हैं की किस श्रेणी के संज्ञा शब्द  के साथ विशेषण का कौन सा अर्थ लेना है। इसके लिए मैं पहले भी बता चुकी हूँ कि संज्ञा शब्दों को हमने विभिन्न श्रेणियों  में बाँट कर मशीन के काम को सहज बनाने का प्रयास किया है. जिससे हमें अनुवाद के बाद कम से कम संपादन के कार्य का सहारा लेना पड़े।
इसके लिए हम मशीन को working के लिए एक विशेषण के रूप में परिचय कराते  हैं और ये निर्देश भी देते हैं कि इसके बाद आने वाली संज्ञा  की श्रेणी के अनुरुप उसको विशेषण का अमुक अर्थ लेना है. और मशीन पूरी समझदारी से वही कार्य करती है. तब हमको इस तरह से शब्दों को शब्द समूह के रूप में नहीं देने होते हैं. साथ ही ये भी निर्देश होता है कि अगर इस शब्द के आगे संज्ञा है तभी इसको विशेषण बनाया जाय अन्यथा इसके क्रिया रूप में प्रयोग किया जाएगा. इसके लिए हम शब्दकोष में  कामकाजी/कार्यकारी/चालू  तीनों ही रूपों में देते हैं जिसे वह अपने निर्देशों के अनुसार ही ग्रहण करके प्रस्तुत करती है.
                     विभिन्न सन्दर्भ में हम कुछ संज्ञा रूपों  को एक पूरे पूरे शब्दों के समूह के रूप में भी देते हैं. और उनके अर्थ विशिष्ट भी होते हैं.
जैसे  कि : Commonwealth   Games अगर हम इसको विशिष्ट संज्ञा समूह का रूप नहीं देंगे तो इसका अर्थ मशीन अपने अनुसार या फिर हमारे शब्दकोष के अनुसार "सामान्य संपत्ति खेल " ले लेगी और इसी लिए इसके लिए हमें "राष्ट्र मंडल खेल" अर्थ देकर संचित करना होता है.
                    इसका एक और पक्ष अंग्रेजी में हम सभी के लिए अगर वह एकवचन है तो "इस" ही प्रयोग करते हैं और उसका अर्थ भी "है" ही होता है.
President is coming next week .  इसका सामान्य अनुवाद "राष्ट्रपति अगले सप्ताह आ रहा है." ही होगा क्योंकि अंग्रेजी में एकवचन के लिए "is " का ही प्रयोग होता है और उसका अनुवाद "है" ही होता है. लेकिन हमारी मशीन इस तरह के जो संज्ञा या संबोधन सम्माननीय  रूप में लिए जाते हैं  उनके लिए उनके अनुरुप ही शब्दों का चयन करती है क्योंकि  उसके लिए हम आम भाषा में "है" नहीं बल्कि "हैं" का प्रयोग करते हैं. यही बात यहाँ राष्ट्रपति पर भी लागू होती है. अंग्रेजी में "हैं" के लिए "are " का प्रयोग  होता है और इसके लिए उस संज्ञा का बहुवचन होना चाहिए. हमारा मशीन अनुवाद इस बात को अच्छी तरह से वाकिफ होता है कि हमें किन स्थितियों में "is " होने के बाद भी " हैं" का प्रयोग करना है और संज्ञा की श्रेणी के अनुसार ही उचित अनुवाद प्राप्त करना है. इसके अंतर्गत सभी सम्माननीय  शब्दों को लिया गया है जैसे कि माता-पिता, शिक्षक , प्रधानमंत्री या मुख्यमंत्री आदि आदि जिनके साथ हम सम्माननीय  के भाव से "हैं" का प्रयोग करते हैं.इन सम्मान सूचक शब्दों के विषय में जानकारी एक विशिष्ट फाइल बना कर दी जाती है। 

रविवार, 6 अगस्त 2017

मशीन अनुवाद -- 3

मशीन अनुवाद की प्रक्रिया जटिल ज़रूर है लेकिन उपयोग करने वाले के लिए बहुत ही सहज है. अगर हम आलोचना करने पर उतर आयें तो फिर हर चीज़ कि आलोचना की जा सकती है क्योंकि पूर्ण तो एक मनुष्य भी नहीं होता है फिर मशीन कि क्या बात करें? ये  मनुष्य  ही है जो अपने कार्य को त्वरित करने के लिए मशीन को इनता अधिक सक्षम बना रहा है. आज मैं इसके द्वारा किये जाने वाले और भी पक्ष को प्रस्तुत करने की कोशिश कर रही हूँ.
                       साधारण क्रिया को भी अगर हम लें तो हमें एक अंग्रेजी क्रिया के लिए हिंदी में कई क्रियाएं मिल  जाती  हैं   और फिर मशीन के लिए यह आवश्यक   हो  जाता  है कि  उसको  कैसे  अनुवाद करे ?
इसके लिए हम "boil " क्रिया को ले  सकते  हैं . अंग्रेजी की इस  क्रिया का  हिंदी में " उबल  " और "उबाल " दोनों  ही अर्थ  होते  हैं . जिसमें  से " उबल"  अकर्मक  क्रिया है और "उबाल"  सकर्मक . आम  अनुमान  के हिसाब  से  तो मशीन को इसके लिए कोई  भी अंतर  नहीं करना  चाहिए  क्योंकि वह  इस  बात को समझ  ही नहीं सकती  है और अगर हम उसको  अनुवाद के लिए निम्न  वाक्य  देते  हैं  --
*milk is boiling.                    दूध उबल  रहा है.
*Ram is boiling the water.     राम पानी उबाल रहा है.
                      तब  उनका  अनुवाद सही  ही आएगा  क्योंकि मशीन इस  बात  से  वाकिफ है कि उसको  किस  के लिए क्या अनुवाद लाना  है?
इसको और अधिक स्पष्ट   करने के उद्देश्य  से  हम क्रिया रूप  को भी ले  सकते   हैं  जिसके  दो  और उससे  भी अधिक अर्थ  हो  सकते  हैं  और वे  आपस  में किसी  भी तरह  से  मिलते  भी नहीं हैं .
"put on " इस क्रिया रूप  के कई अर्थ  हिंदी में होते  हैं  .
1. रखना.                Put this book on the table.    यह  किताब  मेज  पर  रखिये .
2 पहनना He put on the blue shirt.  वह  नीली  शर्ट  पहनता  है / उसने  नीली  शर्ट  पहनी .
3. लगाना.   She put the cream on her face. वह  चेहरे  पर  क्रीम  लगाती  है / उसने  चेहरे  पर  क्रीम  लगाईं .
4. चालू करना         Put on the TV.                 टीवी  चालू  करिए .
5. जलाना              Put on the tubelight.         ट्यूबलाईट  जलाइए .
इसमें हम विभिन्न वाक्यों के अनुवाद को अगर देखते हैं तो एक ही क्रिया  रूप उसको किस तरह से विभिन्न अर्थों को लेकर अनुवाद दे रहा है. अगर हम इसके लिए एक वाक्य देते हैं और उसके दो अनुवाद हमें मिल रहे हैं जैसे कि वाक्य संख्या २ एवं ३ में. इसके लिए कहना  है कि इस अंग्रेजी क्रिया के रूप काल के अनुसार बदलते नहीं है बल्कि एक ही रहते हैं तो इसके दोनों ही अनुवाद आवश्यक हैं. मशीन को किन वाक्यों में कौन सा अर्थ लेना है -- इसके लिए क्रिया में प्रयोग हो रहे संज्ञा को भी श्रेणीबद्ध करके रखा जाता है कि उसको किस क्रिया के साथ कौन सी श्रेणी की  संज्ञा मिलती है तो उसको उससे सम्बंधित अर्थ उठा कर ही अनुवाद प्रस्तुत करना है. अगर TV या रेडियो है तो उसको वह चालू करना ही लाएगा और अगर ये बल्ब या ट्यूब लाईट  है तो उसको जलाना ही लाएगा. ये मशीन अनुवाद की बारीकियां समझाने के लिए उसके आतंरिक क्रिया कलाप को समझना भी अत्यंत आवश्यक है. इस पर हम चर्चा अगले अंकों में करेंगे।

शुक्रवार, 4 अगस्त 2017

मशीन अनुवाद - 2

              मशीन अनुवाद के प्रारंभिक स्वरूप के बारे में मैं पहले बता चुकी हूँ. इसके द्वारा हम विस्तृत सोच को जन्म दे चुके हैं. जीवन के हर क्षेत्र में इसकी भूमिका तो वही है लेकिन उसके स्वरूप अलग अलग हो जाते हैं. हम एक सामान्य अनुवाद प्रणाली का प्रयोग करते हैं तो इसको अनुवाद करने वाली एक प्रणाली समझ लेते हैं लेकिन इस प्रणाली को किस स्वरूप में प्रयोग करना  आवश्यक होता  है, इस ओर भी हम दृष्टि डालेंगे. 
                हम अंग्रेजी के एक शब्द के कई अर्थ लिखते हैं और ये कई अर्थ आवश्यक नहीं है कि हम हर एक का प्रयोग हर स्थान पर कर सकें. हम एक दो शब्दों के साथ ही इस को देख सकते हैं. अगर हम अंग्रेजी के "treatment "  शब्द को लें तो सामान्य स्थिति में इसको हम इसके अर्थ "व्यवहार" को ले सकते हैं और लेते भी हैं , लेकिन अगर इसको हम चिकित्सा क्षेत्र के लिए प्रयोग कर रहे हैं तो हमें अपने अनुवाद में इसके "उपचार या चिकित्सा" अर्थ को लेना होगा. हमारी मशीन को ये नहीं पता है कि हम किस प्रकार के वाक्य का अनुवाद करने जा रहे हैं, इस लिए हमें अपनी आवश्यकता के अनुसार क्षेत्र का संकेत भी देना होता है कि वाक्य हमारे किस क्षेत्र से सम्बंधित है . तभी हम सही अनुवाद प्राप्त कर सकते हैं. 

He treated me very well .         उसने मेरे साथ बहुत अच्छा व्यवहार किया.
Doctor treated me very well .  डॉक्टर ने मेरा बहुत अच्छी तरह से इलाज किया.

                  यहाँ पर हमने एक ही क्रिया को एक ही रूप में प्रयोग किया लेकिन वाक्य की ज़रूरत के अनुसार उसके अलग-अलग अर्थ की आवश्यकता होती है और हमारा मशीन अनुवाद इसको इसके क्षेत्र के अनुसार ही अनुवादित करता है. 

यही बात हम संज्ञा के लिए भी देख सकते हैं.  "code"  संज्ञा  है और इसको हम  सामान्य अर्थ में संकेत या कूट के रूप में लेते हैं. इसका प्रयोग भी यही होता है लेकिन अगर इसी शब्द को क़ानून की भाषा में देखेंगे तो इसका अर्थ अलग होता है उस समय हम इसके अर्थ को "संहिता" के रूप में ग्रहण करते हैं. 

इसी तरह से हम  किसी एक शब्द, अंग्रेजी शब्द  को, व्याकरण के कई रूपों में देख लेते हैं. जैसे कि "back "  - ये शब्द अंग्रेजी में भी संज्ञा, क्रिया, विशेषण और क्रिया विशेषण चारों रूप में प्रयुक्त होता है और हिंदी में भी हम इसको एक शब्द होने पर ही विभिन्न स्थानों पर प्रयोग के आधार पर सही रूप में प्रस्तुत  करके ही सही अनुवाद प्रस्तुत कर सकते हैं. 

                   इस कार्य को हम बैंक, चिकित्सा, पर्यटन, क़ानून , कृषि और वाणिज्य सभी क्षेत्रों के लिए सही अर्थों में अनुवाद प्राप्त करने के लिए सक्षम बनाने का प्रयास कर रहे हैं. सबके क्षेत्रों के अनुसार शब्दावली का चयन और उनका अनुप्रयोग ही हमारे प्रयास को सार्थक सिद्ध करेगा.

गुरुवार, 3 अगस्त 2017

मशीन अनुवाद - 1


                                   हिंदी भले ही विश्व में सर्वाधिक बोली जाने वाली भाषा न हो लेकिन हिंदी भारत की प्रमुख भाषा है और भारत का प्रतिनिधित्व करने वाली एकमात्र  भाषा भी है. हम अपने देश , प्रदेश, शहर, गाँव और गली मोहल्ले  में तो इसी को सुनते हुए पले बढे हैं और इसी लिए  इसकी प्रगति , प्रचार एवं प्रसार भी हमें बहुत प्रिय है.

                                हिंदी मुझे भी प्रिय है और तभी इसके सहज और सुलभ प्रयोग के लिए चल रहे एक विशाल अभियान "मशीन अनुवाद" से मैं इसके आई आई टी में आरम्भ होने के प्रथम प्रयास १९८७ से जुड़ी और उस समय से जब कि हमारे समूह के संयुक्त प्रयासों से एक अलग रोमन का निर्माण किया ( जो आज आई आई टी कानपुर रोमन के नाम से जानी जाती है) . इस अभियान को शैश्ववास्था से लेकर आज इसके पूर्ण परिपक्व होने तक के सफर की मैं साक्षी रही हूँ और इससे निरंतर सम्बद्ध हूँ. इसको सिर्फ संगणक विज्ञान ( computer science ) और हिंदी का समागम नहीं माना जा सकता है बल्कि इसके लिए प्रबुद्धजनों ने पाणिनि की अष्टाध्यायी से लेकर तमाम व्याकरण के उद्गम शास्त्रों का अध्ययन करके इसको सही दिशा प्रदान की है. इसमें कंप्यूटर  इंजीनियर और भाषाविज्ञ दोनों की ही महत्वपूर्ण भूमिका रहती है. सबसे अधिक तो इसमें रूचि रखने वालों की भूमिका होती है.

                             इसमें मशीन तो वही करती है जो उसको दिशा निर्देश प्राप्त होता है और ये दिशा निर्देश इतने स्पष्ट और पारदर्शी होने चाहिए कि मशीन  को शब्द से लिंग, वचन और पुरुष के भेद का स्पष्ट ज्ञान प्राप्त हो सके. इसके मध्य की प्रक्रिया इतनी जटिल और पेचीदी होती है कि  कई चरणों में कई रूपों में इसको स्पष्ट करना पड़ता है ताकि हम सही अनुवाद प्राप्त कर सकें.

                           मशीन अनुवाद को सिर्फ अंग्रेजी से हिंदी में ही नहीं अपितु हिंदी से अंग्रेजी के लिए भी तैयार किया गया है. जिससे कि हम एक साहित्य की दिशा में नहीं बल्कि विज्ञान , मेडिकल, वाणिज्य आदि सभी क्षेत्रों की सामग्री को अपनी भाषा में अनुवाद कर सकें और हिंदी को समृद्ध बना सकें. अगर हिंदी जानने वाले अन्य क्षेत्रों की जानकारी प्राप्त कर उसे अपनी भाषा में चाहे तो इसके प्रयोग से ये संभव है. अन्य भारतीय भाषाओं के लिए भी हम इस को प्रयोग कर सकते हैं.

                         इसके प्रयोग के बढ़ने के साथ साथ ही इसका शब्दकोष (lexicon )  समृद्ध करना होता है क्योंकि सीमायें बढ़ाने से उसके ज्ञान और शब्द कोष भी बढ़ता जाता है. जो शब्द शब्दकोष में नहीं होंगे उनको लिप्यान्तरण के द्वारा दर्शाया जाता है. इसकी आतंरिक प्रक्रिया इतनी विस्तृत है कि उसको समझाना बहुत ही दुष्कर कार्य है. इसके लिए सरकार द्वारा अपेक्षित सहयोग मिला होता तो इसका विकसित स्वरूप कुछ और ही होता.

                       यद्यपि गूगल भी अपनी अनुवाद प्रणाली को प्रस्तुत कर चुका है और लोग इसका प्रयोग कर रहे हैं लेकिन अगर गुणवत्ता की दृष्टि से देखें तो गूगल हमारी प्रणाली के समक्ष कहीं भी नहीं ठहरता. इसका तुलनात्मक अध्ययन हमने अपने कार्य की महत्ता को दर्शाने  के लिए किया है और उसको भविष्य में होने वाले कार्यों के लिए प्रमाण स्वरूप सरकार के समक्ष भी रखा है. अपनी कुछ वैधानिक सीमाओं के चलते इसको प्रकट करना संभव नहीं है. फिर भी बहुत जल्दी अपनी सीमाओं के साथ इसके प्रयोगात्मक स्वरूप को राजभाषा के माध्यम से प्रस्तुत अवश्य करूंगी.
*ये लेख तब लिखा गया था , जब कि मैं इस परियोजना की अंग थी और अब ये बंद हो चूका है लेकिन जो कार्य उस समय किये गए उसकी साक्षी और कार्य प्रणाली को जानने वाली होने के नाते सारे  साक्ष्य और जानकारी 
वास्तविक है।