मशीनी अनुवाद के लिए कौन सी तीन बातें?

मशीनी अनुवाद का अर्थ है - मशीन या कंप्यूटर प्रणाली के माध्यम से एक भाषा से दूसरी भाषा में अनुवाद करना । अनुवाद की तीन प्रक्रियाएँ सर्वस्वीकृत हैं- विश्लेषण, अंतरण एवं पुनर्गठन | मशीनी अनुवाद में ये तीनों प्रक्रियाएँ कंप्यूटर द्वारा संपन्न होती हैं ।

मशीनरी भाषा किसका उपयोग करती है?

मशीनी भाषा (machine language) कंप्यूटर की आधारभुत भाषा है, यह केवल 0 और 1 दो अंको के प्रयोग से निर्मित शृंखला से लिखी जाती है। यह एकमात्र कंप्यूटर प्रोग्रामिंग भाषा है जो कि कंप्यूटर द्वारा सीधे-सीधे समझी जाती है। इसे किसी अनुवादक प्रोग्राम का प्रयोग नही करना होता है। इसे कंप्यूटर का मशीनी संकेत भी कहा जाता है।

मशीनी अनुवाद के लिए कौन कौन सी बातें शिक्षक है?

मशीनी अनुवाद कंप्यूटर साॅफ्टवेयर द्वारा किया जाने वाला अनुवाद है और मशीनी अनुवाद प्रणाली एक कंप्यूटर प्रोग्राम है जो इनपुट के तौर पर स्रोतभाषा का पाठ लेता है और उसका लक्ष्यभाषा के पाठ में अनूदित परिणाम (आउटपुट) देता है।.

मशीनी अनुवाद का दूसरा नाम क्या है? - masheenee anuvaad ka doosara naam kya hai?

आपके प्रश्न का उत्तर इस बात पर निर्भर करता है की आप कौन सा टेक्स्ट एडिटर या वर्ड प्रोसेसर प्रयोग कर रहे हैं। कृपया बताइए।

विषयसूची Show

इतिहास
1950 के दशक
१९७५ और उसके बाद
अनुवाद प्रक्रिया
दृष्टिकोण
नियम-आधारित
सांख्यिकीय
उदाहरण के आधार पर
हाइब्रिड एमटी
तंत्रिका एमटी
प्रमुख मुद्दों
बहुविकल्पी
गैर-मानक भाषण
नामित संस्थाएं
बहु-समानांतर स्रोतों से अनुवाद
एमटी . में ऑन्कोलॉजी
बिल्डिंग ऑन्कोलॉजी
अनुप्रयोग
मूल्यांकन
शिक्षण उपकरण के रूप में मशीनी अनुवाद का उपयोग करना
मशीनी अनुवाद और हस्ताक्षरित भाषाएँ
कॉपीराइट
यह सभी देखें
टिप्पणियाँ
मशीनी अनुवाद को क्या कहा जाता है?
मशीनी अनुवाद के लिए कौन सी तीन बातें?
मशीनरी भाषा किसका उपयोग करती है?
मशीनी अनुवाद के लिए कौन कौन सी बातें शिक्षक है?

लेकिन " — " को 'टैब' में बदलने के लिए जो प्रक्रिया है वह सभी के लिए सामान हो सकती है। अपने सोफ्टवेअयर के Find and replace को क्लिक करें। यह प्रायः Edit वाले मुख्य मेनू में रहता है। अब आपके सामने भरने के लिए एक विंडो आ जाएगी। इसके Find वाले टेक्स्ट बॉक्स में अपने कर्सर से सेलेक्ट करते हुए " — " पेस्ट कर दें (दोनों कोटेशन मार्क छोड़कर कॉपी करना है ) ।

अब Replace with वाले बक्से में आपको 'टैब' पेस्ट करना है। टैब चार या आठ स्पेस के बराबर जगह घेरने वाला अदृश्य कैरेक्टर है. इसे टाइप करने के लिए ' कैपिटल लॉक' कुंजी के ऊपर वाली कुंजी दबाना पड़ती है. लेकिन Replace with वाले बक्से में इसे दबाने से ये टाइप नहीं होगा बल्कि कुछ और होगा। इसलिए इसे कहीं और से कॉपी करके पेस्ट करना होगा।

ये रहा टैब " " (दोनों कोटेशन मार्क के बीच अदृश्य है , उसे कॉपी करके पेस्ट कर दीजिए ) . या अपने सम्पादित्र में कही पहले एक दूसरे से सटे हुए दो कोटेशन मार्क टाइप कीजिए , इस तरह "" . फिर इन दोनों के बीच में कर्सर ले जाइये और एक बार टैब कुंजी को दबा दीजिए। दोनों कोटेशन मार्क के बीच कुछ जगह बन जाएगी। इसे भी माउस से सेलेक्ट करक Replace with वाले बक्से में पेस्ट कर सकते हैं।

अंत में आपको 'रिप्लेस' या 'रिप्लेस आल' वाला बटन दबाना है। 'रिप्लेस आल' करने के पहले लोग सावधानी के तौर पर एक-दो को रिप्लेस करके देख लेते हैं कि वे जैसा चाहते हैं वैसा ही हो रहा है या नहीं। संतुष्ट होने के बाद 'रिप्लेस आल' बटन दबाते हैं।

कई सारे सम्पादित्रों में अदृश्य कैरेक्टरों को उलटा श्लैश के साथ एक कैरेक्टर लगाकर निरूपित करने की सुविधा होती है , जैसे टैब के लिए \t , लाइन फीड (नेक्स्ट लाइन ) के लिए \n आदि। लेकिन अभी इसे अभी नही करेंगे।

कंप्यूटर प्रोग्राम की सहायता से एक भाषा के पाठ का अनुवाद दूसरी भाषा में करने को यांत्रिक या मशीनी अनुवाद कहते हैं। किसी अन्य भाषा में लिखे पाठ का इसके द्वारा तुरंत अनुवाद किया जा सकता है जो सूचना तथा ज्ञान के प्रसार में अत्यंत सहायक है।

इस तरह का सबसे पहला प्रयास 1995 में आईआईटी कानपुर द्वारा किया गया था जिसने अनुसारका नामक सिस्टम से एक भारतीय भाषा का दूसरी भारतीय भाषा में अनुवाद किया।

अंग्रेज़ी से हिन्दी के लिए सी–डैक ने 1997 में मंत्र नामक पहला इंजन बनाया। बाद में कई अन्य संस्थाओं तथा व्यक्तियों ने भी अपने–अपने स्तर पर एक स्थापित मशीन अनुवाद प्रणाली बनाने के लिए प्रयास किए।

इस दिशा में किए गए प्रयासों में आंग्लभारती, अनुभारती, संपर्क आदि प्रमुख हैं। अंग्रेज़ी सहित अन्य भाषाओं से हिन्दी में मशीन अनुवाद के प्रयास अभी भी जारी हैं तथा अपेक्षित सफलता शेष है।

लोकप्रिय अनुप्रयोग निर्माता गूगल भी इसपर काफ़ी समय से कार्य कर रहा है और इसका मशीन अनुवाद बेहतर समझा जाता है। गूगल अनुवाद के संस्करण 3.0.6 ने हिन्दी और सात अन्य भारतीय भाषाओं के लिए बोलकर अनुवाद करने की सुविधा जोड़ी है।

मशीनी अनुवाद , जिसे कभी-कभी संक्षिप्त नाम एमटी [1] द्वारा संदर्भित किया जाता है ( कंप्यूटर-सहायता प्राप्त अनुवाद , मशीन-सहायता प्राप्त मानव अनुवाद या इंटरैक्टिव अनुवाद के साथ भ्रमित नहीं होना ), कम्प्यूटेशनल भाषाविज्ञान का एक उप-क्षेत्र है जो अनुवाद करने के लिए सॉफ़्टवेयर के उपयोग की जांच करता है। एक भाषा से दूसरी भाषा में पाठ या भाषण ।

बुनियादी स्तर पर, एमटी एक भाषा में शब्दों के लिए दूसरी भाषा में शब्दों का यांत्रिक प्रतिस्थापन करता है, लेकिन वह अकेले ही शायद ही कभी एक अच्छा अनुवाद पैदा करता है क्योंकि लक्ष्य भाषा में पूरे वाक्यांशों और उनके निकटतम समकक्षों की पहचान की आवश्यकता होती है। एक भाषा के सभी शब्दों में दूसरी भाषा के समान शब्द नहीं होते हैं, और कई शब्दों के एक से अधिक अर्थ होते हैं।

कॉर्पस सांख्यिकीय और तंत्रिका तकनीकों के साथ इस समस्या को हल करना एक तेजी से बढ़ता हुआ क्षेत्र है जो बेहतर अनुवाद, भाषाई टाइपोग्राफी में अंतर को संभालने , मुहावरों के अनुवाद और विसंगतियों के अलगाव के लिए अग्रणी है । [२] [ विफल सत्यापन ]

वर्तमान मशीन अनुवाद सॉफ़्टवेयर अक्सर डोमेन या पेशे (जैसे मौसम रिपोर्ट ) द्वारा अनुकूलन की अनुमति देता है , स्वीकार्य प्रतिस्थापन के दायरे को सीमित करके आउटपुट में सुधार करता है। यह तकनीक उन क्षेत्रों में विशेष रूप से प्रभावी है जहां औपचारिक या सूत्रीय भाषा का उपयोग किया जाता है। यह इस प्रकार है कि सरकारी और कानूनी दस्तावेजों का मशीनी अनुवाद बातचीत या कम मानकीकृत पाठ की तुलना में अधिक आसानी से प्रयोग करने योग्य आउटपुट उत्पन्न करता है।

मानव हस्तक्षेप से बेहतर आउटपुट गुणवत्ता भी प्राप्त की जा सकती है: उदाहरण के लिए, कुछ सिस्टम अधिक सटीक अनुवाद करने में सक्षम होते हैं यदि उपयोगकर्ता ने स्पष्ट रूप से पहचान लिया है कि पाठ में कौन से शब्द उचित नाम हैं। इन तकनीकों की सहायता से, एमटी मानव अनुवादकों की सहायता के लिए एक उपकरण के रूप में उपयोगी साबित हुआ है और बहुत सीमित मामलों में, ऐसे आउटपुट का उत्पादन भी कर सकता है जिसका उपयोग किया जा सकता है (उदाहरण के लिए, मौसम रिपोर्ट)।

मशीनी अनुवाद की प्रगति और क्षमता पर इसके इतिहास में बहुत बहस हुई है। १९५० के दशक के बाद से, कई विद्वानों ने, सबसे पहले और विशेष रूप से येहोशुआ बार-हिलेल , [३] ने उच्च गुणवत्ता के पूरी तरह से स्वचालित मशीनी अनुवाद को प्राप्त करने की संभावना पर सवाल उठाया है। [४]

इतिहास

मूल

मशीनी अनुवाद की उत्पत्ति का पता 9वीं शताब्दी के अरबी क्रिप्टोग्राफर अल-किंडी के काम से लगाया जा सकता है , जिन्होंने क्रिप्टैनालिसिस , आवृत्ति विश्लेषण , और संभाव्यता और सांख्यिकी सहित प्रणालीगत भाषा अनुवाद के लिए तकनीक विकसित की , जो आधुनिक मशीन अनुवाद में उपयोग की जाती हैं। [५] मशीनी अनुवाद का विचार बाद में १७वीं शताब्दी में सामने आया। 1629 में, रेने डेसकार्टेस ने एक सार्वभौमिक भाषा का प्रस्ताव रखा, जिसमें विभिन्न भाषाओं में समान विचार एक प्रतीक को साझा करते थे। [6]

प्राकृतिक भाषाओं के अनुवाद के लिए डिजिटल कंप्यूटर का उपयोग करने का विचार एक ही समय में रॉकफेलर फाउंडेशन में इंग्लैंड के एडी बूथ और वॉरेन वीवर द्वारा 1946 की शुरुआत में प्रस्तावित किया गया था । " 1949 में वॉरेन वीवर द्वारा लिखा गया ज्ञापन मशीनी अनुवाद के शुरुआती दिनों में शायद सबसे प्रभावशाली प्रकाशन है।" [७] [८] दूसरों ने अनुसरण किया। १९५४ में बर्कबेक कॉलेज ( लंदन विश्वविद्यालय ) में APEXC मशीन पर अंग्रेजी के फ्रेंच में अल्पविकसित अनुवाद का एक प्रदर्शन किया गया था । उस समय इस विषय पर कई पत्र प्रकाशित हुए थे, और यहां तक कि लोकप्रिय पत्रिकाओं में लेख भी (उदाहरण के लिए वायरलेस वर्ल्ड के सितंबर 1955 के अंक में क्लीव और ज़ाचारोव का एक लेख )। इसी तरह का एक आवेदन, उस समय बिर्कबेक कॉलेज में भी अग्रणी था, कंप्यूटर द्वारा ब्रेल ग्रंथों को पढ़ और लिख रहा था ।

1950 के दशक

क्षेत्र के पहले शोधकर्ता, येहोशुआ बार-हिलेल ने एमआईटी (1951) में अपना शोध शुरू किया। एक जॉर्ज टाउन विश्वविद्यालय मीट्रिक टन अनुसंधान दल, प्रोफेसर माइकल Zarechnak के नेतृत्व में पीछा किया (1951) अपने के सार्वजनिक प्रदर्शन के साथ जॉर्ज टाउन-आईबीएम प्रयोग 1954 मीट्रिक टन शोध कार्यक्रमों में प्रणाली जापान में ऊपर पॉप [9] [10] और रूस (1955), और पहला एमटी सम्मेलन लंदन (1956) में आयोजित किया गया था। [११] [१२]

डेविड जी. हेज़ ने "1957 की शुरुआत में कंप्यूटर-समर्थित भाषा प्रसंस्करण के बारे में लिखा" और " 1955 से 1968 तक रैंड में कम्प्यूटेशनल भाषाविज्ञान पर प्रोजेक्ट लीडर थे।" [13]

1960-1975

मशीन अनुवाद और कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन (1962) के रूप में शोधकर्ताओं ने क्षेत्र में शामिल होना जारी रखा और नेशनल एकेडमी ऑफ साइंसेज ने एमटी (1964) का अध्ययन करने के लिए स्वचालित भाषा प्रसंस्करण सलाहकार समिति (ALPAC) का गठन किया। हालाँकि, वास्तविक प्रगति बहुत धीमी थी, और ALPAC रिपोर्ट (1966) के बाद, जिसमें पाया गया कि दस साल का लंबा शोध उम्मीदों को पूरा करने में विफल रहा था, फंडिंग बहुत कम हो गई थी। [१४] रक्षा अनुसंधान और इंजीनियरिंग निदेशक (डीडीआर एंड ई) द्वारा १९७२ की एक रिपोर्ट के अनुसार, उस संघर्ष के दौरान सैन्य नियमावली का वियतनामी में अनुवाद करने में लोगो एमटी प्रणाली की सफलता से बड़े पैमाने पर एमटी की व्यवहार्यता को फिर से स्थापित किया गया था।

फ्रेंच टेक्सटाइल इंस्टीट्यूट ने फ्रेंच, अंग्रेजी, जर्मन और स्पेनिश (1970) से और में सार का अनुवाद करने के लिए एमटी का इस्तेमाल किया; ब्रिघम यंग यूनिवर्सिटी ने स्वचालित अनुवाद (1971) द्वारा मॉर्मन ग्रंथों का अनुवाद करने के लिए एक परियोजना शुरू की।

१९७५ और उसके बाद

सिस्ट्रान , जिसने 1960 के दशक में "अमेरिकी सरकार से अनुबंध के तहत क्षेत्र में अग्रणी" [1] का उपयोग किया था, का उपयोग ज़ेरॉक्स द्वारा तकनीकी मैनुअल (1978) का अनुवाद करने के लिए किया गया था। 1980 के दशक के उत्तरार्ध में, जैसे-जैसे कम्प्यूटेशनल शक्ति बढ़ती गई और कम खर्चीली होती गई, मशीनी अनुवाद के लिए सांख्यिकीय मॉडल में अधिक रुचि दिखाई गई । कंप्यूटर के आगमन के बाद एमटी अधिक लोकप्रिय हो गया। [१५] सिस्ट्रान की पहली कार्यान्वयन प्रणाली को १९८८ में मिनिटेल नामक फ्रांसीसी डाक सेवा की ऑनलाइन सेवा द्वारा लागू किया गया था । [१६] विभिन्न एमटी कंपनियों को भी लॉन्च किया गया, जिसमें ट्रेडोस (१९८४) भी शामिल है, जो अनुवाद स्मृति प्रौद्योगिकी (१९८९) को विकसित और बाजार में लाने वाली पहली कंपनी थी। रूसी / अंग्रेजी / जर्मन-यूक्रेनी के लिए पहली वाणिज्यिक एमटी प्रणाली खार्कोव स्टेट यूनिवर्सिटी (1991) में विकसित की गई थी।

1998 तक, "कम से कम $29.95 में" एक पीसी पर चलने के लिए "अंग्रेजी और अपनी पसंद की एक प्रमुख यूरोपीय भाषा के बीच एक दिशा में अनुवाद के लिए एक कार्यक्रम खरीद सकता है"। [1]

वेब पर एमटी की शुरुआत सिस्ट्रान ने छोटे पाठों के मुफ्त अनुवाद (1996) की पेशकश के साथ की और फिर इसे अल्टाविस्टा बेबेलफिश [1] के माध्यम से प्रदान किया, जिसने एक दिन (1997) में 500,000 अनुरोधों को पूरा किया। [१७] वेब पर दूसरी मुफ्त अनुवाद सेवा लर्नआउट एंड हॉस्पी की ग्लोबालिंक थी । [१] अटलांटिक पत्रिका ने १९९८ में लिखा था कि "सिस्ट्रान की बेबेलफिश और ग्लोबालिंक्स कॉम्प्रेंडे" ने "सक्षम प्रदर्शन" के साथ "इस पर बैंक न करें" को संभाला। [18]

फ्रांज जोसेफ ओच (Google में अनुवाद विकास के भावी प्रमुख) ने DARPA की गति MT प्रतियोगिता (2003) जीती। [१९] इस समय के दौरान और अधिक नवाचारों में MOSES, ओपन-सोर्स स्टैटिस्टिकल MT इंजन (२००७), जापान में मोबाइलों के लिए एक टेक्स्ट/एसएमएस अनुवाद सेवा (२००८), और एक मोबाइल फोन शामिल है जिसमें बिल्ट-इन स्पीच-टू-स्पीच अनुवाद है। अंग्रेजी, जापानी और चीनी (2009) के लिए कार्यक्षमता। 2012 में, Google ने घोषणा की कि Google अनुवाद एक दिन में 1 मिलियन पुस्तकों को भरने के लिए लगभग पर्याप्त पाठ का अनुवाद करता है।

अनुवाद प्रक्रिया

मानव अनुवाद प्रक्रिया को इस प्रकार वर्णित किया जा सकता है:

स्रोत पाठ के अर्थ को डिकोड करना ; तथा
लक्ष्य भाषा में इस अर्थ को फिर से कूटबद्ध करना ।

इस स्पष्ट रूप से सरल प्रक्रिया के पीछे एक जटिल संज्ञानात्मक कार्य है। स्रोत पाठ के अर्थ को उसकी संपूर्णता में डिकोड करने के लिए , अनुवादक को पाठ की सभी विशेषताओं की व्याख्या और विश्लेषण करना चाहिए, एक ऐसी प्रक्रिया जिसके लिए स्रोत भाषा के व्याकरण , शब्दार्थ , वाक्य रचना , मुहावरों आदि के गहन ज्ञान की आवश्यकता होती है । , साथ ही इसके वक्ताओं की संस्कृति। लक्ष्य भाषा में अर्थ को फिर से एन्कोड करने के लिए अनुवादक को उसी गहन ज्ञान की आवश्यकता होती है। [20]

इसमें मशीनी अनुवाद में चुनौती निहित है: एक ऐसे कंप्यूटर को कैसे प्रोग्राम किया जाए जो एक व्यक्ति के रूप में एक पाठ को "समझ" सकता है, और जो लक्ष्य भाषा में एक नया पाठ "बनाने" के लिए ऐसा लगता है जैसे कि यह किसी व्यक्ति द्वारा लिखा गया हो । जब तक 'ज्ञान आधार' द्वारा सहायता प्राप्त न हो, एमटी मूल पाठ का केवल एक सामान्य, हालांकि अपूर्ण, सन्निकटन प्रदान करता है, इसका "सार" (एक प्रक्रिया जिसे "जिसिंग" कहा जाता है) प्राप्त करना। यह कई उद्देश्यों के लिए पर्याप्त है, जिसमें मानव अनुवादक के सीमित और महंगे समय का सर्वोत्तम उपयोग करना शामिल है, जो उन मामलों के लिए आरक्षित है जिनमें कुल सटीकता अपरिहार्य है।

दृष्टिकोण

बर्नार्ड वाउक्वाइस का पिरामिड मध्यवर्ती प्रतिनिधित्व की तुलनात्मक गहराई दिखा रहा है, चरम पर अंतरभाषी मशीन अनुवाद , उसके बाद स्थानांतरण-आधारित, फिर प्रत्यक्ष अनुवाद।

मशीनी अनुवाद भाषाई नियमों के आधार पर एक विधि का उपयोग कर सकता है , जिसका अर्थ है कि शब्दों का भाषाई तरीके से अनुवाद किया जाएगा - लक्ष्य भाषा के सबसे उपयुक्त (मौखिक रूप से बोलने वाले) शब्द स्रोत भाषा के शब्दों को बदल देंगे। [ उद्धरण वांछित ]

अक्सर यह तर्क दिया जाता है कि मशीनी अनुवाद की सफलता के लिए पहले प्राकृतिक भाषा समझ की समस्या को हल करने की आवश्यकता होती है । [21]

आम तौर पर, नियम-आधारित विधियां एक पाठ को पार्स करती हैं, आमतौर पर एक मध्यस्थ, प्रतीकात्मक प्रतिनिधित्व बनाती है, जिससे लक्ष्य भाषा में पाठ उत्पन्न होता है। मध्यस्थ प्रतिनिधित्व की प्रकृति के अनुसार, एक दृष्टिकोण को इंटरलिंगुअल मशीन अनुवाद या स्थानांतरण-आधारित मशीन अनुवाद के रूप में वर्णित किया जाता है । इन विधियों में रूपात्मक , वाक्य-विन्यास और अर्थ संबंधी जानकारी और नियमों के बड़े सेट के साथ व्यापक शब्दावली की आवश्यकता होती है।

पर्याप्त डेटा को देखते हुए, मशीनी अनुवाद कार्यक्रम अक्सर एक भाषा के मूल वक्ता के लिए दूसरे देशी वक्ता द्वारा लिखी गई बातों का अनुमानित अर्थ प्राप्त करने के लिए पर्याप्त रूप से काम करते हैं । कठिनाई विशेष विधि का समर्थन करने के लिए सही प्रकार का पर्याप्त डेटा प्राप्त करना है। उदाहरण के लिए, सांख्यिकीय विधियों के काम करने के लिए आवश्यक डेटा का बड़ा बहुभाषी कोष व्याकरण-आधारित विधियों के लिए आवश्यक नहीं है। लेकिन फिर, व्याकरण के तरीकों को एक कुशल भाषाविद् की आवश्यकता होती है जो उनके द्वारा उपयोग किए जाने वाले व्याकरण को ध्यान से डिजाइन करे।

निकट से संबंधित भाषाओं के बीच अनुवाद करने के लिए, नियम-आधारित मशीनी अनुवाद के रूप में संदर्भित तकनीक का उपयोग किया जा सकता है।

नियम-आधारित

नियम-आधारित मशीन अनुवाद प्रतिमान में स्थानांतरण-आधारित मशीन अनुवाद, इंटरलिंगुअल मशीन अनुवाद और शब्दकोश-आधारित मशीन अनुवाद प्रतिमान शामिल हैं। इस प्रकार के अनुवाद का उपयोग ज्यादातर शब्दकोशों और व्याकरण कार्यक्रमों के निर्माण में किया जाता है । अन्य तरीकों के विपरीत, आरबीएमटी में स्रोत और लक्ष्य भाषाओं की भाषाविज्ञान के बारे में अधिक जानकारी शामिल है, दोनों भाषाओं के रूपात्मक और वाक्यात्मक नियमों और शब्दार्थ विश्लेषण का उपयोग करते हुए । मूल दृष्टिकोण में स्रोत भाषा के लिए एक पार्सर और एक विश्लेषक, लक्ष्य भाषा के लिए एक जनरेटर, और वास्तविक अनुवाद के लिए एक स्थानांतरण शब्दकोश का उपयोग करके इनपुट वाक्य की संरचना को आउटपुट वाक्य की संरचना के साथ जोड़ना शामिल है। आरबीएमटी का सबसे बड़ा पतन यह है कि सब कुछ स्पष्ट किया जाना चाहिए: ऑर्थोग्राफिक भिन्नता और गलत इनपुट को इसका सामना करने के लिए स्रोत भाषा विश्लेषक का हिस्सा बनाया जाना चाहिए, और अस्पष्टता के सभी उदाहरणों के लिए शाब्दिक चयन नियम लिखे जाने चाहिए। अपने आप में नए डोमेन को अपनाना इतना कठिन नहीं है, क्योंकि मूल व्याकरण सभी डोमेन में समान है, और डोमेन-विशिष्ट समायोजन शाब्दिक चयन समायोजन तक सीमित है।

स्थानांतरण-आधारित मशीनी अनुवाद

स्थानांतरण-आधारित मशीनी अनुवाद इंटरलिंगुअल मशीनी अनुवाद के समान है जिसमें यह एक मध्यवर्ती प्रतिनिधित्व से अनुवाद बनाता है जो मूल वाक्य के अर्थ का अनुकरण करता है। इंटरलिंगुअल एमटी के विपरीत, यह आंशिक रूप से अनुवाद में शामिल भाषा युग्म पर निर्भर करता है।

इंटरलिंगुअल

इंटरलिंगुअल मशीन अनुवाद नियम-आधारित मशीन-अनुवाद दृष्टिकोण का एक उदाहरण है। इस दृष्टिकोण में, स्रोत भाषा, यानी अनुवादित होने वाला पाठ, एक अंतर्भाषी भाषा में बदल जाता है, यानी एक "भाषा तटस्थ" प्रतिनिधित्व जो किसी भी भाषा से स्वतंत्र है। लक्ष्य भाषा तो से बाहर उत्पन्न होता है ईन्टरलिंगुआ । इस प्रणाली के प्रमुख लाभों में से एक यह है कि इंटरलिंगुआ अधिक मूल्यवान हो जाता है क्योंकि इसे लक्षित भाषाओं की संख्या में वृद्धि की जा सकती है। हालांकि, एकमात्र इंटरलिंगुअल मशीन ट्रांसलेशन सिस्टम जिसे व्यावसायिक स्तर पर चालू किया गया है, वह है KANT सिस्टम (Nyberg and Mitamura, 1992), जिसे कैटरपिलर टेक्निकल इंग्लिश (CTE) को अन्य भाषाओं में अनुवाद करने के लिए डिज़ाइन किया गया है।

शब्दकोश आधारित

मशीनी अनुवाद शब्दकोश प्रविष्टियों के आधार पर एक विधि का उपयोग कर सकता है , जिसका अर्थ है कि शब्दों का अनुवाद वैसे ही किया जाएगा जैसे वे एक शब्दकोश द्वारा हैं।

सांख्यिकीय

सांख्यिकीय मशीनी अनुवाद द्विभाषी टेक्स्ट कॉर्पोरा के आधार पर सांख्यिकीय विधियों का उपयोग करके अनुवाद उत्पन्न करने का प्रयास करता है , जैसे कि कैनेडियन हैन्सर्ड कॉर्पस, कनाडाई संसद का अंग्रेजी-फ़्रेंच रिकॉर्ड और यूरोपीय संसद का रिकॉर्ड, EUROPARL । जहां इस तरह के निगम उपलब्ध हैं, समान ग्रंथों का अनुवाद करके अच्छे परिणाम प्राप्त किए जा सकते हैं, लेकिन कई भाषा जोड़े के लिए ऐसे निगम अभी भी दुर्लभ हैं। पहले सांख्यिकीय मशीन अनुवाद सॉफ्टवेयर था Candide से आईबीएम । Google ने कई वर्षों तक SYSTRAN का उपयोग किया , लेकिन अक्टूबर 2007 में एक सांख्यिकीय अनुवाद पद्धति पर स्विच किया। [22] 2005 में, Google ने अपने सिस्टम को प्रशिक्षित करने के लिए संयुक्त राष्ट्र सामग्री से लगभग 200 बिलियन शब्दों का उपयोग करके अपनी आंतरिक अनुवाद क्षमताओं में सुधार किया; अनुवाद सटीकता में सुधार हुआ। [२३] Google अनुवाद और इसी तरह के सांख्यिकीय अनुवाद कार्यक्रम उन लाखों दस्तावेज़ों में पैटर्न का पता लगाकर काम करते हैं जिनका पहले मनुष्यों द्वारा अनुवाद किया गया है और निष्कर्षों के आधार पर बुद्धिमान अनुमान लगाते हैं। आम तौर पर, किसी दी गई भाषा में जितने अधिक मानव-अनुवादित दस्तावेज़ उपलब्ध होते हैं, उतनी ही अधिक संभावना है कि अनुवाद अच्छी गुणवत्ता का होगा। [२४] सांख्यिकीय मशीनी अनुवाद में नए दृष्टिकोण जैसे METIS II और PRESEMT न्यूनतम कॉर्पस आकार का उपयोग करते हैं और इसके बजाय पैटर्न पहचान के माध्यम से वाक्यात्मक संरचना की व्युत्पत्ति पर ध्यान केंद्रित करते हैं। आगे के विकास के साथ, यह सांख्यिकीय मशीन अनुवाद को एक मोनोलिंगुअल टेक्स्ट कॉर्पस से संचालित करने की अनुमति दे सकता है। [२५] एसएमटी की सबसे बड़ी गिरावट में यह बड़ी मात्रा में समानांतर ग्रंथों पर निर्भर होना, आकारिकी-समृद्ध भाषाओं के साथ इसकी समस्याएं (विशेषकर ऐसी भाषाओं में अनुवाद के साथ ), और सिंगलटन त्रुटियों को ठीक करने में इसकी अक्षमता शामिल है।

उदाहरण के आधार पर

उदाहरण के आधार पर मशीन अनुवाद (EBMT) दृष्टिकोण द्वारा प्रस्तावित किया गया माकोटो नागाओ 1984 में [26] [27] उदाहरण के आधार पर मशीन अनुवाद सादृश्य के विचार पर आधारित है। इस दृष्टिकोण में, उपयोग किया जाने वाला कोष वह होता है जिसमें वे पाठ होते हैं जिनका पहले ही अनुवाद किया जा चुका होता है। एक वाक्य को देखते हुए जिसका अनुवाद किया जाना है, इस कॉर्पस से वाक्यों का चयन किया जाता है जिनमें समान उप-संवेदी घटक होते हैं। [२८] मूल वाक्य के उप-संवेदी घटकों को लक्ष्य भाषा में अनुवाद करने के लिए समान वाक्यों का उपयोग किया जाता है, और इन वाक्यांशों को एक पूर्ण अनुवाद बनाने के लिए एक साथ रखा जाता है।

हाइब्रिड एमटी

हाइब्रिड मशीन अनुवाद (एचएमटी) सांख्यिकीय और नियम-आधारित अनुवाद पद्धतियों की ताकत का लाभ उठाता है। [२९] कई एमटी संगठन एक संकर दृष्टिकोण का दावा करते हैं जो नियमों और आंकड़ों दोनों का उपयोग करता है। दृष्टिकोण कई मायनों में भिन्न हैं:

आँकड़ों द्वारा पोस्ट-प्रोसेस किए गए नियम : नियम आधारित इंजन का उपयोग करके अनुवाद किए जाते हैं। सांख्यिकी का उपयोग नियम इंजन से आउटपुट को समायोजित/सही करने के प्रयास में किया जाता है।
नियमों द्वारा निर्देशित सांख्यिकी : सांख्यिकीय इंजन को बेहतर ढंग से निर्देशित करने के प्रयास में डेटा को पूर्व-संसाधित करने के लिए नियमों का उपयोग किया जाता है। सामान्यीकरण जैसे कार्यों को करने के लिए सांख्यिकीय आउटपुट को पोस्ट-प्रोसेस करने के लिए नियमों का भी उपयोग किया जाता है। अनुवाद करते समय इस दृष्टिकोण में बहुत अधिक शक्ति, लचीलापन और नियंत्रण होता है। यह पूर्व-अनुवाद (जैसे सामग्री और गैर-अनुवाद योग्य शर्तों का मार्कअप) और पोस्ट-ट्रांसलेशन (जैसे पोस्ट ट्रांसलेशन सुधार और समायोजन) दोनों के दौरान सामग्री को संसाधित करने के तरीके पर व्यापक नियंत्रण प्रदान करता है।

हाल ही में, न्यूरल एमटी के आगमन के साथ, हाइब्रिड मशीन अनुवाद का एक नया संस्करण उभर रहा है जो नियमों, सांख्यिकीय और तंत्रिका मशीन अनुवाद के लाभों को जोड़ता है। दृष्टिकोण नियम निर्देशित कार्यप्रवाह में पूर्व और बाद के प्रसंस्करण से लाभान्वित होने के साथ-साथ एनएमटी और एसएमटी से लाभान्वित होने की अनुमति देता है। नकारात्मक पक्ष अंतर्निहित जटिलता है जो दृष्टिकोण को केवल विशिष्ट उपयोग के मामलों के लिए उपयुक्त बनाती है।

तंत्रिका एमटी

एमटी के लिए एक गहन शिक्षण आधारित दृष्टिकोण, तंत्रिका मशीन अनुवाद ने हाल के वर्षों में तेजी से प्रगति की है, और Google ने घोषणा की है कि इसकी अनुवाद सेवाएं अब इस तकनीक का उपयोग अपने पिछले सांख्यिकीय तरीकों को प्राथमिकता में कर रही हैं। [३०] माइक्रोसॉफ्ट टीम ने 2018 में WMT-2017 ("EMNLP 2017 सेकेंड कॉन्फ्रेंस ऑन मशीन ट्रांसलेशन") पर मानव समता तक पहुंचने का दावा किया और यह एक ऐतिहासिक मील का पत्थर था। [३१] [३२] हालांकि, कई शोधकर्ता इस दावे की आलोचना कर रहे हैं और अपने प्रयोगों को फिर से चला रहे हैं, और चर्चा की है कि प्राप्त तथाकथित मानव समता वास्तविक नहीं है, और यह केवल सीमित डोमेन, भाषा जोड़े और कुछ परीक्षण पर आधारित है। सूट [३३] , उदाहरण के लिए सांख्यिकीय महत्व शक्ति की कमी [३४] एनएमटी के वास्तविक मानव समता प्रदर्शन तक पहुंचने से पहले यह अभी भी एक लंबी यात्रा है।

मुहावरेदार वाक्यांश अनुवाद, बहु-शब्द अभिव्यक्ति [३५] और कम आवृत्ति वाले शब्दों को संबोधित करने के लिए, जिन्हें ओओवी (शब्दावली से बाहर) शब्द अनुवाद भी कहा जाता है, अत्याधुनिक तंत्रिका मशीन अनुवाद में भाषा-केंद्रित भाषाई विशेषताओं का पता लगाया गया है। (एनएमटी) मॉडल। उदाहरण के लिए, चीनी चरित्र का मूलक और स्ट्रोक में अपघटन [३६] [३७] एनएमटी में बहु-शब्द अभिव्यक्तियों के अनुवाद के लिए मददगार साबित हुआ है।

प्रमुख मुद्दों

मशीनी अनुवाद कुछ गैर-समझने योग्य वाक्यांश उत्पन्न कर सकता है।

टूटी चीनी "沒有進入" बाली, इंडोनेशिया में मशीनी अनुवाद से । टूटा हुआ चीनी वाक्य ऐसा लगता है जैसे "कोई प्रविष्टि मौजूद नहीं है" या "अभी तक प्रवेश नहीं किया है"

बहुविकल्पी

जब किसी शब्द के एक से अधिक अर्थ हो सकते हैं, तो शब्द-बोध का एक उपयुक्त अनुवाद खोजने से संबंधित है। यह समस्या पहली बार 1950 के दशक में येहोशुआ बार-हिलेल द्वारा उठाई गई थी । [३८] उन्होंने बताया कि "सार्वभौमिक विश्वकोश" के बिना, एक मशीन कभी भी एक शब्द के दो अर्थों के बीच अंतर करने में सक्षम नहीं होगी। [३९] आज इस समस्या को दूर करने के लिए कई तरीके तैयार किए गए हैं। उन्हें लगभग "उथले" दृष्टिकोण और "गहरे" दृष्टिकोणों में विभाजित किया जा सकता है।

उथले दृष्टिकोण पाठ का कोई ज्ञान नहीं मानते हैं। वे अस्पष्ट शब्द के आस-पास के शब्दों के लिए केवल सांख्यिकीय विधियों को लागू करते हैं। गहरे दृष्टिकोण शब्द के व्यापक ज्ञान का अनुमान लगाते हैं। अब तक, उथले दृष्टिकोण अधिक सफल रहे हैं। [40]

संयुक्त राष्ट्र और विश्व स्वास्थ्य संगठन के लिए लंबे समय तक अनुवादक रहे क्लॉड पिरोन ने लिखा है कि मशीनी अनुवाद, अनुवादक के काम के आसान हिस्से को स्वचालित करता है; कठिन और अधिक समय लेने वाली हिस्सा आम तौर पर हल करने के लिए व्यापक अनुसंधान कर रही शामिल है अस्पष्टता में स्रोत पाठ , जो व्याकरण और शाब्दिक की बाध्यताओं लक्ष्य भाषा से हल किया जा करने की आवश्यकता है:

एक अनुवादक को पाँच पृष्ठों का अनुवाद करने के लिए पूरे कार्यदिवस की आवश्यकता क्यों होती है, न कि एक या दो घंटे की? ..... औसत पाठ का लगभग 90% इन साधारण स्थितियों से मेल खाता है। लेकिन दुर्भाग्य से, अन्य 10% है। यह वह हिस्सा है जिसके लिए छह [अधिक] घंटे काम की आवश्यकता होती है। ऐसी अस्पष्टताएं हैं जिन्हें हल करना है। उदाहरण के लिए, स्रोत पाठ के लेखक, एक ऑस्ट्रेलियाई चिकित्सक ने एक महामारी के उदाहरण का हवाला दिया जिसे द्वितीय विश्व युद्ध के दौरान "युद्ध शिविर के जापानी कैदियों" में घोषित किया गया था। क्या वह जापानी कैदियों के साथ एक अमेरिकी शिविर या अमेरिकी कैदियों के साथ एक जापानी शिविर के बारे में बात कर रहा था? अंग्रेजों की दो इंद्रियां हैं। इसलिए शोध करना आवश्यक है, शायद ऑस्ट्रेलिया को एक फोन कॉल की सीमा तक। [41]

आदर्श गहन दृष्टिकोण के लिए अनुवाद सॉफ़्टवेयर की आवश्यकता होगी कि वह इस प्रकार की अस्पष्टता के लिए आवश्यक सभी शोध स्वयं ही करे; लेकिन इसके लिए एआई की उच्च डिग्री की आवश्यकता होगी जो अभी तक प्राप्त नहीं हुई है। एक उथला दृष्टिकोण जो अस्पष्ट अंग्रेजी वाक्यांश के अर्थ में अनुमान लगाया गया है कि पिरोन का उल्लेख है (आधारित, शायद, किस तरह के कैदी-ऑफ-युद्ध शिविर का उल्लेख अक्सर किसी दिए गए कॉर्पस में किया जाता है) के पास गलत अनुमान लगाने का उचित मौका होगा अक्सर। एक उथला दृष्टिकोण जिसमें "उपयोगकर्ता से प्रत्येक अस्पष्टता के बारे में पूछें" शामिल है, पिरोन के अनुमान के अनुसार, केवल एक पेशेवर अनुवादक की नौकरी का लगभग 25% स्वचालित होगा, जिससे मानव द्वारा अभी भी 75% कठिन काम करना बाकी है।

गैर-मानक भाषण

एमटी के प्रमुख नुकसानों में से एक मानक भाषा के समान सटीकता के साथ गैर-मानक भाषा का अनुवाद करने में असमर्थता है। अनुमानी या सांख्यिकीय आधारित एमटी भाषा के मानक रूप में विभिन्न स्रोतों से इनपुट लेता है। नियम-आधारित अनुवाद, स्वभाव से, सामान्य गैर-मानक उपयोगों को शामिल नहीं करता है। यह किसी स्थानीय स्रोत से या बोलचाल की भाषा में अनुवाद में त्रुटियों का कारण बनता है। आकस्मिक भाषण से अनुवाद पर सीमाएं मोबाइल उपकरणों में मशीनी अनुवाद के उपयोग में समस्याएं पेश करती हैं।

नामित संस्थाएं

में सूचना निष्कर्षण जार्ज वाशिंगटन, शिकागो, माइक्रोसॉफ्ट: नाम संस्थाओं, एक संकीर्ण अर्थ में, ठोस या अमूर्त संस्थाओं के लिए असली दुनिया में ऐसे लोगों, संगठनों, कंपनियों, और स्थानों एक उचित नाम है के रूप में देखें। यह 1 जुलाई 2011, $500 जैसे समय, स्थान और मात्रा के भावों को भी संदर्भित करता है।

वाक्य में "स्मिथ फैब्रियोनिक्स का अध्यक्ष है" स्मिथ और फैब्रियोनिक्स दोनों को संस्थाओं का नाम दिया गया है, और इसे पहले नाम या अन्य जानकारी के माध्यम से आगे योग्य बनाया जा सकता है; "अध्यक्ष" नहीं है, क्योंकि स्मिथ पहले फैब्रियोनिक्स में एक और पद धारण कर सकते थे, जैसे उपाध्यक्ष। कठोर डिज़ाइनर शब्द सांख्यिकीय मशीन अनुवाद में विश्लेषण के लिए इन उपयोगों को परिभाषित करता है।

नामांकित निकायों को पहले पाठ में पहचाना जाना चाहिए; यदि नहीं, तो उनका गलती से सामान्य संज्ञा के रूप में अनुवाद किया जा सकता है, जो संभवतः अनुवाद की BLEU रेटिंग को प्रभावित नहीं करेगा, लेकिन पाठ की मानवीय पठनीयता को बदल देगा। [४२] उन्हें आउटपुट अनुवाद से हटाया जा सकता है, जिसका पाठ की पठनीयता और संदेश पर भी प्रभाव पड़ेगा।

लिप्यंतरण में लक्ष्य भाषा में उन अक्षरों को खोजना शामिल है जो स्रोत भाषा में नाम के सबसे निकट से मेल खाते हैं। हालाँकि, इसे कभी-कभी अनुवाद की गुणवत्ता को बिगड़ने के रूप में उद्धृत किया गया है। [४३] "दक्षिणी कैलिफोर्निया" के लिए पहले शब्द का सीधे अनुवाद किया जाना चाहिए, जबकि दूसरे शब्द का लिप्यंतरण किया जाना चाहिए। मशीनें अक्सर दोनों का लिप्यंतरण करती हैं क्योंकि वे उन्हें एक इकाई के रूप में मानते हैं। मशीनी अनुवादकों के लिए इस तरह के शब्दों को प्रोसेस करना मुश्किल है, यहां तक कि लिप्यंतरण घटक वाले भी।

"अनुवाद न करें" सूची का उपयोग, जिसका एक ही अंतिम लक्ष्य है - अनुवाद के विपरीत लिप्यंतरण। [४४] अभी भी नामित संस्थाओं की सही पहचान पर निर्भर है।

तीसरा दृष्टिकोण वर्ग-आधारित मॉडल है। नामित संस्थाओं को उनके "वर्ग" का प्रतिनिधित्व करने के लिए एक टोकन से बदल दिया जाता है; "टेड" और "एरिका" दोनों को "व्यक्ति" वर्ग टोकन से बदल दिया जाएगा। फिर व्यक्तिगत रूप से "टेड" और "एरिका" के वितरण को देखने के बजाय, सामान्य रूप से व्यक्ति के नामों के सांख्यिकीय वितरण और उपयोग का विश्लेषण किया जा सकता है, ताकि किसी विशिष्ट भाषा में दिए गए नाम की संभावना निर्दिष्ट संभावना को प्रभावित न करे। एक अनुवाद का। अनुवाद के इस क्षेत्र में सुधार पर स्टैनफोर्ड द्वारा किए गए एक अध्ययन से उदाहरण मिलता है कि विभिन्न संभावनाओं को "डेविड इज गोइंग फॉर वॉक" और "अंकित इज गोइंग फॉर वॉक" अंग्रेजी के लिए लक्ष्य भाषा के रूप में अलग-अलग घटनाओं के कारण असाइन किया जाएगा। प्रशिक्षण डेटा में प्रत्येक नाम के लिए। स्टैनफोर्ड (और नामित मान्यता अनुवाद को बेहतर बनाने के अन्य प्रयास) द्वारा एक ही अध्ययन का एक निराशाजनक परिणाम यह है कि कई बार, अनुवाद के लिए BLEU स्कोर में कमी नामित इकाई अनुवाद के तरीकों को शामिल करने के परिणामस्वरूप होगी। [44]

"दूध के साथ चाय पीना" बनाम "मौली के साथ चाय पीना" वाक्यांश कुछ हद तक संबंधित हैं।

बहु-समानांतर स्रोतों से अनुवाद

मल्टीपैरेलल कॉरपोरा के उपयोग में कुछ काम किया गया है , जो कि पाठ का एक निकाय है जिसका 3 या अधिक भाषाओं में अनुवाद किया गया है। इन विधियों का उपयोग करते हुए, एक पाठ जिसका 2 या अधिक भाषाओं में अनुवाद किया गया है, का उपयोग संयोजन में तीसरी भाषा में अधिक सटीक अनुवाद प्रदान करने के लिए किया जा सकता है, यदि उन स्रोत भाषाओं में से केवल एक का अकेले उपयोग किया गया था। [45] [46] [47]

एमटी . में ऑन्कोलॉजी

एक ऑन्कोलॉजी ज्ञान का एक औपचारिक प्रतिनिधित्व है जिसमें एक डोमेन में अवधारणाएं (जैसे वस्तुएं, प्रक्रियाएं आदि) और उनके बीच कुछ संबंध शामिल हैं। यदि संग्रहीत जानकारी भाषाई प्रकृति की है, तो कोई एक शब्दकोष की बात कर सकता है। [48] में NLP , ontologies मशीन अनुवाद प्रणालियों के लिए ज्ञान का एक स्रोत के रूप में इस्तेमाल किया जा सकता। एक बड़े ज्ञान आधार तक पहुंच के साथ, सिस्टम को कई (विशेष रूप से शाब्दिक) अस्पष्टताओं को स्वयं हल करने के लिए सक्षम किया जा सकता है। निम्नलिखित क्लासिक उदाहरणों में, मनुष्य के रूप में, हम संदर्भ के अनुसार पूर्वसर्गिक वाक्यांश की व्याख्या करने में सक्षम हैं क्योंकि हम अपने विश्व ज्ञान का उपयोग करते हैं, जो हमारे शब्दकोष में संग्रहीत है:

"मैंने माइक्रोस्कोप/टेलीस्कोप/दूरबीन के साथ एक आदमी/तारा/अणु देखा।" [48]

एक मशीनी अनुवाद प्रणाली शुरू में अर्थों के बीच अंतर करने में सक्षम नहीं होगी क्योंकि वाक्यविन्यास नहीं बदलता है। हालांकि, ज्ञान के स्रोत के रूप में काफी बड़े ऑन्कोलॉजी के साथ, एक विशिष्ट संदर्भ में अस्पष्ट शब्दों की संभावित व्याख्याओं को कम किया जा सकता है। एनएलपी के भीतर ऑन्कोलॉजी के उपयोग के अन्य क्षेत्रों में सूचना पुनर्प्राप्ति , सूचना निष्कर्षण और पाठ सारांश शामिल हैं । [48]

बिल्डिंग ऑन्कोलॉजी

1993 में PANGLOSS ज्ञान-आधारित मशीन अनुवाद प्रणाली के लिए उत्पन्न ऑन्कोलॉजी एक उदाहरण के रूप में काम कर सकती है कि NLP उद्देश्यों के लिए एक ऑन्कोलॉजी कैसे संकलित की जा सकती है: [49]

मशीन अनुवाद प्रणाली के सक्रिय मॉड्यूल में पार्सिंग में मदद करने के लिए बड़े पैमाने पर ऑन्कोलॉजी आवश्यक है।
PANGLOSS उदाहरण में, लगभग 50,000 नोड्स को ऑटोलॉजी के छोटे, मैन्युअल रूप से निर्मित ऊपरी (सार) क्षेत्र के तहत सम्मिलित करने का इरादा था । अपने आकार के कारण, इसे स्वचालित रूप से बनाना पड़ा।
लक्ष्य दो संसाधनों एलडीओसीई ऑनलाइन और वर्डनेट को दोनों के लाभों को संयोजित करने के लिए मर्ज करना था : लॉन्गमैन से संक्षिप्त परिभाषाएं, और वर्डनेट से ऑटोलॉजी के अर्ध-स्वचालित वर्गीकरण के लिए अर्थपूर्ण संबंध।
- दो ऑनलाइन संसाधनों के बीच अस्पष्ट शब्दों के सही अर्थों को स्वचालित रूप से मर्ज करने के लिए एक परिभाषा मिलान एल्गोरिथ्म बनाया गया था, उन शब्दों के आधार पर जो उन अर्थों की परिभाषाएँ LDOCE और WordNet में समान हैं। एक समानता मैट्रिक्स का उपयोग करते हुए , एल्गोरिथ्म एक आत्मविश्वास कारक सहित अर्थों के बीच मेल खाता है। हालाँकि, अकेले यह एल्गोरिथम अपने आप सभी अर्थों से सही ढंग से मेल नहीं खाता।
- इसलिए एक दूसरा पदानुक्रम मिलान एल्गोरिथम बनाया गया था जो वर्डनेट (गहरी पदानुक्रम) और आंशिक रूप से एलडीओसीई (फ्लैट पदानुक्रम) में पाए जाने वाले टैक्सोनोमिक पदानुक्रमों का उपयोग करता है। यह पहले असंदिग्ध अर्थों का मिलान करके काम करता है, फिर खोज स्थान को केवल संबंधित पूर्वजों और उन मिलान अर्थों के वंशजों तक सीमित कर देता है। इस प्रकार, एल्गोरिथ्म स्थानीय रूप से असंदिग्ध अर्थों से मेल खाता है (उदाहरण के लिए, जबकि सील शब्द अस्पष्ट है, पशु उपश्रेणी में "सील" का केवल एक अर्थ है )।
दोनों एल्गोरिदम एक दूसरे के पूरक थे और मशीन अनुवाद प्रणाली के लिए बड़े पैमाने पर ऑन्कोलॉजी के निर्माण में मदद करते थे। वर्डनेट पदानुक्रम, एलडीओसीई की मिलान परिभाषाओं के साथ, ऑन्कोलॉजी के ऊपरी क्षेत्र के अधीन थे । परिणामस्वरूप, PANGLOSS MT प्रणाली इस ज्ञान आधार का उपयोग करने में सक्षम थी, मुख्यतः इसके उत्पादन तत्व में।

अनुप्रयोग

जबकि कोई भी प्रणाली अप्रतिबंधित पाठ के पूरी तरह से स्वचालित उच्च-गुणवत्ता वाले मशीनी अनुवाद की पवित्र कब्र प्रदान नहीं करती है, कई पूरी तरह से स्वचालित सिस्टम उचित आउटपुट का उत्पादन करते हैं। [५०] [५१] [५२] यदि डोमेन को प्रतिबंधित और नियंत्रित किया जाए तो मशीनी अनुवाद की गुणवत्ता में काफी सुधार होता है। [53]

अपनी अंतर्निहित सीमाओं के बावजूद, दुनिया भर में एमटी कार्यक्रमों का उपयोग किया जाता है। संभवतः सबसे बड़ा संस्थागत उपयोगकर्ता यूरोपीय आयोग है ।

मोल्टो परियोजना, उदाहरण के लिए, गोथेनबर्ग विश्वविद्यालय द्वारा समन्वित,एक विश्वसनीय अनुवाद उपकरण बनाने के लिए यूरोपीय संघ से 2.375 मिलियन यूरो से अधिक परियोजना समर्थन प्राप्त किया, जो यूरोपीय संघ की अधिकांश भाषाओं को कवर करता है। [५४] एमटी सिस्टम का आगे विकास ऐसे समय में हुआ है जब मानव अनुवाद में बजट में कटौती से विश्वसनीय एमटी कार्यक्रमों पर यूरोपीय संघ की निर्भरता बढ़ सकती है। [५५] यूरोपीय आयोग ने पिछले नियम-आधारित मशीन अनुवाद प्रणाली को बदलने के लिए यूरोपीय संघ की प्रशासनिक आवश्यकताओं के अनुरूप एक सांख्यिकीय मशीन अनुवाद कार्यक्रम एमटी@ईसी के निर्माण के लिए ३.०७२ मिलियन यूरो (अपने आईएसए कार्यक्रम के माध्यम से) का योगदान दिया। [56]

2005 में, Google ने दावा किया कि एक मालिकाना सांख्यिकीय मशीन अनुवाद इंजन का उपयोग करके आशाजनक परिणाम प्राप्त किए गए थे। [५७] अरबी भाषा के लिए Google भाषा टूल में प्रयुक्त सांख्यिकीय अनुवाद इंजन <-> अंग्रेजी और चीनी <-> अंग्रेजी का कुल स्कोर ०.४२८१ था, जो आयोजित परीक्षणों में आईबीएम के बीएलईयू-४ स्कोर ०.३९५४ (ग्रीष्मकालीन २००६) से अधिक था। राष्ट्रीय मानक और प्रौद्योगिकी संस्थान द्वारा। [५८] [५९] [६०]

हाल ही में आतंकवाद पर ध्यान केंद्रित करने के साथ, संयुक्त राज्य में सैन्य स्रोत प्राकृतिक भाषा इंजीनियरिंग में महत्वपूर्ण मात्रा में निवेश कर रहे हैं। इन-क्यू-टेल [६१] ( निजी क्षेत्र के उद्यमियों के माध्यम से नई प्रौद्योगिकियों को प्रोत्साहित करने के लिए बड़े पैमाने पर यूएस इंटेलिजेंस कम्युनिटी द्वारा वित्त पोषित एक उद्यम पूंजी कोष) ने लैंग्वेज वीवर जैसी कंपनियों को लाया । वर्तमान में सैन्य समुदाय अरबी , पश्तो और दारी जैसी भाषाओं के अनुवाद और प्रसंस्करण में रुचि रखता है । [ उद्धरण वांछित ] इन भाषाओं के भीतर, मोबाइल फोन ऐप के उपयोग के माध्यम से प्रमुख वाक्यांशों और सैन्य सदस्यों और नागरिकों के बीच त्वरित संचार पर ध्यान केंद्रित किया जाता है। [६२] DARPA में सूचना प्रसंस्करण प्रौद्योगिकी कार्यालय TIDES और बाबुल अनुवादक जैसे कार्यक्रमों की मेजबानी करता है । अमेरिकी वायु सेना ने भाषा अनुवाद तकनीक विकसित करने के लिए $ 1 मिलियन का अनुबंध दिया है। [63]

हाल के वर्षों में वेब पर सोशल नेटवर्किंग की उल्लेखनीय वृद्धि ने मशीन अनुवाद सॉफ़्टवेयर के अनुप्रयोग के लिए एक और जगह बनाई है - फेसबुक जैसी उपयोगिताओं में, या स्काइप, GoogleTalk, एमएसएन मैसेंजर इत्यादि जैसे त्वरित संदेश क्लाइंट - उपयोगकर्ताओं को बोलने की इजाजत देता है एक दूसरे के साथ संवाद करने के लिए विभिन्न भाषाएं। मोबाइल टेलीफोन, पॉकेट पीसी, पीडीए आदि सहित अधिकांश मोबाइल उपकरणों के लिए मशीनी अनुवाद एप्लिकेशन भी जारी किए गए हैं। उनकी पोर्टेबिलिटी के कारण, ऐसे उपकरणों को मोबाइल अनुवाद उपकरण के रूप में नामित किया गया है, जो विभिन्न भाषा बोलने वाले भागीदारों के बीच मोबाइल व्यापार नेटवर्किंग को सक्षम बनाता है, या मानव अनुवादक की मध्यस्थता की आवश्यकता के बिना विदेशी भाषा सीखने और विदेश यात्रा के लिए बेहिसाब यात्रा दोनों की सुविधा प्रदान करना।

संयुक्त राज्य सरकार द्वारा एक साथ रखी गई स्वचालित भाषा प्रसंस्करण सलाहकार समिति द्वारा १९६६ में मानव अनुवाद के लिए एक अयोग्य प्रतियोगी के रूप में लेबल किए जाने के बावजूद, [६४] मशीनी अनुवाद की गुणवत्ता में अब इस स्तर तक सुधार किया गया है कि ऑनलाइन सहयोग में इसका अनुप्रयोग और चिकित्सा क्षेत्र की जांच की जा रही है। चिकित्सा सेटिंग्स में इस तकनीक का अनुप्रयोग जहां मानव अनुवादक अनुपस्थित हैं, अनुसंधान का एक अन्य विषय है, लेकिन चिकित्सा निदान में सटीक अनुवाद के महत्व के कारण कठिनाइयां उत्पन्न होती हैं। [65]

मूल्यांकन

मशीनी अनुवाद प्रणाली के मूल्यांकन के तरीके को प्रभावित करने वाले कई कारक हैं। इन कारकों में अनुवाद का इच्छित उपयोग, मशीनी अनुवाद सॉफ़्टवेयर की प्रकृति और अनुवाद प्रक्रिया की प्रकृति शामिल है।

विभिन्न उद्देश्यों के लिए विभिन्न कार्यक्रम अच्छी तरह से काम कर सकते हैं। उदाहरण के लिए, सांख्यिकीय मशीन अनुवाद (एसएमटी) आमतौर पर उदाहरण-आधारित मशीन अनुवाद (ईबीएमटी) से बेहतर प्रदर्शन करता है, लेकिन शोधकर्ताओं ने पाया कि अंग्रेजी से फ्रेंच अनुवाद का मूल्यांकन करते समय, ईबीएमटी बेहतर प्रदर्शन करता है। [६६] यही अवधारणा तकनीकी दस्तावेजों के लिए भी लागू होती है, जिसका एसएमटी द्वारा उनकी औपचारिक भाषा के कारण अधिक आसानी से अनुवाद किया जा सकता है।

हालांकि, कुछ अनुप्रयोगों में, उदाहरण के लिए, नियंत्रित भाषा में लिखे गए उत्पाद विवरण , एक शब्दकोश-आधारित मशीन-अनुवाद प्रणाली ने संतोषजनक अनुवाद तैयार किए हैं जिनके लिए गुणवत्ता निरीक्षण के अलावा किसी मानवीय हस्तक्षेप की आवश्यकता नहीं है। [67]

मशीनी अनुवाद प्रणालियों की आउटपुट गुणवत्ता का मूल्यांकन करने के लिए विभिन्न साधन हैं। अनुवाद की गुणवत्ता का आकलन करने के लिए मानव न्यायाधीशों [68] का उपयोग सबसे पुराना है । भले ही मानव मूल्यांकन समय लेने वाला है, फिर भी यह नियम-आधारित और सांख्यिकीय प्रणालियों जैसे विभिन्न प्रणालियों की तुलना करने के लिए सबसे विश्वसनीय तरीका है। [६९] मूल्यांकन के स्वचालित साधनों में BLEU , NIST , METEOR , और LEPOR शामिल हैं । [70]

असंपादित मशीनी अनुवाद पर विशेष रूप से भरोसा करने से इस तथ्य की उपेक्षा होती है कि मानव भाषा में संचार संदर्भ-अंतर्निहित है और यह कि एक व्यक्ति को मूल पाठ के संदर्भ को उचित संभावना के साथ समझने की आवश्यकता होती है। यह निश्चित रूप से सच है कि विशुद्ध रूप से मानव-जनित अनुवादों में भी त्रुटि की संभावना होती है। इसलिए, यह सुनिश्चित करने के लिए कि मशीन द्वारा निर्मित अनुवाद मानव के लिए उपयोगी होगा और प्रकाशन योग्य गुणवत्ता वाला अनुवाद प्राप्त किया जाता है, ऐसे अनुवादों की समीक्षा और संपादन मानव द्वारा किया जाना चाहिए। [७१] स्वर्गीय क्लॉड पिरोन ने लिखा है कि मशीनी अनुवाद, अनुवादक के काम के आसान हिस्से को अपने सबसे अच्छे रूप में स्वचालित करता है; कठिन और अधिक समय लेने वाले हिस्से में आमतौर पर स्रोत पाठ में अस्पष्टताओं को हल करने के लिए व्यापक शोध करना शामिल होता है , जिसे लक्षित भाषा की व्याकरणिक और शाब्दिक आवश्यकताओं को हल करने की आवश्यकता होती है। मशीन-अनुवाद सॉफ़्टवेयर के लिए इनपुट प्रदान करने के लिए आवश्यक पूर्व-संपादन के लिए ऐसा शोध एक आवश्यक प्रस्तावना है ताकि आउटपुट अर्थहीन न हो । [72]

असंबद्धता की समस्याओं के अलावा, मशीन अनुवाद कार्यक्रमों के लिए प्रशिक्षण डेटा के विभिन्न स्तरों के कारण घटी हुई सटीकता हो सकती है। उदाहरण-आधारित और सांख्यिकीय मशीनी अनुवाद दोनों अनुवाद के आधार के रूप में वास्तविक उदाहरण वाक्यों की एक विशाल सरणी पर निर्भर करते हैं, और जब बहुत अधिक या बहुत कम वाक्यों का विश्लेषण किया जाता है तो सटीकता खतरे में पड़ जाती है। शोधकर्ताओं ने पाया कि जब एक प्रोग्राम को 203,529 वाक्य युग्मों पर प्रशिक्षित किया जाता है, तो सटीकता वास्तव में कम हो जाती है। [६६] प्रशिक्षण डेटा का इष्टतम स्तर केवल १००,००० वाक्यों से अधिक प्रतीत होता है, संभवतः क्योंकि जैसे-जैसे प्रशिक्षण डेटा बढ़ता है, संभावित वाक्यों की संख्या बढ़ती जाती है, जिससे सटीक अनुवाद मिलान खोजना कठिन हो जाता है।

शिक्षण उपकरण के रूप में मशीनी अनुवाद का उपयोग करना

हालांकि मशीनी अनुवाद की सटीकता के बारे में चिंताएं हैं, मैनचेस्टर विश्वविद्यालय के डॉ एना नीनो ने कक्षा में मशीनी अनुवाद के उपयोग के कुछ लाभों पर शोध किया है। ऐसी ही एक शैक्षणिक पद्धति को "MT as a Bad Model" का प्रयोग करना कहा जाता है। [७३] एक खराब मॉडल के रूप में एमटी भाषा सीखने वाले को अनुवाद की विसंगतियों या गलत पहलुओं की पहचान करने के लिए मजबूर करता है; बदले में, व्यक्ति (उम्मीद है) के पास भाषा की बेहतर समझ होगी। डॉ. नीनो बताते हैं कि यह शिक्षण उपकरण 1980 के दशक के अंत में लागू किया गया था। विभिन्न सेमेस्टर के अंत में, डॉ नीनो उन छात्रों से सर्वेक्षण के परिणाम प्राप्त करने में सक्षम थे, जिन्होंने एमटी को एक खराब मॉडल (साथ ही अन्य मॉडल) के रूप में इस्तेमाल किया था। भारी रूप से, छात्रों ने महसूस किया कि उन्होंने बेहतर समझ, शाब्दिक पुनर्प्राप्ति और वृद्धि हुई है। अपनी लक्षित भाषा में विश्वास। [73]

मशीनी अनुवाद और हस्ताक्षरित भाषाएँ

2000 के दशक की शुरुआत में, बोली जाने वाली और हस्ताक्षरित भाषाओं के बीच मशीनी अनुवाद के विकल्प गंभीर रूप से सीमित थे। यह एक आम धारणा थी कि बधिर व्यक्ति पारंपरिक अनुवादकों का उपयोग कर सकते हैं। हालांकि, हस्ताक्षरित भाषाओं की तुलना में बोली जाने वाली भाषाओं में तनाव, स्वर, पिच और समय को बहुत अलग तरीके से व्यक्त किया जाता है। इसलिए, एक बधिर व्यक्ति बोली जाने वाली भाषा पर आधारित लिखित पाठ के अर्थ के बारे में गलत व्याख्या या भ्रमित हो सकता है। [74]

शोधकर्ता झाओ, एट अल। (2000) ने टीम नामक एक प्रोटोटाइप विकसित किया (मशीन द्वारा अंग्रेजी से एएसएल में अनुवाद) जिसने अंग्रेजी से अमेरिकी सांकेतिक भाषा (एएसएल) अनुवादों को पूरा किया। कार्यक्रम पहले अंग्रेजी पाठ के वाक्यात्मक, व्याकरणिक और रूपात्मक पहलुओं का विश्लेषण करेगा। इस कदम के बाद, प्रोग्राम ने एक साइन सिंथेसाइज़र का उपयोग किया, जो एएसएल के लिए एक शब्दकोश के रूप में कार्य करता था। इस सिंथेसाइज़र ने एएसएल संकेतों को पूरा करने के साथ-साथ इन संकेतों के अर्थों को पूरा करने के लिए प्रक्रिया का पालन किया। एक बार जब पूरे पाठ का विश्लेषण किया जाता है और अनुवाद को पूरा करने के लिए आवश्यक संकेत सिंथेसाइज़र में स्थित होते हैं, तो एक कंप्यूटर जनित मानव दिखाई देता है और उपयोगकर्ता को अंग्रेजी पाठ पर हस्ताक्षर करने के लिए एएसएल का उपयोग करेगा। [74]

कॉपीराइट

केवल काम करता है कि कर रहे हैं मूल के अधीन हैं कॉपीराइट तो कुछ विद्वानों का दावा है कि मशीन अनुवाद परिणाम कॉपीराइट संरक्षण के हकदार नहीं हैं क्योंकि मीट्रिक टन शामिल नहीं है, सुरक्षा रचनात्मकता । [७५] इस मुद्दे पर कॉपीराइट एक व्युत्पन्न कार्य के लिए है ; मूल भाषा में मूल कार्य का लेखक किसी कार्य का अनुवाद होने पर अपने अधिकारों को नहीं खोता है: एक अनुवादक के पास अनुवाद प्रकाशित करने की अनुमति होनी चाहिए ।

यह सभी देखें

एआई-पूर्ण
कैश भाषा मॉडल
मशीनी अनुवाद अनुप्रयोगों की तुलना
विभिन्न मशीनी अनुवाद दृष्टिकोणों की तुलना
अभिकलनात्मक भाषाविज्ञान
कंप्यूटर से सहायता प्राप्त अनुवाद और अनुवाद स्मृति
मशीनी अनुवाद में नियंत्रित भाषा
नियंत्रित प्राकृतिक भाषा
विदेशी भाषा लेखन सहायता
फजी मिलान
मशीनी अनुवाद का इतिहास
मानव भाषा प्रौद्योगिकी
अनुवाद में हास्य ("हाउलर")
भाषा और संचार प्रौद्योगिकी
भाषा अवरोध
उभरती प्रौद्योगिकियों की सूची
मशीनी अनुवाद के लिए अनुसंधान प्रयोगशालाओं की सूची
मोबाइल अनुवाद
तंत्रिका मशीन अनुवाद
खुला लोगो
फ्रेसेलेटर
पोस्ट एडिटिंग
छद्म अनुवाद
राउंड-ट्रिप अनुवाद
सांख्यिकीय मशीनी अनुवाद
अनुवाद
अनुवाद स्मृति
अल्ट्रा (मशीन अनुवाद प्रणाली)
यूनिवर्सल नेटवर्किंग भाषा
सार्वभौमिक अनुवादक

^ ए बी सी डी ई स्टीफन बुडियन्स्की (दिसंबर 1998)। "अनुवाद में खोना"। अटलांटिक पत्रिका । पीपी 81-84।
^ अल्बाट, थॉमस फ्रिट्ज. "स्वचालित रूप से अनुवाद समय का अनुमान लगाने के लिए सिस्टम और तरीके।" यूएस पेटेंट 0185235, 19 जुलाई 2012।
^ येहोशुआ बार-हिलेल (1964)। भाषा और सूचना: उनके सिद्धांत और अनुप्रयोग पर चयनित निबंध । पढ़ना, एमए: एडिसन-वेस्ले। पीपी. 174-179.
^ मैडसेन, माथियास विन्थर (2009)। मशीनी अनुवाद की सीमाएं । एमए थीसिस, कोपेनहेगन विश्वविद्यालय । पी ५ . 12 मई 2020 को लिया गया ।
^ ड्यूपॉन्ट, क्विन (जनवरी 2018)। "द क्रिप्टोलॉजिकल ऑरिजिंस ऑफ मशीन ट्रांसलेशन: फ्रॉम अल-किंडी टू वीवर" । आधुनिक (8)।
^ जेम्स नोल्सन (1975)। इंग्लैंड और फ्रांस में सार्वभौमिक भाषा योजनाएँ, १६००-१८०० । टोरंटो विश्वविद्यालय प्रेस। आईएसबीएन 978-0-8020-5296-4.
^ जे हचिन्स (2000)। "वॉरेन वीवर एंड द लॉन्चिंग ऑफ़ एमटी". मशीनी अनुवाद में प्रारंभिक वर्ष (पीडीएफ) । सिमेंटिक स्कॉलर । भाषा विज्ञान के इतिहास में अध्ययन। ९७ . पी 17. दोई : 10.1075/sihols.97.05hut । आईएसबीएन 978-90-272-4586-1. एस २ सीआईडी १६३४६०३७५ । मूल (पीडीएफ) से २८ फरवरी २०२० को संग्रहीत ।
^ "वॉरेन वीवर, अमेरिकी गणितज्ञ" । 13 जुलाई 2020।
^ , (१३ अगस्त १९८६).パーソナルコンピュータによる機械翻訳プログラムの制作(जापानी में)। टोक्यो: (株)ラッセル社। पी 16. आईएसबीएन 494762700X.わが国では1956年、当時の電気試験所が英和翻訳専用機「ヤマト」を実験している。この機械は1962年頃には中学1年の教科書で90点以上の能力に達したと報告されて(अनुवाद ( Google अनुवाद द्वारा सहायता ) : १९५९ में जापान, नेशनल इंस्टीट्यूट ऑफ एडवांस्ड इंडस्ट्रियल साइंस एंड टेक्नोलॉजी (एआईएसटी) ने उचित अंग्रेजी-जापानी अनुवाद मशीन यामाटो का परीक्षण किया , जिसने १९६४ में रिपोर्ट किया क्योंकि यह स्कोर से अधिक शक्ति स्तर तक पहुंच गया था। जूनियर हाई स्कूल की पहली कक्षा की पाठ्यपुस्तक पर 90 अंकों का।)
^ "機械翻訳専用機「やまと」-コンピュータ博物館" ।
^ नी, मैरी जो (2016)। "स्पीकिंग इन टंग्स: साइंस की सेंचुरी-लॉन्ग हंट फॉर ए कॉमन लैंग्वेज" । आसवन । २ (१): ४०-४३ । 20 मार्च 2018 को लिया गया ।
^ गॉर्डिन, माइकल डी। (2015)। साइंटिफिक बेबेल: हाउ डन डन बिफोर एंड आफ्टर ग्लोबल इंग्लिश । शिकागो, इलिनोइस: शिकागो विश्वविद्यालय प्रेस। आईएसबीएन ९७८०२२६०००२९९.
^ वोल्फगैंग सैक्सन (28 जुलाई 1995)। "डेविड जी. हेज़, 66, कंप्यूटर द्वारा भाषा अध्ययन का विकासकर्ता" . द न्यूयॉर्क टाइम्स । 1957 की शुरुआत में कंप्यूटर-समर्थित भाषा प्रसंस्करण के बारे में लिखा था.. 1955 से 1968 तक रैंड में कम्प्यूटेशनल भाषाविज्ञान पर प्रोजेक्ट लीडर थे।
^ , (१३ अगस्त १९८६).パーソナルコンピュータによる機械翻訳プログラムの制作(जापानी में)। टोक्यो: (株)ラッセル社। पी 16. आईएसबीएन 494762700X.
^ शैंक, रोजर सी। (2014)। वैचारिक सूचना प्रसंस्करण । न्यूयॉर्क: एल्सेवियर. पी 5. आईएसबीएन 9781483258799.
^ फ़ारवेल, डेविड; गेरबर, लॉरी; होवी, एडुआर्ड (29 जून 2003)। मशीन अनुवाद और सूचना सूप: अमेरिका में मशीन अनुवाद के लिए एसोसिएशन का तीसरा सम्मेलन, AMTA'98, Langhorne, PA, USA, अक्टूबर 28-31, 1998 कार्यवाही । बर्लिन: स्प्रिंगर. पी 276. आईएसबीएन 3540652590.
^ बैरोन, ब्रेंडा (18 नवंबर 2019)। "बेबेल मछली: मूल अनुवाद आवेदन का क्या हुआ?: हम जांच करते हैं" । डिजिटल डॉट कॉम । 22 नवंबर 2019 को लिया गया ।
^ और अन्य उदाहरण भी दिए
^ चान, सिन-वाई (2015)। रूटलेज इनसाइक्लोपीडिया ऑफ ट्रांसलेशन टेक्नोलॉजी । ऑक्सन: रूटलेज। पी 385. आईएसबीएन SB ९७८०४१५५२४८४१.
^ बाई लिपिंग, "अनुवाद में समानता और अंतर।" अनुवाद में समानता और अंतर से लिया गया : समानता और अनुवाद पर अंतर्राष्ट्रीय सम्मेलन की कार्यवाही , पृष्ठ। 339. एड। स्टेफानो अर्दुनी और रॉबर्ट हॉजसन। दूसरा संस्करण। रोम : एडिज़ियोनी डि स्टोरिया ई लेटरतुरा, २००७।आईएसबीएन ९ ७८८८८८४ ९ ८३७४ ९
^ जॉन लेहरबर्गर (1988)। मशीनी अनुवाद: एमटी सिस्टम की भाषाई विशेषताएं और मूल्यांकन की सामान्य पद्धति । जॉन बेंजामिन प्रकाशन। आईएसबीएन 90-272-3124-9.
^ चिटू, एलेक्स (22 अक्टूबर 2007)। "Google अपने स्वयं के अनुवाद प्रणाली पर स्विच करता है" । Googlesystem.blogspot.com । 13 अगस्त 2012 को लिया गया ।
^ "गूगल ट्रांसलेटर: द यूनिवर्सल लैंग्वेज" । Blog.outer-court.com। २५ जनवरी २००७ । 12 जून 2012 को लिया गया ।
^ "इनसाइड गूगल ट्रांसलेट - गूगल ट्रांसलेट" ।
^ http://www.mt-archive.info/10/HyTra-2013-Tambouratzis.pdf
^ नागाओ, एम। 1981।एनालॉजी प्रिंसिपल द्वारा जापानी और अंग्रेजी के बीच एक यांत्रिक अनुवाद का एक ढांचा , कृत्रिम और मानव खुफिया में, ए। एलिथॉर्न और आर। बनर्जी (संस्करण।) नॉर्थ-हॉलैंड, पीपी। 173-180, 1984।
^ "कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन - 2003 एसीएल लाइफटाइम अचीवमेंट अवार्ड" । कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन। से संग्रहीत मूल 12 जून 2010 को । 10 मार्च 2010 को लिया गया ।
^ "Kitt.cl.uzh.ch [सीएल विकी]" (पीडीएफ) ।
^ एडम बोरेट्ज़ (2 मार्च 2009)। "बोरेट्ज़, एडम, "ऐपटेक ने हाइब्रिड मशीन ट्रांसलेशन सॉफ्टवेयर लॉन्च किया" स्पीचटेकमैग डॉट कॉम (2 मार्च 2009 को पोस्ट किया गया)" । स्पीचटेकमैग डॉट कॉम । 12 जून 2012 को लिया गया ।
^ "Google का तंत्रिका नेटवर्क उन भाषाओं का अनुवाद करना सीखता है जिन पर उसे प्रशिक्षित नहीं किया गया है" ।
^ लिन, एलीसन (14 मार्च 2018)। "Microsoft एक ऐतिहासिक मील का पत्थर तक पहुँचता है, चीनी से अंग्रेजी में समाचारों का अनुवाद करने में मानव प्रदर्शन से मेल खाने के लिए AI का उपयोग करता है" । 2 मार्च 2019 को मूल से संग्रहीत । 21 अप्रैल 2021 को लिया गया ।
^ हनी हसन एट अल। (२०१८) स्वचालित चीनी से अंग्रेजी समाचार अनुवाद पर मानव समानता प्राप्त करना। | url= https://arxiv.org/pdf/1803.05567.pdf
^ एंटोनियो तोरल, शीला कैस्टिल्हो, के हू और एंडी वे। 2018 अप्राप्य को प्राप्त करना? तंत्रिका मशीन अनुवाद में मानव समानता के दावों का पुनर्मूल्यांकन। सीओआरआर, एब्स/१८०८.१०४३२।
^ यवेटे ग्राहम, बैरी हैडो और फिलिप कोहेन। (२०१९) मशीनी अनुवाद मूल्यांकन में अनुवाद। सीओआरआर, एब्स/1906.09833।
^ https://aclweb.org/aclwiki/Multiword_Expressions
^ हान, लाइफेंग, जोन्स, गैरेथ जेएफ, स्मीटन, एलन एफ. और बोल्ज़ोनी, पाओलो (2021) मल्टी-वर्ड एक्सप्रेशंस के साथ न्यूरल एमटी के लिए चीनी चरित्र अपघटन। में: कम्प्यूटेशनल भाषाविज्ञान पर 23वां नॉर्डिक सम्मेलन (NoDaLiDa 2021) | यूआरएल = https://arxiv.org/abs/2104.04497
^ लिफेंग हान, शाओहुई कुआंग। (२०१८) चीनी रेडिकल्स को तंत्रिका मशीन अनुवाद में शामिल करना: चरित्र स्तर से गहरा | यूआरएल = https://arxiv.org/pdf/1805.01565.pdf
^ मशीन अनुवाद में मील के पत्थर - नं .6: बार-हिल्लेल और FAHQT की nonfeasibility संग्रहीत 12 मार्च 2007 में वेबैक मशीन जॉन हचिंस से
^ बार-हिल्लेल (1960), "स्वचालित रूप से भाषाओं का अनुवाद"। http://www.mt-archive.info/Bar-Hillel-1960.pdf . पर ऑनलाइन उपलब्ध है
^ मशीनी अनुवाद के लिए हाइब्रिड दृष्टिकोण । कोस्टा-जुसो, मार्टा आर।, रैप, रेनहार्ड, लैम्बर्ट, पैट्रिक, एबरले, कर्ट, बैंच, राफेल ई।, बेबीच, बोगडान। स्विट्ज़रलैंड। आईएसबीएन ९७८३३१९२१३१०१. ओसीएलसी 953581497 ।CS1 रखरखाव: अन्य ( लिंक )
^ क्लाउड पिरोन , ले डेफी डेस लैंग्स (द लैंग्वेज चैलेंज), पेरिस, ल'हरमट्टन, 1994।
^ http://www.cl.cam.ac.uk/~ar283/eacl03/workshops03/W03-w1_eacl03babych.local.pdf
^ हरमाजाकोब, यू., नाइट, के., और हाल, डी. (2008)। सांख्यिकीय मशीन अनुवाद में नाम अनुवाद सीखना जब लिप्यंतरण करना है । कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन। 389–397।
^ ए बी http://nlp.stanford.edu/courses/cs224n/2010/reports/singla-nirajuec.pdf
^ https://dowobeha.github.io/papers/amta08.pdf
^ http://homepages.inf.ed.ac.uk/mlap/Papers/acl07.pdf
^ https://www.jair.org/media/3540/live-3540-6293-jair.pdf
^ ए बी सी वोसेन, पाइक: ओन्टोलॉजीज । इन: मिटकोव, रुस्लान (सं।) (२००३): कम्प्यूटेशनल भाषाविज्ञान की हैंडबुक, अध्याय २५। ऑक्सफोर्ड: ऑक्सफोर्ड यूनिवर्सिटी प्रेस।
^ नाइट, केविन (1994)। " बिल्डिंग ए लार्ज ऑन्टोलॉजी फॉर मशीन ट्रांसलेशन (1993) "। arXiv : cmp-lg/9407029 । साइट जर्नल की आवश्यकता है |journal=( सहायता )
^ मेल्बी, एलन। भाषा की संभावना (एम्स्टर्डम: बेंजामिन, १९९५, २७-४१) । बेंजामिन डॉट कॉम। 1995. आईएसबीएन ९७८९०२७२१६१४४. 12 जून 2012 को लिया गया ।
^ एडम (14 फरवरी 2006)। "वूटेन, एडम। "ए सिंपल मॉडल आउटलाइनिंग ट्रांसलेशन टेक्नोलॉजी" टी एंड आई बिजनेस (14 फरवरी, 2006)" । Tandibusiness.blogspot.com । 12 जून 2012 को लिया गया ।
^ "भाषाओं के स्वचालित अनुवाद की वर्तमान स्थिति' का परिशिष्ट III, कंप्यूटर में अग्रिम, खंड 1 (1960), पृष्ठ 158-163। वाई.बार-हिलेल में पुनर्मुद्रित: भाषा और सूचना (पढ़ना, मास: एडिसन) -वेस्ले, 1964), पी.174-179" (पीडीएफ) । 12 जून 2012 को लिया गया ।
^ "आपके साथ टा द्वारा मानव गुणवत्ता मशीन अनुवाद समाधान" (स्पेनिश में)। Tauyou.com. 15 अप्रैल 2009 । 12 जून 2012 को लिया गया ।
^ "molto-project.eu" । molto-project.eu । 12 जून 2012 को लिया गया ।
^ स्पीगेल ऑनलाइन, हैम्बर्ग, जर्मनी (13 सितंबर 2013)। "Google अनुवाद में मशीनी अनुवाद के लिए महत्वाकांक्षी लक्ष्य हैं" । स्पीगेल ऑनलाइन ।CS1 रखरखाव: कई नाम: लेखकों की सूची ( लिंक )
^ "मशीन अनुवाद सेवा" । 5 अगस्त 2011।
^ गूगल ब्लॉग: द मशीन्स डू द ट्रांसलेटिंग ( फ्रांज ओच द्वारा)
^ "गीर, डेविड, "सांख्यिकीय अनुवाद लाभ सम्मान", पीपी। 18 - 21, आईईईई कंप्यूटर, अक्टूबर 2005"। Ieeexplore.ieee.org। २७ सितंबर २०११। डीओआई : १०.११०९/एमसी.२००५.३५३ । S2CID 7088166 । साइट जर्नल की आवश्यकता है |journal=( सहायता )
^ रैटलिफ, इवान (4 जनवरी 2009)। "रैटक्लिफ, इवान "मी ट्रांसलेशन प्रिटी वन डे", वायर्ड दिसंबर 2006" । वायर्ड । 12 जून 2012 को लिया गया ।
^ " " एनआईएसटी २००६ मशीनी अनुवाद मूल्यांकन आधिकारिक परिणाम", नवंबर १, २००६" । Itl.nist.gov । 12 जून 2012 को लिया गया ।
^ "इन-क्यू-टेल" । इन-क्यू-टेल। मूल से 20 मई 2016 को संग्रहीत किया गया । 12 जून 2012 को लिया गया ।
^ Gallafent, Alex (26 April 2011). "Machine Translation for the Military". PRI's the World. Retrieved 17 September 2013.
^ Jackson, William (9 September 2003). "GCN – Air force wants to build a universal translator". Gcn.com. Retrieved 12 June 2012.
^ http://www.nap.edu/html/alpac_lm/ARC000005.pdf
^ "Using machine translation in clinical practice".
^ a b Way, Andy; Nano Gough (20 September 2005). "Comparing Example-Based and Statistical Machine Translation". Natural Language Engineering. 11 (3): 295–309. doi:10.1017/S1351324905003888.
^ Muegge (2006), "Fully Automatic High Quality Machine Translation of Restricted Text: A Case Study," in Translating and the computer 28. Proceedings of the twenty-eighth international conference on translating and the computer, 16–17 November 2006, London, London: Aslib.ISBN 978-0-85142-483-5.
^ "Comparison of MT systems by human evaluation, May 2008". Morphologic.hu. Archived from the original on 19 April 2012. Retrieved 12 June 2012.
^ Anderson, D.D. (1995). Machine translation as a tool in second language learning. CALICO Journal. 13(1). 68–96.
^ Han et al. (2012), "LEPOR: A Robust Evaluation Metric for Machine Translation with Augmented Factors," in Proceedings of the 24th International Conference on Computational Linguistics (COLING 2012): Posters, pages 441–450, Mumbai, India.
^ J.M. Cohen observes (p.14): "Scientific translation is the aim of an age that would reduce all activities to techniques. It is impossible however to imagine a literary-translation machine less complex than the human brain itself, with all its knowledge, reading, and discrimination."
^ See the annually performed NIST tests since 2001 and Bilingual Evaluation Understudy
^ a b Nino, Ana. "Machine Translation in Foreign Language Learning: Language Learners' and Tutors' Perceptions of Its Advantages and Disadvantages" ReCALL: the Journal of EUROCALL 21.2 (May 2009) 241–258.
^ a b Zhao, L., Kipper, K., Schuler, W., Vogler, C., & Palmer, M. (2000). A Machine Translation System from English to American Sign Language. Lecture Notes in Computer Science, 1934: 54–67.

मशीनी अनुवाद को क्या कहा जाता है?

कंप्यूटर प्रोग्राम की सहायता से एक भाषा के पाठ का अनुवाद दूसरी भाषा में करने को यांत्रिक या मशीनी अनुवाद कहते हैं। किसी अन्य भाषा में लिखे पाठ का इसके द्वारा तुरंत अनुवाद किया जा सकता है जो सूचना तथा ज्ञान के प्रसार में अत्यंत सहायक है।

मशीनी अनुवाद के लिए कौन सी तीन बातें?

मशीनी अनुवाद का अर्थ है - मशीन या कंप्यूटर प्रणाली के माध्यम से एक भाषा से दूसरी भाषा में अनुवाद करना । अनुवाद की तीन प्रक्रियाएँ सर्वस्वीकृत हैं- विश्लेषण, अंतरण एवं पुनर्गठन | मशीनी अनुवाद में ये तीनों प्रक्रियाएँ कंप्यूटर द्वारा संपन्न होती हैं ।

मशीनरी भाषा किसका उपयोग करती है?

मशीनी भाषा (machine language) कंप्यूटर की आधारभुत भाषा है, यह केवल 0 और 1 दो अंको के प्रयोग से निर्मित शृंखला से लिखी जाती है। यह एकमात्र कंप्यूटर प्रोग्रामिंग भाषा है जो कि कंप्यूटर द्वारा सीधे-सीधे समझी जाती है। इसे किसी अनुवादक प्रोग्राम का प्रयोग नही करना होता है। इसे कंप्यूटर का मशीनी संकेत भी कहा जाता है।

मशीनी अनुवाद के लिए कौन कौन सी बातें शिक्षक है?

मशीनी अनुवाद कंप्यूटर साॅफ्टवेयर द्वारा किया जाने वाला अनुवाद है और मशीनी अनुवाद प्रणाली एक कंप्यूटर प्रोग्राम है जो 'इनपुट' के तौर पर स्रोतभाषा का पाठ लेता है और उसका लक्ष्यभाषा के पाठ में अनूदित परिणाम (आउटपुट) देता है।.

प्रत्यक्ष अनुवाद.

नियम आधारित,.

काॅर्पस आधारित और.

हाइब्रिड तकनीक।.