आपके प्रश्न का उत्तर इस बात पर निर्भर करता है की आप कौन सा टेक्स्ट एडिटर या वर्ड प्रोसेसर प्रयोग कर रहे हैं। कृपया बताइए। Show
लेकिन " — " को 'टैब' में बदलने के लिए जो प्रक्रिया है वह सभी के लिए सामान हो सकती है। अपने सोफ्टवेअयर के Find and replace को क्लिक करें। यह प्रायः Edit वाले मुख्य मेनू में रहता है। अब आपके सामने भरने के लिए एक विंडो आ जाएगी। इसके Find वाले टेक्स्ट बॉक्स में अपने कर्सर से सेलेक्ट करते हुए " — " पेस्ट कर दें (दोनों कोटेशन मार्क छोड़कर कॉपी करना है ) । अब Replace with वाले बक्से में आपको 'टैब' पेस्ट करना है। टैब चार या आठ स्पेस के बराबर जगह घेरने वाला अदृश्य कैरेक्टर है. इसे टाइप करने के लिए ' कैपिटल लॉक' कुंजी के ऊपर वाली कुंजी दबाना पड़ती है. लेकिन Replace with वाले बक्से में इसे दबाने से ये टाइप नहीं होगा बल्कि कुछ और होगा। इसलिए इसे कहीं और से कॉपी करके पेस्ट करना होगा। ये रहा टैब " " (दोनों कोटेशन मार्क के बीच अदृश्य है , उसे कॉपी करके पेस्ट कर दीजिए ) . या अपने सम्पादित्र में कही पहले एक दूसरे से सटे हुए दो कोटेशन मार्क टाइप कीजिए , इस तरह "" . फिर इन दोनों के बीच में कर्सर ले जाइये और एक बार टैब कुंजी को दबा दीजिए। दोनों कोटेशन मार्क के बीच कुछ जगह बन जाएगी। इसे भी माउस से सेलेक्ट करक Replace with वाले बक्से में पेस्ट कर सकते हैं। अंत में आपको 'रिप्लेस' या 'रिप्लेस आल' वाला बटन दबाना है। 'रिप्लेस आल' करने के पहले लोग सावधानी के तौर पर एक-दो को रिप्लेस करके देख लेते हैं कि वे जैसा चाहते हैं वैसा ही हो रहा है या नहीं। संतुष्ट होने के बाद 'रिप्लेस आल' बटन दबाते हैं। कई सारे सम्पादित्रों में अदृश्य कैरेक्टरों को उलटा श्लैश के साथ एक कैरेक्टर लगाकर निरूपित करने की सुविधा होती है , जैसे टैब के लिए \t , लाइन फीड (नेक्स्ट लाइन ) के लिए \n आदि। लेकिन अभी इसे अभी नही करेंगे। कंप्यूटर प्रोग्राम की सहायता से एक भाषा के पाठ का अनुवाद दूसरी भाषा में करने को यांत्रिक या मशीनी अनुवाद कहते हैं। किसी अन्य भाषा में लिखे पाठ का इसके द्वारा तुरंत अनुवाद किया जा सकता है जो सूचना तथा ज्ञान के प्रसार में अत्यंत सहायक है। इस तरह का सबसे पहला प्रयास 1995 में आईआईटी कानपुर द्वारा किया गया था जिसने अनुसारका नामक सिस्टम से एक भारतीय भाषा का दूसरी भारतीय भाषा में अनुवाद किया। अंग्रेज़ी से हिन्दी के लिए सी–डैक ने 1997 में मंत्र नामक पहला इंजन बनाया। बाद में कई अन्य संस्थाओं तथा व्यक्तियों ने भी अपने–अपने स्तर पर एक स्थापित मशीन अनुवाद प्रणाली बनाने के लिए प्रयास किए। इस दिशा में किए गए प्रयासों में आंग्लभारती, अनुभारती, संपर्क आदि प्रमुख हैं। अंग्रेज़ी सहित अन्य भाषाओं से हिन्दी में मशीन अनुवाद के प्रयास अभी भी जारी हैं तथा अपेक्षित सफलता शेष है। लोकप्रिय अनुप्रयोग निर्माता गूगल भी इसपर काफ़ी समय से कार्य कर रहा है और इसका मशीन अनुवाद बेहतर समझा जाता है। गूगल अनुवाद के संस्करण 3.0.6 ने हिन्दी और सात अन्य भारतीय भाषाओं के लिए बोलकर अनुवाद करने की सुविधा जोड़ी है। मशीनी अनुवाद , जिसे कभी-कभी संक्षिप्त नाम एमटी [1] द्वारा संदर्भित किया जाता है ( कंप्यूटर-सहायता प्राप्त अनुवाद , मशीन-सहायता प्राप्त मानव अनुवाद या इंटरैक्टिव अनुवाद के साथ भ्रमित नहीं होना ), कम्प्यूटेशनल भाषाविज्ञान का एक उप-क्षेत्र है जो अनुवाद करने के लिए सॉफ़्टवेयर के उपयोग की जांच करता है। एक भाषा से दूसरी भाषा में पाठ या भाषण । बुनियादी स्तर पर, एमटी एक भाषा में शब्दों के लिए दूसरी भाषा में शब्दों का यांत्रिक प्रतिस्थापन करता है, लेकिन वह अकेले ही शायद ही कभी एक अच्छा अनुवाद पैदा करता है क्योंकि लक्ष्य भाषा में पूरे वाक्यांशों और उनके निकटतम समकक्षों की पहचान की आवश्यकता होती है। एक भाषा के सभी शब्दों में दूसरी भाषा के समान शब्द नहीं होते हैं, और कई शब्दों के एक से अधिक अर्थ होते हैं। कॉर्पस सांख्यिकीय और तंत्रिका तकनीकों के साथ इस समस्या को हल करना एक तेजी से बढ़ता हुआ क्षेत्र है जो बेहतर अनुवाद, भाषाई टाइपोग्राफी में अंतर को संभालने , मुहावरों के अनुवाद और विसंगतियों के अलगाव के लिए अग्रणी है । [२] [ विफल सत्यापन ] वर्तमान मशीन अनुवाद सॉफ़्टवेयर अक्सर डोमेन या पेशे (जैसे मौसम रिपोर्ट ) द्वारा अनुकूलन की अनुमति देता है , स्वीकार्य प्रतिस्थापन के दायरे को सीमित करके आउटपुट में सुधार करता है। यह तकनीक उन क्षेत्रों में विशेष रूप से प्रभावी है जहां औपचारिक या सूत्रीय भाषा का उपयोग किया जाता है। यह इस प्रकार है कि सरकारी और कानूनी दस्तावेजों का मशीनी अनुवाद बातचीत या कम मानकीकृत पाठ की तुलना में अधिक आसानी से प्रयोग करने योग्य आउटपुट उत्पन्न करता है। मानव हस्तक्षेप से बेहतर आउटपुट गुणवत्ता भी प्राप्त की जा सकती है: उदाहरण के लिए, कुछ सिस्टम अधिक सटीक अनुवाद करने में सक्षम होते हैं यदि उपयोगकर्ता ने स्पष्ट रूप से पहचान लिया है कि पाठ में कौन से शब्द उचित नाम हैं। इन तकनीकों की सहायता से, एमटी मानव अनुवादकों की सहायता के लिए एक उपकरण के रूप में उपयोगी साबित हुआ है और बहुत सीमित मामलों में, ऐसे आउटपुट का उत्पादन भी कर सकता है जिसका उपयोग किया जा सकता है (उदाहरण के लिए, मौसम रिपोर्ट)। मशीनी अनुवाद की प्रगति और क्षमता पर इसके इतिहास में बहुत बहस हुई है। १९५० के दशक के बाद से, कई विद्वानों ने, सबसे पहले और विशेष रूप से येहोशुआ बार-हिलेल , [३] ने उच्च गुणवत्ता के पूरी तरह से स्वचालित मशीनी अनुवाद को प्राप्त करने की संभावना पर सवाल उठाया है। [४] इतिहासमूलमशीनी अनुवाद की उत्पत्ति का पता 9वीं शताब्दी के अरबी क्रिप्टोग्राफर अल-किंडी के काम से लगाया जा सकता है , जिन्होंने क्रिप्टैनालिसिस , आवृत्ति विश्लेषण , और संभाव्यता और सांख्यिकी सहित प्रणालीगत भाषा अनुवाद के लिए तकनीक विकसित की , जो आधुनिक मशीन अनुवाद में उपयोग की जाती हैं। [५] मशीनी अनुवाद का विचार बाद में १७वीं शताब्दी में सामने आया। 1629 में, रेने डेसकार्टेस ने एक सार्वभौमिक भाषा का प्रस्ताव रखा, जिसमें विभिन्न भाषाओं में समान विचार एक प्रतीक को साझा करते थे। [6] प्राकृतिक भाषाओं के अनुवाद के लिए डिजिटल कंप्यूटर का उपयोग करने का विचार एक ही समय में रॉकफेलर फाउंडेशन में इंग्लैंड के एडी बूथ और वॉरेन वीवर द्वारा 1946 की शुरुआत में प्रस्तावित किया गया था । " 1949 में वॉरेन वीवर द्वारा लिखा गया ज्ञापन मशीनी अनुवाद के शुरुआती दिनों में शायद सबसे प्रभावशाली प्रकाशन है।" [७] [८] दूसरों ने अनुसरण किया। १९५४ में बर्कबेक कॉलेज ( लंदन विश्वविद्यालय ) में APEXC मशीन पर अंग्रेजी के फ्रेंच में अल्पविकसित अनुवाद का एक प्रदर्शन किया गया था । उस समय इस विषय पर कई पत्र प्रकाशित हुए थे, और यहां तक कि लोकप्रिय पत्रिकाओं में लेख भी (उदाहरण के लिए वायरलेस वर्ल्ड के सितंबर 1955 के अंक में क्लीव और ज़ाचारोव का एक लेख )। इसी तरह का एक आवेदन, उस समय बिर्कबेक कॉलेज में भी अग्रणी था, कंप्यूटर द्वारा ब्रेल ग्रंथों को पढ़ और लिख रहा था । 1950 के दशकक्षेत्र के पहले शोधकर्ता, येहोशुआ बार-हिलेल ने एमआईटी (1951) में अपना शोध शुरू किया। एक जॉर्ज टाउन विश्वविद्यालय मीट्रिक टन अनुसंधान दल, प्रोफेसर माइकल Zarechnak के नेतृत्व में पीछा किया (1951) अपने के सार्वजनिक प्रदर्शन के साथ जॉर्ज टाउन-आईबीएम प्रयोग 1954 मीट्रिक टन शोध कार्यक्रमों में प्रणाली जापान में ऊपर पॉप [9] [10] और रूस (1955), और पहला एमटी सम्मेलन लंदन (1956) में आयोजित किया गया था। [११] [१२] डेविड जी. हेज़ ने "1957 की शुरुआत में कंप्यूटर-समर्थित भाषा प्रसंस्करण के बारे में लिखा" और " 1955 से 1968 तक रैंड में कम्प्यूटेशनल भाषाविज्ञान पर प्रोजेक्ट लीडर थे।" [13] 1960-1975मशीन अनुवाद और कम्प्यूटेशनल भाषाविज्ञान के लिए एसोसिएशन (1962) के रूप में शोधकर्ताओं ने क्षेत्र में शामिल होना जारी रखा और नेशनल एकेडमी ऑफ साइंसेज ने एमटी (1964) का अध्ययन करने के लिए स्वचालित भाषा प्रसंस्करण सलाहकार समिति (ALPAC) का गठन किया। हालाँकि, वास्तविक प्रगति बहुत धीमी थी, और ALPAC रिपोर्ट (1966) के बाद, जिसमें पाया गया कि दस साल का लंबा शोध उम्मीदों को पूरा करने में विफल रहा था, फंडिंग बहुत कम हो गई थी। [१४] रक्षा अनुसंधान और इंजीनियरिंग निदेशक (डीडीआर एंड ई) द्वारा १९७२ की एक रिपोर्ट के अनुसार, उस संघर्ष के दौरान सैन्य नियमावली का वियतनामी में अनुवाद करने में लोगो एमटी प्रणाली की सफलता से बड़े पैमाने पर एमटी की व्यवहार्यता को फिर से स्थापित किया गया था। फ्रेंच टेक्सटाइल इंस्टीट्यूट ने फ्रेंच, अंग्रेजी, जर्मन और स्पेनिश (1970) से और में सार का अनुवाद करने के लिए एमटी का इस्तेमाल किया; ब्रिघम यंग यूनिवर्सिटी ने स्वचालित अनुवाद (1971) द्वारा मॉर्मन ग्रंथों का अनुवाद करने के लिए एक परियोजना शुरू की। १९७५ और उसके बादसिस्ट्रान , जिसने 1960 के दशक में "अमेरिकी सरकार से अनुबंध के तहत क्षेत्र में अग्रणी" [1] का उपयोग किया था, का उपयोग ज़ेरॉक्स द्वारा तकनीकी मैनुअल (1978) का अनुवाद करने के लिए किया गया था। 1980 के दशक के उत्तरार्ध में, जैसे-जैसे कम्प्यूटेशनल शक्ति बढ़ती गई और कम खर्चीली होती गई, मशीनी अनुवाद के लिए सांख्यिकीय मॉडल में अधिक रुचि दिखाई गई । कंप्यूटर के आगमन के बाद एमटी अधिक लोकप्रिय हो गया। [१५] सिस्ट्रान की पहली कार्यान्वयन प्रणाली को १९८८ में मिनिटेल नामक फ्रांसीसी डाक सेवा की ऑनलाइन सेवा द्वारा लागू किया गया था । [१६] विभिन्न एमटी कंपनियों को भी लॉन्च किया गया, जिसमें ट्रेडोस (१९८४) भी शामिल है, जो अनुवाद स्मृति प्रौद्योगिकी (१९८९) को विकसित और बाजार में लाने वाली पहली कंपनी थी। रूसी / अंग्रेजी / जर्मन-यूक्रेनी के लिए पहली वाणिज्यिक एमटी प्रणाली खार्कोव स्टेट यूनिवर्सिटी (1991) में विकसित की गई थी। 1998 तक, "कम से कम $29.95 में" एक पीसी पर चलने के लिए "अंग्रेजी और अपनी पसंद की एक प्रमुख यूरोपीय भाषा के बीच एक दिशा में अनुवाद के लिए एक कार्यक्रम खरीद सकता है"। [1] वेब पर एमटी की शुरुआत सिस्ट्रान ने छोटे पाठों के मुफ्त अनुवाद (1996) की पेशकश के साथ की और फिर इसे अल्टाविस्टा बेबेलफिश [1] के माध्यम से प्रदान किया, जिसने एक दिन (1997) में 500,000 अनुरोधों को पूरा किया। [१७] वेब पर दूसरी मुफ्त अनुवाद सेवा लर्नआउट एंड हॉस्पी की ग्लोबालिंक थी । [१] अटलांटिक पत्रिका ने १९९८ में लिखा था कि "सिस्ट्रान की बेबेलफिश और ग्लोबालिंक्स कॉम्प्रेंडे" ने "सक्षम प्रदर्शन" के साथ "इस पर बैंक न करें" को संभाला। [18] फ्रांज जोसेफ ओच (Google में अनुवाद विकास के भावी प्रमुख) ने DARPA की गति MT प्रतियोगिता (2003) जीती। [१९] इस समय के दौरान और अधिक नवाचारों में MOSES, ओपन-सोर्स स्टैटिस्टिकल MT इंजन (२००७), जापान में मोबाइलों के लिए एक टेक्स्ट/एसएमएस अनुवाद सेवा (२००८), और एक मोबाइल फोन शामिल है जिसमें बिल्ट-इन स्पीच-टू-स्पीच अनुवाद है। अंग्रेजी, जापानी और चीनी (2009) के लिए कार्यक्षमता। 2012 में, Google ने घोषणा की कि Google अनुवाद एक दिन में 1 मिलियन पुस्तकों को भरने के लिए लगभग पर्याप्त पाठ का अनुवाद करता है। अनुवाद प्रक्रियामानव अनुवाद प्रक्रिया को इस प्रकार वर्णित किया जा सकता है:
इस स्पष्ट रूप से सरल प्रक्रिया के पीछे एक जटिल संज्ञानात्मक कार्य है। स्रोत पाठ के अर्थ को उसकी संपूर्णता में डिकोड करने के लिए , अनुवादक को पाठ की सभी विशेषताओं की व्याख्या और विश्लेषण करना चाहिए, एक ऐसी प्रक्रिया जिसके लिए स्रोत भाषा के व्याकरण , शब्दार्थ , वाक्य रचना , मुहावरों आदि के गहन ज्ञान की आवश्यकता होती है । , साथ ही इसके वक्ताओं की संस्कृति। लक्ष्य भाषा में अर्थ को फिर से एन्कोड करने के लिए अनुवादक को उसी गहन ज्ञान की आवश्यकता होती है। [20] इसमें मशीनी अनुवाद में चुनौती निहित है: एक ऐसे कंप्यूटर को कैसे प्रोग्राम किया जाए जो एक व्यक्ति के रूप में एक पाठ को "समझ" सकता है, और जो लक्ष्य भाषा में एक नया पाठ "बनाने" के लिए ऐसा लगता है जैसे कि यह किसी व्यक्ति द्वारा लिखा गया हो । जब तक 'ज्ञान आधार' द्वारा सहायता प्राप्त न हो, एमटी मूल पाठ का केवल एक सामान्य, हालांकि अपूर्ण, सन्निकटन प्रदान करता है, इसका "सार" (एक प्रक्रिया जिसे "जिसिंग" कहा जाता है) प्राप्त करना। यह कई उद्देश्यों के लिए पर्याप्त है, जिसमें मानव अनुवादक के सीमित और महंगे समय का सर्वोत्तम उपयोग करना शामिल है, जो उन मामलों के लिए आरक्षित है जिनमें कुल सटीकता अपरिहार्य है। दृष्टिकोणबर्नार्ड वाउक्वाइस का पिरामिड मध्यवर्ती प्रतिनिधित्व की तुलनात्मक गहराई दिखा रहा है, चरम पर अंतरभाषी मशीन अनुवाद , उसके बाद स्थानांतरण-आधारित, फिर प्रत्यक्ष अनुवाद। मशीनी अनुवाद भाषाई नियमों के आधार पर एक विधि का उपयोग कर सकता है , जिसका अर्थ है कि शब्दों का भाषाई तरीके से अनुवाद किया जाएगा - लक्ष्य भाषा के सबसे उपयुक्त (मौखिक रूप से बोलने वाले) शब्द स्रोत भाषा के शब्दों को बदल देंगे। [ उद्धरण वांछित ] अक्सर यह तर्क दिया जाता है कि मशीनी अनुवाद की सफलता के लिए पहले प्राकृतिक भाषा समझ की समस्या को हल करने की आवश्यकता होती है । [21] आम तौर पर, नियम-आधारित विधियां एक पाठ को पार्स करती हैं, आमतौर पर एक मध्यस्थ, प्रतीकात्मक प्रतिनिधित्व बनाती है, जिससे लक्ष्य भाषा में पाठ उत्पन्न होता है। मध्यस्थ प्रतिनिधित्व की प्रकृति के अनुसार, एक दृष्टिकोण को इंटरलिंगुअल मशीन अनुवाद या स्थानांतरण-आधारित मशीन अनुवाद के रूप में वर्णित किया जाता है । इन विधियों में रूपात्मक , वाक्य-विन्यास और अर्थ संबंधी जानकारी और नियमों के बड़े सेट के साथ व्यापक शब्दावली की आवश्यकता होती है। पर्याप्त डेटा को देखते हुए, मशीनी अनुवाद कार्यक्रम अक्सर एक भाषा के मूल वक्ता के लिए दूसरे देशी वक्ता द्वारा लिखी गई बातों का अनुमानित अर्थ प्राप्त करने के लिए पर्याप्त रूप से काम करते हैं । कठिनाई विशेष विधि का समर्थन करने के लिए सही प्रकार का पर्याप्त डेटा प्राप्त करना है। उदाहरण के लिए, सांख्यिकीय विधियों के काम करने के लिए आवश्यक डेटा का बड़ा बहुभाषी कोष व्याकरण-आधारित विधियों के लिए आवश्यक नहीं है। लेकिन फिर, व्याकरण के तरीकों को एक कुशल भाषाविद् की आवश्यकता होती है जो उनके द्वारा उपयोग किए जाने वाले व्याकरण को ध्यान से डिजाइन करे। निकट से संबंधित भाषाओं के बीच अनुवाद करने के लिए, नियम-आधारित मशीनी अनुवाद के रूप में संदर्भित तकनीक का उपयोग किया जा सकता है। नियम-आधारितनियम-आधारित मशीन अनुवाद प्रतिमान में स्थानांतरण-आधारित मशीन अनुवाद, इंटरलिंगुअल मशीन अनुवाद और शब्दकोश-आधारित मशीन अनुवाद प्रतिमान शामिल हैं। इस प्रकार के अनुवाद का उपयोग ज्यादातर शब्दकोशों और व्याकरण कार्यक्रमों के निर्माण में किया जाता है । अन्य तरीकों के विपरीत, आरबीएमटी में स्रोत और लक्ष्य भाषाओं की भाषाविज्ञान के बारे में अधिक जानकारी शामिल है, दोनों भाषाओं के रूपात्मक और वाक्यात्मक नियमों और शब्दार्थ विश्लेषण का उपयोग करते हुए । मूल दृष्टिकोण में स्रोत भाषा के लिए एक पार्सर और एक विश्लेषक, लक्ष्य भाषा के लिए एक जनरेटर, और वास्तविक अनुवाद के लिए एक स्थानांतरण शब्दकोश का उपयोग करके इनपुट वाक्य की संरचना को आउटपुट वाक्य की संरचना के साथ जोड़ना शामिल है। आरबीएमटी का सबसे बड़ा पतन यह है कि सब कुछ स्पष्ट किया जाना चाहिए: ऑर्थोग्राफिक भिन्नता और गलत इनपुट को इसका सामना करने के लिए स्रोत भाषा विश्लेषक का हिस्सा बनाया जाना चाहिए, और अस्पष्टता के सभी उदाहरणों के लिए शाब्दिक चयन नियम लिखे जाने चाहिए। अपने आप में नए डोमेन को अपनाना इतना कठिन नहीं है, क्योंकि मूल व्याकरण सभी डोमेन में समान है, और डोमेन-विशिष्ट समायोजन शाब्दिक चयन समायोजन तक सीमित है। स्थानांतरण-आधारित मशीनी अनुवादस्थानांतरण-आधारित मशीनी अनुवाद इंटरलिंगुअल मशीनी अनुवाद के समान है जिसमें यह एक मध्यवर्ती प्रतिनिधित्व से अनुवाद बनाता है जो मूल वाक्य के अर्थ का अनुकरण करता है। इंटरलिंगुअल एमटी के विपरीत, यह आंशिक रूप से अनुवाद में शामिल भाषा युग्म पर निर्भर करता है। इंटरलिंगुअलइंटरलिंगुअल मशीन अनुवाद नियम-आधारित मशीन-अनुवाद दृष्टिकोण का एक उदाहरण है। इस दृष्टिकोण में, स्रोत भाषा, यानी अनुवादित होने वाला पाठ, एक अंतर्भाषी भाषा में बदल जाता है, यानी एक "भाषा तटस्थ" प्रतिनिधित्व जो किसी भी भाषा से स्वतंत्र है। लक्ष्य भाषा तो से बाहर उत्पन्न होता है ईन्टरलिंगुआ । इस प्रणाली के प्रमुख लाभों में से एक यह है कि इंटरलिंगुआ अधिक मूल्यवान हो जाता है क्योंकि इसे लक्षित भाषाओं की संख्या में वृद्धि की जा सकती है। हालांकि, एकमात्र इंटरलिंगुअल मशीन ट्रांसलेशन सिस्टम जिसे व्यावसायिक स्तर पर चालू किया गया है, वह है KANT सिस्टम (Nyberg and Mitamura, 1992), जिसे कैटरपिलर टेक्निकल इंग्लिश (CTE) को अन्य भाषाओं में अनुवाद करने के लिए डिज़ाइन किया गया है। शब्दकोश आधारितमशीनी अनुवाद शब्दकोश प्रविष्टियों के आधार पर एक विधि का उपयोग कर सकता है , जिसका अर्थ है कि शब्दों का अनुवाद वैसे ही किया जाएगा जैसे वे एक शब्दकोश द्वारा हैं। सांख्यिकीयसांख्यिकीय मशीनी अनुवाद द्विभाषी टेक्स्ट कॉर्पोरा के आधार पर सांख्यिकीय विधियों का उपयोग करके अनुवाद उत्पन्न करने का प्रयास करता है , जैसे कि कैनेडियन हैन्सर्ड कॉर्पस, कनाडाई संसद का अंग्रेजी-फ़्रेंच रिकॉर्ड और यूरोपीय संसद का रिकॉर्ड, EUROPARL । जहां इस तरह के निगम उपलब्ध हैं, समान ग्रंथों का अनुवाद करके अच्छे परिणाम प्राप्त किए जा सकते हैं, लेकिन कई भाषा जोड़े के लिए ऐसे निगम अभी भी दुर्लभ हैं। पहले सांख्यिकीय मशीन अनुवाद सॉफ्टवेयर था Candide से आईबीएम । Google ने कई वर्षों तक SYSTRAN का उपयोग किया , लेकिन अक्टूबर 2007 में एक सांख्यिकीय अनुवाद पद्धति पर स्विच किया। [22] 2005 में, Google ने अपने सिस्टम को प्रशिक्षित करने के लिए संयुक्त राष्ट्र सामग्री से लगभग 200 बिलियन शब्दों का उपयोग करके अपनी आंतरिक अनुवाद क्षमताओं में सुधार किया; अनुवाद सटीकता में सुधार हुआ। [२३] Google अनुवाद और इसी तरह के सांख्यिकीय अनुवाद कार्यक्रम उन लाखों दस्तावेज़ों में पैटर्न का पता लगाकर काम करते हैं जिनका पहले मनुष्यों द्वारा अनुवाद किया गया है और निष्कर्षों के आधार पर बुद्धिमान अनुमान लगाते हैं। आम तौर पर, किसी दी गई भाषा में जितने अधिक मानव-अनुवादित दस्तावेज़ उपलब्ध होते हैं, उतनी ही अधिक संभावना है कि अनुवाद अच्छी गुणवत्ता का होगा। [२४] सांख्यिकीय मशीनी अनुवाद में नए दृष्टिकोण जैसे METIS II और PRESEMT न्यूनतम कॉर्पस आकार का उपयोग करते हैं और इसके बजाय पैटर्न पहचान के माध्यम से वाक्यात्मक संरचना की व्युत्पत्ति पर ध्यान केंद्रित करते हैं। आगे के विकास के साथ, यह सांख्यिकीय मशीन अनुवाद को एक मोनोलिंगुअल टेक्स्ट कॉर्पस से संचालित करने की अनुमति दे सकता है। [२५] एसएमटी की सबसे बड़ी गिरावट में यह बड़ी मात्रा में समानांतर ग्रंथों पर निर्भर होना, आकारिकी-समृद्ध भाषाओं के साथ इसकी समस्याएं (विशेषकर ऐसी भाषाओं में अनुवाद के साथ ), और सिंगलटन त्रुटियों को ठीक करने में इसकी अक्षमता शामिल है। उदाहरण के आधार परउदाहरण के आधार पर मशीन अनुवाद (EBMT) दृष्टिकोण द्वारा प्रस्तावित किया गया माकोटो नागाओ 1984 में [26] [27] उदाहरण के आधार पर मशीन अनुवाद सादृश्य के विचार पर आधारित है। इस दृष्टिकोण में, उपयोग किया जाने वाला कोष वह होता है जिसमें वे पाठ होते हैं जिनका पहले ही अनुवाद किया जा चुका होता है। एक वाक्य को देखते हुए जिसका अनुवाद किया जाना है, इस कॉर्पस से वाक्यों का चयन किया जाता है जिनमें समान उप-संवेदी घटक होते हैं। [२८] मूल वाक्य के उप-संवेदी घटकों को लक्ष्य भाषा में अनुवाद करने के लिए समान वाक्यों का उपयोग किया जाता है, और इन वाक्यांशों को एक पूर्ण अनुवाद बनाने के लिए एक साथ रखा जाता है। हाइब्रिड एमटीहाइब्रिड मशीन अनुवाद (एचएमटी) सांख्यिकीय और नियम-आधारित अनुवाद पद्धतियों की ताकत का लाभ उठाता है। [२९] कई एमटी संगठन एक संकर दृष्टिकोण का दावा करते हैं जो नियमों और आंकड़ों दोनों का उपयोग करता है। दृष्टिकोण कई मायनों में भिन्न हैं:
हाल ही में, न्यूरल एमटी के आगमन के साथ, हाइब्रिड मशीन अनुवाद का एक नया संस्करण उभर रहा है जो नियमों, सांख्यिकीय और तंत्रिका मशीन अनुवाद के लाभों को जोड़ता है। दृष्टिकोण नियम निर्देशित कार्यप्रवाह में पूर्व और बाद के प्रसंस्करण से लाभान्वित होने के साथ-साथ एनएमटी और एसएमटी से लाभान्वित होने की अनुमति देता है। नकारात्मक पक्ष अंतर्निहित जटिलता है जो दृष्टिकोण को केवल विशिष्ट उपयोग के मामलों के लिए उपयुक्त बनाती है। तंत्रिका एमटीएमटी के लिए एक गहन शिक्षण आधारित दृष्टिकोण, तंत्रिका मशीन अनुवाद ने हाल के वर्षों में तेजी से प्रगति की है, और Google ने घोषणा की है कि इसकी अनुवाद सेवाएं अब इस तकनीक का उपयोग अपने पिछले सांख्यिकीय तरीकों को प्राथमिकता में कर रही हैं। [३०] माइक्रोसॉफ्ट टीम ने 2018 में WMT-2017 ("EMNLP 2017 सेकेंड कॉन्फ्रेंस ऑन मशीन ट्रांसलेशन") पर मानव समता तक पहुंचने का दावा किया और यह एक ऐतिहासिक मील का पत्थर था। [३१] [३२] हालांकि, कई शोधकर्ता इस दावे की आलोचना कर रहे हैं और अपने प्रयोगों को फिर से चला रहे हैं, और चर्चा की है कि प्राप्त तथाकथित मानव समता वास्तविक नहीं है, और यह केवल सीमित डोमेन, भाषा जोड़े और कुछ परीक्षण पर आधारित है। सूट [३३] , उदाहरण के लिए सांख्यिकीय महत्व शक्ति की कमी [३४] एनएमटी के वास्तविक मानव समता प्रदर्शन तक पहुंचने से पहले यह अभी भी एक लंबी यात्रा है। मुहावरेदार वाक्यांश अनुवाद, बहु-शब्द अभिव्यक्ति [३५] और कम आवृत्ति वाले शब्दों को संबोधित करने के लिए, जिन्हें ओओवी (शब्दावली से बाहर) शब्द अनुवाद भी कहा जाता है, अत्याधुनिक तंत्रिका मशीन अनुवाद में भाषा-केंद्रित भाषाई विशेषताओं का पता लगाया गया है। (एनएमटी) मॉडल। उदाहरण के लिए, चीनी चरित्र का मूलक और स्ट्रोक में अपघटन [३६] [३७] एनएमटी में बहु-शब्द अभिव्यक्तियों के अनुवाद के लिए मददगार साबित हुआ है। प्रमुख मुद्दोंमशीनी अनुवाद कुछ गैर-समझने योग्य वाक्यांश उत्पन्न कर सकता है। टूटी चीनी "沒有進入" बाली, इंडोनेशिया में मशीनी अनुवाद से । टूटा हुआ चीनी वाक्य ऐसा लगता है जैसे "कोई प्रविष्टि मौजूद नहीं है" या "अभी तक प्रवेश नहीं किया है" बहुविकल्पीजब किसी शब्द के एक से अधिक अर्थ हो सकते हैं, तो शब्द-बोध का एक उपयुक्त अनुवाद खोजने से संबंधित है। यह समस्या पहली बार 1950 के दशक में येहोशुआ बार-हिलेल द्वारा उठाई गई थी । [३८] उन्होंने बताया कि "सार्वभौमिक विश्वकोश" के बिना, एक मशीन कभी भी एक शब्द के दो अर्थों के बीच अंतर करने में सक्षम नहीं होगी। [३९] आज इस समस्या को दूर करने के लिए कई तरीके तैयार किए गए हैं। उन्हें लगभग "उथले" दृष्टिकोण और "गहरे" दृष्टिकोणों में विभाजित किया जा सकता है। उथले दृष्टिकोण पाठ का कोई ज्ञान नहीं मानते हैं। वे अस्पष्ट शब्द के आस-पास के शब्दों के लिए केवल सांख्यिकीय विधियों को लागू करते हैं। गहरे दृष्टिकोण शब्द के व्यापक ज्ञान का अनुमान लगाते हैं। अब तक, उथले दृष्टिकोण अधिक सफल रहे हैं। [40] संयुक्त राष्ट्र और विश्व स्वास्थ्य संगठन के लिए लंबे समय तक अनुवादक रहे क्लॉड पिरोन ने लिखा है कि मशीनी अनुवाद, अनुवादक के काम के आसान हिस्से को स्वचालित करता है; कठिन और अधिक समय लेने वाली हिस्सा आम तौर पर हल करने के लिए व्यापक अनुसंधान कर रही शामिल है अस्पष्टता में स्रोत पाठ , जो व्याकरण और शाब्दिक की बाध्यताओं लक्ष्य भाषा से हल किया जा करने की आवश्यकता है: एक अनुवादक को पाँच पृष्ठों का अनुवाद करने के लिए पूरे कार्यदिवस की आवश्यकता क्यों होती है, न कि एक या दो घंटे की? ..... औसत पाठ का लगभग 90% इन साधारण स्थितियों से मेल खाता है। लेकिन दुर्भाग्य से, अन्य 10% है। यह वह हिस्सा है जिसके लिए छह [अधिक] घंटे काम की आवश्यकता होती है। ऐसी अस्पष्टताएं हैं जिन्हें हल करना है। उदाहरण के लिए, स्रोत पाठ के लेखक, एक ऑस्ट्रेलियाई चिकित्सक ने एक महामारी के उदाहरण का हवाला दिया जिसे द्वितीय विश्व युद्ध के दौरान "युद्ध शिविर के जापानी कैदियों" में घोषित किया गया था। क्या वह जापानी कैदियों के साथ एक अमेरिकी शिविर या अमेरिकी कैदियों के साथ एक जापानी शिविर के बारे में बात कर रहा था? अंग्रेजों की दो इंद्रियां हैं। इसलिए शोध करना आवश्यक है, शायद ऑस्ट्रेलिया को एक फोन कॉल की सीमा तक। [41]आदर्श गहन दृष्टिकोण के लिए अनुवाद सॉफ़्टवेयर की आवश्यकता होगी कि वह इस प्रकार की अस्पष्टता के लिए आवश्यक सभी शोध स्वयं ही करे; लेकिन इसके लिए एआई की उच्च डिग्री की आवश्यकता होगी जो अभी तक प्राप्त नहीं हुई है। एक उथला दृष्टिकोण जो अस्पष्ट अंग्रेजी वाक्यांश के अर्थ में अनुमान लगाया गया है कि पिरोन का उल्लेख है (आधारित, शायद, किस तरह के कैदी-ऑफ-युद्ध शिविर का उल्लेख अक्सर किसी दिए गए कॉर्पस में किया जाता है) के पास गलत अनुमान लगाने का उचित मौका होगा अक्सर। एक उथला दृष्टिकोण जिसमें "उपयोगकर्ता से प्रत्येक अस्पष्टता के बारे में पूछें" शामिल है, पिरोन के अनुमान के अनुसार, केवल एक पेशेवर अनुवादक की नौकरी का लगभग 25% स्वचालित होगा, जिससे मानव द्वारा अभी भी 75% कठिन काम करना बाकी है। गैर-मानक भाषणएमटी के प्रमुख नुकसानों में से एक मानक भाषा के समान सटीकता के साथ गैर-मानक भाषा का अनुवाद करने में असमर्थता है। अनुमानी या सांख्यिकीय आधारित एमटी भाषा के मानक रूप में विभिन्न स्रोतों से इनपुट लेता है। नियम-आधारित अनुवाद, स्वभाव से, सामान्य गैर-मानक उपयोगों को शामिल नहीं करता है। यह किसी स्थानीय स्रोत से या बोलचाल की भाषा में अनुवाद में त्रुटियों का कारण बनता है। आकस्मिक भाषण से अनुवाद पर सीमाएं मोबाइल उपकरणों में मशीनी अनुवाद के उपयोग में समस्याएं पेश करती हैं। नामित संस्थाएंमें सूचना निष्कर्षण जार्ज वाशिंगटन, शिकागो, माइक्रोसॉफ्ट: नाम संस्थाओं, एक संकीर्ण अर्थ में, ठोस या अमूर्त संस्थाओं के लिए असली दुनिया में ऐसे लोगों, संगठनों, कंपनियों, और स्थानों एक उचित नाम है के रूप में देखें। यह 1 जुलाई 2011, $500 जैसे समय, स्थान और मात्रा के भावों को भी संदर्भित करता है। वाक्य में "स्मिथ फैब्रियोनिक्स का अध्यक्ष है" स्मिथ और फैब्रियोनिक्स दोनों को संस्थाओं का नाम दिया गया है, और इसे पहले नाम या अन्य जानकारी के माध्यम से आगे योग्य बनाया जा सकता है; "अध्यक्ष" नहीं है, क्योंकि स्मिथ पहले फैब्रियोनिक्स में एक और पद धारण कर सकते थे, जैसे उपाध्यक्ष। कठोर डिज़ाइनर शब्द सांख्यिकीय मशीन अनुवाद में विश्लेषण के लिए इन उपयोगों को परिभाषित करता है। नामांकित निकायों को पहले पाठ में पहचाना जाना चाहिए; यदि नहीं, तो उनका गलती से सामान्य संज्ञा के रूप में अनुवाद किया जा सकता है, जो संभवतः अनुवाद की BLEU रेटिंग को प्रभावित नहीं करेगा, लेकिन पाठ की मानवीय पठनीयता को बदल देगा। [४२] उन्हें आउटपुट अनुवाद से हटाया जा सकता है, जिसका पाठ की पठनीयता और संदेश पर भी प्रभाव पड़ेगा। लिप्यंतरण में लक्ष्य भाषा में उन अक्षरों को खोजना शामिल है जो स्रोत भाषा में नाम के सबसे निकट से मेल खाते हैं। हालाँकि, इसे कभी-कभी अनुवाद की गुणवत्ता को बिगड़ने के रूप में उद्धृत किया गया है। [४३] "दक्षिणी कैलिफोर्निया" के लिए पहले शब्द का सीधे अनुवाद किया जाना चाहिए, जबकि दूसरे शब्द का लिप्यंतरण किया जाना चाहिए। मशीनें अक्सर दोनों का लिप्यंतरण करती हैं क्योंकि वे उन्हें एक इकाई के रूप में मानते हैं। मशीनी अनुवादकों के लिए इस तरह के शब्दों को प्रोसेस करना मुश्किल है, यहां तक कि लिप्यंतरण घटक वाले भी। "अनुवाद न करें" सूची का उपयोग, जिसका एक ही अंतिम लक्ष्य है - अनुवाद के विपरीत लिप्यंतरण। [४४] अभी भी नामित संस्थाओं की सही पहचान पर निर्भर है। तीसरा दृष्टिकोण वर्ग-आधारित मॉडल है। नामित संस्थाओं को उनके "वर्ग" का प्रतिनिधित्व करने के लिए एक टोकन से बदल दिया जाता है; "टेड" और "एरिका" दोनों को "व्यक्ति" वर्ग टोकन से बदल दिया जाएगा। फिर व्यक्तिगत रूप से "टेड" और "एरिका" के वितरण को देखने के बजाय, सामान्य रूप से व्यक्ति के नामों के सांख्यिकीय वितरण और उपयोग का विश्लेषण किया जा सकता है, ताकि किसी विशिष्ट भाषा में दिए गए नाम की संभावना निर्दिष्ट संभावना को प्रभावित न करे। एक अनुवाद का। अनुवाद के इस क्षेत्र में सुधार पर स्टैनफोर्ड द्वारा किए गए एक अध्ययन से उदाहरण मिलता है कि विभिन्न संभावनाओं को "डेविड इज गोइंग फॉर वॉक" और "अंकित इज गोइंग फॉर वॉक" अंग्रेजी के लिए लक्ष्य भाषा के रूप में अलग-अलग घटनाओं के कारण असाइन किया जाएगा। प्रशिक्षण डेटा में प्रत्येक नाम के लिए। स्टैनफोर्ड (और नामित मान्यता अनुवाद को बेहतर बनाने के अन्य प्रयास) द्वारा एक ही अध्ययन का एक निराशाजनक परिणाम यह है कि कई बार, अनुवाद के लिए BLEU स्कोर में कमी नामित इकाई अनुवाद के तरीकों को शामिल करने के परिणामस्वरूप होगी। [44] "दूध के साथ चाय पीना" बनाम "मौली के साथ चाय पीना" वाक्यांश कुछ हद तक संबंधित हैं। बहु-समानांतर स्रोतों से अनुवादमल्टीपैरेलल कॉरपोरा के उपयोग में कुछ काम किया गया है , जो कि पाठ का एक निकाय है जिसका 3 या अधिक भाषाओं में अनुवाद किया गया है। इन विधियों का उपयोग करते हुए, एक पाठ जिसका 2 या अधिक भाषाओं में अनुवाद किया गया है, का उपयोग संयोजन में तीसरी भाषा में अधिक सटीक अनुवाद प्रदान करने के लिए किया जा सकता है, यदि उन स्रोत भाषाओं में से केवल एक का अकेले उपयोग किया गया था। [45] [46] [47] एमटी . में ऑन्कोलॉजीएक ऑन्कोलॉजी ज्ञान का एक औपचारिक प्रतिनिधित्व है जिसमें एक डोमेन में अवधारणाएं (जैसे वस्तुएं, प्रक्रियाएं आदि) और उनके बीच कुछ संबंध शामिल हैं। यदि संग्रहीत जानकारी भाषाई प्रकृति की है, तो कोई एक शब्दकोष की बात कर सकता है। [48] में NLP , ontologies मशीन अनुवाद प्रणालियों के लिए ज्ञान का एक स्रोत के रूप में इस्तेमाल किया जा सकता। एक बड़े ज्ञान आधार तक पहुंच के साथ, सिस्टम को कई (विशेष रूप से शाब्दिक) अस्पष्टताओं को स्वयं हल करने के लिए सक्षम किया जा सकता है। निम्नलिखित क्लासिक उदाहरणों में, मनुष्य के रूप में, हम संदर्भ के अनुसार पूर्वसर्गिक वाक्यांश की व्याख्या करने में सक्षम हैं क्योंकि हम अपने विश्व ज्ञान का उपयोग करते हैं, जो हमारे शब्दकोष में संग्रहीत है:
एक मशीनी अनुवाद प्रणाली शुरू में अर्थों के बीच अंतर करने में सक्षम नहीं होगी क्योंकि वाक्यविन्यास नहीं बदलता है। हालांकि, ज्ञान के स्रोत के रूप में काफी बड़े ऑन्कोलॉजी के साथ, एक विशिष्ट संदर्भ में अस्पष्ट शब्दों की संभावित व्याख्याओं को कम किया जा सकता है। एनएलपी के भीतर ऑन्कोलॉजी के उपयोग के अन्य क्षेत्रों में सूचना पुनर्प्राप्ति , सूचना निष्कर्षण और पाठ सारांश शामिल हैं । [48] बिल्डिंग ऑन्कोलॉजी1993 में PANGLOSS ज्ञान-आधारित मशीन अनुवाद प्रणाली के लिए उत्पन्न ऑन्कोलॉजी एक उदाहरण के रूप में काम कर सकती है कि NLP उद्देश्यों के लिए एक ऑन्कोलॉजी कैसे संकलित की जा सकती है: [49]
अनुप्रयोगजबकि कोई भी प्रणाली अप्रतिबंधित पाठ के पूरी तरह से स्वचालित उच्च-गुणवत्ता वाले मशीनी अनुवाद की पवित्र कब्र प्रदान नहीं करती है, कई पूरी तरह से स्वचालित सिस्टम उचित आउटपुट का उत्पादन करते हैं। [५०] [५१] [५२] यदि डोमेन को प्रतिबंधित और नियंत्रित किया जाए तो मशीनी अनुवाद की गुणवत्ता में काफी सुधार होता है। [53] अपनी अंतर्निहित सीमाओं के बावजूद, दुनिया भर में एमटी कार्यक्रमों का उपयोग किया जाता है। संभवतः सबसे बड़ा संस्थागत उपयोगकर्ता यूरोपीय आयोग है । मोल्टो परियोजना, उदाहरण के लिए, गोथेनबर्ग विश्वविद्यालय द्वारा समन्वित,एक विश्वसनीय अनुवाद उपकरण बनाने के लिए यूरोपीय संघ से 2.375 मिलियन यूरो से अधिक परियोजना समर्थन प्राप्त किया, जो यूरोपीय संघ की अधिकांश भाषाओं को कवर करता है। [५४] एमटी सिस्टम का आगे विकास ऐसे समय में हुआ है जब मानव अनुवाद में बजट में कटौती से विश्वसनीय एमटी कार्यक्रमों पर यूरोपीय संघ की निर्भरता बढ़ सकती है। [५५] यूरोपीय आयोग ने पिछले नियम-आधारित मशीन अनुवाद प्रणाली को बदलने के लिए यूरोपीय संघ की प्रशासनिक आवश्यकताओं के अनुरूप एक सांख्यिकीय मशीन अनुवाद कार्यक्रम एमटी@ईसी के निर्माण के लिए ३.०७२ मिलियन यूरो (अपने आईएसए कार्यक्रम के माध्यम से) का योगदान दिया। [56]2005 में, Google ने दावा किया कि एक मालिकाना सांख्यिकीय मशीन अनुवाद इंजन का उपयोग करके आशाजनक परिणाम प्राप्त किए गए थे। [५७] अरबी भाषा के लिए Google भाषा टूल में प्रयुक्त सांख्यिकीय अनुवाद इंजन <-> अंग्रेजी और चीनी <-> अंग्रेजी का कुल स्कोर ०.४२८१ था, जो आयोजित परीक्षणों में आईबीएम के बीएलईयू-४ स्कोर ०.३९५४ (ग्रीष्मकालीन २००६) से अधिक था। राष्ट्रीय मानक और प्रौद्योगिकी संस्थान द्वारा। [५८] [५९] [६०] हाल ही में आतंकवाद पर ध्यान केंद्रित करने के साथ, संयुक्त राज्य में सैन्य स्रोत प्राकृतिक भाषा इंजीनियरिंग में महत्वपूर्ण मात्रा में निवेश कर रहे हैं। इन-क्यू-टेल [६१] ( निजी क्षेत्र के उद्यमियों के माध्यम से नई प्रौद्योगिकियों को प्रोत्साहित करने के लिए बड़े पैमाने पर यूएस इंटेलिजेंस कम्युनिटी द्वारा वित्त पोषित एक उद्यम पूंजी कोष) ने लैंग्वेज वीवर जैसी कंपनियों को लाया । वर्तमान में सैन्य समुदाय अरबी , पश्तो और दारी जैसी भाषाओं के अनुवाद और प्रसंस्करण में रुचि रखता है । [ उद्धरण वांछित ] इन भाषाओं के भीतर, मोबाइल फोन ऐप के उपयोग के माध्यम से प्रमुख वाक्यांशों और सैन्य सदस्यों और नागरिकों के बीच त्वरित संचार पर ध्यान केंद्रित किया जाता है। [६२] DARPA में सूचना प्रसंस्करण प्रौद्योगिकी कार्यालय TIDES और बाबुल अनुवादक जैसे कार्यक्रमों की मेजबानी करता है । अमेरिकी वायु सेना ने भाषा अनुवाद तकनीक विकसित करने के लिए $ 1 मिलियन का अनुबंध दिया है। [63] हाल के वर्षों में वेब पर सोशल नेटवर्किंग की उल्लेखनीय वृद्धि ने मशीन अनुवाद सॉफ़्टवेयर के अनुप्रयोग के लिए एक और जगह बनाई है - फेसबुक जैसी उपयोगिताओं में, या स्काइप, GoogleTalk, एमएसएन मैसेंजर इत्यादि जैसे त्वरित संदेश क्लाइंट - उपयोगकर्ताओं को बोलने की इजाजत देता है एक दूसरे के साथ संवाद करने के लिए विभिन्न भाषाएं। मोबाइल टेलीफोन, पॉकेट पीसी, पीडीए आदि सहित अधिकांश मोबाइल उपकरणों के लिए मशीनी अनुवाद एप्लिकेशन भी जारी किए गए हैं। उनकी पोर्टेबिलिटी के कारण, ऐसे उपकरणों को मोबाइल अनुवाद उपकरण के रूप में नामित किया गया है, जो विभिन्न भाषा बोलने वाले भागीदारों के बीच मोबाइल व्यापार नेटवर्किंग को सक्षम बनाता है, या मानव अनुवादक की मध्यस्थता की आवश्यकता के बिना विदेशी भाषा सीखने और विदेश यात्रा के लिए बेहिसाब यात्रा दोनों की सुविधा प्रदान करना। संयुक्त राज्य सरकार द्वारा एक साथ रखी गई स्वचालित भाषा प्रसंस्करण सलाहकार समिति द्वारा १९६६ में मानव अनुवाद के लिए एक अयोग्य प्रतियोगी के रूप में लेबल किए जाने के बावजूद, [६४] मशीनी अनुवाद की गुणवत्ता में अब इस स्तर तक सुधार किया गया है कि ऑनलाइन सहयोग में इसका अनुप्रयोग और चिकित्सा क्षेत्र की जांच की जा रही है। चिकित्सा सेटिंग्स में इस तकनीक का अनुप्रयोग जहां मानव अनुवादक अनुपस्थित हैं, अनुसंधान का एक अन्य विषय है, लेकिन चिकित्सा निदान में सटीक अनुवाद के महत्व के कारण कठिनाइयां उत्पन्न होती हैं। [65] मूल्यांकनमशीनी अनुवाद प्रणाली के मूल्यांकन के तरीके को प्रभावित करने वाले कई कारक हैं। इन कारकों में अनुवाद का इच्छित उपयोग, मशीनी अनुवाद सॉफ़्टवेयर की प्रकृति और अनुवाद प्रक्रिया की प्रकृति शामिल है। विभिन्न उद्देश्यों के लिए विभिन्न कार्यक्रम अच्छी तरह से काम कर सकते हैं। उदाहरण के लिए, सांख्यिकीय मशीन अनुवाद (एसएमटी) आमतौर पर उदाहरण-आधारित मशीन अनुवाद (ईबीएमटी) से बेहतर प्रदर्शन करता है, लेकिन शोधकर्ताओं ने पाया कि अंग्रेजी से फ्रेंच अनुवाद का मूल्यांकन करते समय, ईबीएमटी बेहतर प्रदर्शन करता है। [६६] यही अवधारणा तकनीकी दस्तावेजों के लिए भी लागू होती है, जिसका एसएमटी द्वारा उनकी औपचारिक भाषा के कारण अधिक आसानी से अनुवाद किया जा सकता है। हालांकि, कुछ अनुप्रयोगों में, उदाहरण के लिए, नियंत्रित भाषा में लिखे गए उत्पाद विवरण , एक शब्दकोश-आधारित मशीन-अनुवाद प्रणाली ने संतोषजनक अनुवाद तैयार किए हैं जिनके लिए गुणवत्ता निरीक्षण के अलावा किसी मानवीय हस्तक्षेप की आवश्यकता नहीं है। [67] मशीनी अनुवाद प्रणालियों की आउटपुट गुणवत्ता का मूल्यांकन करने के लिए विभिन्न साधन हैं। अनुवाद की गुणवत्ता का आकलन करने के लिए मानव न्यायाधीशों [68] का उपयोग सबसे पुराना है । भले ही मानव मूल्यांकन समय लेने वाला है, फिर भी यह नियम-आधारित और सांख्यिकीय प्रणालियों जैसे विभिन्न प्रणालियों की तुलना करने के लिए सबसे विश्वसनीय तरीका है। [६९] मूल्यांकन के स्वचालित साधनों में BLEU , NIST , METEOR , और LEPOR शामिल हैं । [70] असंपादित मशीनी अनुवाद पर विशेष रूप से भरोसा करने से इस तथ्य की उपेक्षा होती है कि मानव भाषा में संचार संदर्भ-अंतर्निहित है और यह कि एक व्यक्ति को मूल पाठ के संदर्भ को उचित संभावना के साथ समझने की आवश्यकता होती है। यह निश्चित रूप से सच है कि विशुद्ध रूप से मानव-जनित अनुवादों में भी त्रुटि की संभावना होती है। इसलिए, यह सुनिश्चित करने के लिए कि मशीन द्वारा निर्मित अनुवाद मानव के लिए उपयोगी होगा और प्रकाशन योग्य गुणवत्ता वाला अनुवाद प्राप्त किया जाता है, ऐसे अनुवादों की समीक्षा और संपादन मानव द्वारा किया जाना चाहिए। [७१] स्वर्गीय क्लॉड पिरोन ने लिखा है कि मशीनी अनुवाद, अनुवादक के काम के आसान हिस्से को अपने सबसे अच्छे रूप में स्वचालित करता है; कठिन और अधिक समय लेने वाले हिस्से में आमतौर पर स्रोत पाठ में अस्पष्टताओं को हल करने के लिए व्यापक शोध करना शामिल होता है , जिसे लक्षित भाषा की व्याकरणिक और शाब्दिक आवश्यकताओं को हल करने की आवश्यकता होती है। मशीन-अनुवाद सॉफ़्टवेयर के लिए इनपुट प्रदान करने के लिए आवश्यक पूर्व-संपादन के लिए ऐसा शोध एक आवश्यक प्रस्तावना है ताकि आउटपुट अर्थहीन न हो । [72] असंबद्धता की समस्याओं के अलावा, मशीन अनुवाद कार्यक्रमों के लिए प्रशिक्षण डेटा के विभिन्न स्तरों के कारण घटी हुई सटीकता हो सकती है। उदाहरण-आधारित और सांख्यिकीय मशीनी अनुवाद दोनों अनुवाद के आधार के रूप में वास्तविक उदाहरण वाक्यों की एक विशाल सरणी पर निर्भर करते हैं, और जब बहुत अधिक या बहुत कम वाक्यों का विश्लेषण किया जाता है तो सटीकता खतरे में पड़ जाती है। शोधकर्ताओं ने पाया कि जब एक प्रोग्राम को 203,529 वाक्य युग्मों पर प्रशिक्षित किया जाता है, तो सटीकता वास्तव में कम हो जाती है। [६६] प्रशिक्षण डेटा का इष्टतम स्तर केवल १००,००० वाक्यों से अधिक प्रतीत होता है, संभवतः क्योंकि जैसे-जैसे प्रशिक्षण डेटा बढ़ता है, संभावित वाक्यों की संख्या बढ़ती जाती है, जिससे सटीक अनुवाद मिलान खोजना कठिन हो जाता है। शिक्षण उपकरण के रूप में मशीनी अनुवाद का उपयोग करनाहालांकि मशीनी अनुवाद की सटीकता के बारे में चिंताएं हैं, मैनचेस्टर विश्वविद्यालय के डॉ एना नीनो ने कक्षा में मशीनी अनुवाद के उपयोग के कुछ लाभों पर शोध किया है। ऐसी ही एक शैक्षणिक पद्धति को "MT as a Bad Model" का प्रयोग करना कहा जाता है। [७३] एक खराब मॉडल के रूप में एमटी भाषा सीखने वाले को अनुवाद की विसंगतियों या गलत पहलुओं की पहचान करने के लिए मजबूर करता है; बदले में, व्यक्ति (उम्मीद है) के पास भाषा की बेहतर समझ होगी। डॉ. नीनो बताते हैं कि यह शिक्षण उपकरण 1980 के दशक के अंत में लागू किया गया था। विभिन्न सेमेस्टर के अंत में, डॉ नीनो उन छात्रों से सर्वेक्षण के परिणाम प्राप्त करने में सक्षम थे, जिन्होंने एमटी को एक खराब मॉडल (साथ ही अन्य मॉडल) के रूप में इस्तेमाल किया था। भारी रूप से, छात्रों ने महसूस किया कि उन्होंने बेहतर समझ, शाब्दिक पुनर्प्राप्ति और वृद्धि हुई है। अपनी लक्षित भाषा में विश्वास। [73] मशीनी अनुवाद और हस्ताक्षरित भाषाएँ2000 के दशक की शुरुआत में, बोली जाने वाली और हस्ताक्षरित भाषाओं के बीच मशीनी अनुवाद के विकल्प गंभीर रूप से सीमित थे। यह एक आम धारणा थी कि बधिर व्यक्ति पारंपरिक अनुवादकों का उपयोग कर सकते हैं। हालांकि, हस्ताक्षरित भाषाओं की तुलना में बोली जाने वाली भाषाओं में तनाव, स्वर, पिच और समय को बहुत अलग तरीके से व्यक्त किया जाता है। इसलिए, एक बधिर व्यक्ति बोली जाने वाली भाषा पर आधारित लिखित पाठ के अर्थ के बारे में गलत व्याख्या या भ्रमित हो सकता है। [74] शोधकर्ता झाओ, एट अल। (2000) ने टीम नामक एक प्रोटोटाइप विकसित किया (मशीन द्वारा अंग्रेजी से एएसएल में अनुवाद) जिसने अंग्रेजी से अमेरिकी सांकेतिक भाषा (एएसएल) अनुवादों को पूरा किया। कार्यक्रम पहले अंग्रेजी पाठ के वाक्यात्मक, व्याकरणिक और रूपात्मक पहलुओं का विश्लेषण करेगा। इस कदम के बाद, प्रोग्राम ने एक साइन सिंथेसाइज़र का उपयोग किया, जो एएसएल के लिए एक शब्दकोश के रूप में कार्य करता था। इस सिंथेसाइज़र ने एएसएल संकेतों को पूरा करने के साथ-साथ इन संकेतों के अर्थों को पूरा करने के लिए प्रक्रिया का पालन किया। एक बार जब पूरे पाठ का विश्लेषण किया जाता है और अनुवाद को पूरा करने के लिए आवश्यक संकेत सिंथेसाइज़र में स्थित होते हैं, तो एक कंप्यूटर जनित मानव दिखाई देता है और उपयोगकर्ता को अंग्रेजी पाठ पर हस्ताक्षर करने के लिए एएसएल का उपयोग करेगा। [74] कॉपीराइटकेवल काम करता है कि कर रहे हैं मूल के अधीन हैं कॉपीराइट तो कुछ विद्वानों का दावा है कि मशीन अनुवाद परिणाम कॉपीराइट संरक्षण के हकदार नहीं हैं क्योंकि मीट्रिक टन शामिल नहीं है, सुरक्षा रचनात्मकता । [७५] इस मुद्दे पर कॉपीराइट एक व्युत्पन्न कार्य के लिए है ; मूल भाषा में मूल कार्य का लेखक किसी कार्य का अनुवाद होने पर अपने अधिकारों को नहीं खोता है: एक अनुवादक के पास अनुवाद प्रकाशित करने की अनुमति होनी चाहिए । यह सभी देखें
टिप्पणियाँ
|