क्या किसी रोबोट ने यह लिखा है? एआई को स्पॉट करने के लिए हमें वॉटरमार्क चाहिए

आश्चर्यजनक रचनात्मक क्षमताओं के साथ एक प्रतिभाशाली मुंशी एक सनसनीखेज शुरुआत कर रहा है। ChatGPT, सैन फ्रांसिस्को स्थित OpenAI की एक टेक्स्ट-जेनरेशन सिस्टम है, जो हाल ही में सार्वजनिक रूप से रिलीज़ होने के बाद निबंध, स्क्रीनप्ले और लिमेरिक्स लिख रहा है, आमतौर पर सेकंड में और अक्सर उच्च स्तर पर। यहां तक ​​कि इसके जोक्स भी फनी हो सकते हैं। आर्टिफिशियल इंटेलिजेंस के क्षेत्र में कई वैज्ञानिक इस बात से अचंभित हैं कि यह इंसानों की तरह कैसे लगता है।

और उल्लेखनीय रूप से, यह जल्द ही बेहतर हो जाएगा। ओपनएआई व्यापक रूप से आने वाले महीनों में GPT-4 के रूप में जाना जाने वाला अपना अगला पुनरावृत्ति जारी करने की उम्मीद है, और शुरुआती परीक्षकों का कहना है कि यह पहले आई किसी भी चीज़ से बेहतर है।

लेकिन ये सभी सुधार कीमत के साथ आते हैं। एआई जितना बेहतर होगा, मानव और मशीन-निर्मित पाठ के बीच अंतर करना उतना ही कठिन होगा। OpenAI को मशीनों के काम को लेबल करने के अपने प्रयासों को प्राथमिकता देने की आवश्यकता है या हम जल्द ही ऑनलाइन वास्तविक और नकली जानकारी के भ्रामक मिश्मश से अभिभूत हो सकते हैं।

अभी के लिए, यह लोगों पर ईमानदार होने का भार डाल रहा है। के लिए OpenAI की नीति चैटजीपीटी कहा गया है कि अपने सिस्टम से सामग्री साझा करते समय, उपयोगकर्ताओं को स्पष्ट रूप से संकेत देना चाहिए कि यह एआई द्वारा “इस तरह से उत्पन्न किया गया है कि कोई पाठक संभवतः याद नहीं कर सकता” या गलत समझा।

इसके लिए मैं कहता हूं, गुड लक।

एआई लगभग निश्चित रूप से कॉलेज निबंध को मारने में मदद करेगा। (न्यूजीलैंड में एक छात्र ने पहले ही स्वीकार कर लिया है कि उन्होंने इसका इस्तेमाल अपने ग्रेड को बढ़ावा देने में मदद करने के लिए किया था।) सरकारें इसका उपयोग प्रचार के साथ सामाजिक नेटवर्क बाढ़, नकली अमेज़ॅन समीक्षा लिखने के लिए स्पैमर और रैंसमवेयर गिरोहों को अधिक ठोस फ़िशिंग ईमेल लिखने के लिए करेंगी। पर्दे के पीछे कोई भी मशीन की ओर इशारा नहीं करेगा।

और आपको मेरी बात माननी होगी कि इस कॉलम को भी पूरी तरह से एक इंसान ने ही तैयार किया है।

एआई-जेनरेट किए गए टेक्स्ट को किसी प्रकार के वॉटरमार्क की सख्त जरूरत है, इसी तरह स्टॉक फोटो कंपनियां अपनी छवियों की रक्षा करती हैं और मूवी स्टूडियो पायरेसी को रोकते हैं। OpenAI के पास पहले से ही एक अन्य सामग्री-जनरेटिंग टूल को फ़्लैग करने का एक तरीका है दाल-ई उत्पन्न होने वाली प्रत्येक छवि में एक एम्बेडेड हस्ताक्षर के साथ। लेकिन पाठ के उद्गम को ट्रैक करना बहुत कठिन है। आप शब्दों पर एक गुप्त, मुश्किल-से-हटाने वाला लेबल कैसे लगाते हैं?

सबसे आशाजनक दृष्टिकोण क्रिप्टोग्राफी है। ऑस्टिन में टेक्सास विश्वविद्यालय में पिछले महीने एक अतिथि व्याख्यान में, OpenAI के शोध वैज्ञानिक स्कॉट आरोनसन ने एक दुर्लभ झलक दी कि कैसे कंपनी और भी अधिक मानवीय GPT-4 टूल द्वारा उत्पन्न पाठ को अलग कर सकती है।

एरोनसन, जिन्हें इस वर्ष OpenAI द्वारा मूल चुनौती से निपटने के लिए काम पर रखा गया था, ने समझाया कि शब्दों को टोकन की एक स्ट्रिंग में परिवर्तित किया जा सकता है, जो विराम चिह्नों, अक्षरों या शब्दों के कुछ हिस्सों का प्रतिनिधित्व करते हैं, कुल मिलाकर लगभग 100,000 टोकन बनाते हैं। GPT सिस्टम तब उन टोकन की व्यवस्था तय करेगा (स्वयं पाठ को दर्शाता है) इस तरह से कि उन्हें एक क्रिप्टोग्राफ़िक कुंजी का उपयोग करके पता लगाया जा सकता है जिसे केवल OpenAI के लिए जाना जाता है। “यह अंतिम उपयोगकर्ता के लिए कोई पता लगाने योग्य अंतर नहीं करेगा,” एरोनसन ने कहा।

वास्तव में, जो कोई भी GPT टूल का उपयोग करता है, उसे वॉटरमार्किंग सिग्नल को साफ़ करना मुश्किल होगा, यहां तक ​​कि शब्दों को पुनर्व्यवस्थित करने या विराम चिह्नों को निकालने से भी, उन्होंने कहा। इसे हराने का सबसे अच्छा तरीका यह होगा कि GPT टूल के आउटपुट की व्याख्या करने के लिए एक अन्य AI सिस्टम का उपयोग किया जाए। लेकिन इसमें मेहनत लगती है और हर कोई ऐसा नहीं करेगा। अपने व्याख्यान में, आरोनसन ने कहा कि उनके पास एक कार्यशील प्रोटोटाइप है।

लेकिन यह मानते हुए भी कि उनका तरीका लैब सेटिंग के बाहर काम करता है, OpenAI में अभी भी एक दुविधा है। क्या यह वॉटरमार्क कुंजियों को जनता के लिए जारी करता है, या उन्हें निजी तौर पर रखता है?

यदि चाबियों को सार्वजनिक किया जाता है, तो हर जगह प्रोफेसर यह सुनिश्चित करने के लिए अपने छात्रों के निबंधों को विशेष सॉफ्टवेयर के माध्यम से चला सकते हैं कि वे मशीन-जनित नहीं हैं, उसी तरह जैसे कि साहित्यिक चोरी की जांच के लिए अब कई लोग करते हैं। लेकिन इससे बुरे अभिनेताओं के लिए वॉटरमार्क का पता लगाना और उसे हटाना भी संभव हो जाएगा।

कुंजी को निजी रखना, इस बीच, OpenAI के लिए एक संभावित शक्तिशाली व्यवसाय मॉडल बनाता है: लोगों को एक्सेस के लिए चार्ज करना। आईटी प्रशासक फ़िशिंग हमलों के लिए आने वाले ईमेल को स्कैन करने के लिए एक सदस्यता का भुगतान कर सकते हैं, जबकि कॉलेज अपने प्रोफेसरों के लिए एक समूह शुल्क का भुगतान कर सकते हैं – और रैनसमवेयर गिरोहों और प्रचार लेखकों को बंद करने के लिए उपकरण का उपयोग करने की कीमत काफी अधिक होनी चाहिए। OpenAI अनिवार्य रूप से अपने स्वयं के निर्माण के दुरुपयोग को रोकने से पैसा कमाएगा।

हमें यह भी ध्यान में रखना चाहिए कि प्रौद्योगिकी कंपनियों के पास अपने सिस्टम के दुरुपयोग को रोकने के लिए सबसे अच्छा ट्रैक रिकॉर्ड नहीं है, खासकर जब वे अनियमित और लाभ-संचालित हैं। (OpenAI का कहना है कि यह एक हाइब्रिड प्रॉफिट और गैर-लाभकारी कंपनी है जो इसकी भविष्य की आय को सीमित कर देगी।) लेकिन OpenAI ने पहले से ही अपने टेक्स्ट और इमेज टूल्स को आपत्तिजनक कंटेंट जेनरेट करने से रोकने के लिए जो सख्त फिल्टर लगाए हैं, वह एक अच्छी शुरुआत है।

अब OpenAI को अपने पाठ के लिए वॉटरमार्किंग सिस्टम को प्राथमिकता देने की आवश्यकता है। हमारा भविष्य न केवल OpenAI के तेजी से लोकप्रिय उपकरणों से, बल्कि AI मॉडल को प्रशिक्षित करने और मानव-निर्मित डेटा को बदलने के लिए उपयोग किए जाने वाले नकली, “सिंथेटिक” डेटा में व्यापक वृद्धि से मशीन-जनित जानकारी से भर जाने के लिए तैयार है। छवियों, वीडियो, संगीत और अधिक तेजी से हमारे अति-वैयक्तिकृत स्वाद के अनुरूप कृत्रिम रूप से उत्पन्न होंगे।

यह निश्चित रूप से संभव है कि एआई से एक आकर्षक गीत या कार्टून उत्पन्न होने पर हमारे भविष्य की परवाह नहीं होगी। समय के साथ मानवीय मूल्य बदलते हैं; उदाहरण के लिए, हम 20 साल पहले की तुलना में अब तथ्यों और ड्राइविंग दिशाओं को याद करने के बारे में बहुत कम परवाह करते हैं। तो किसी बिंदु पर वॉटरमार्क इतने आवश्यक नहीं लग सकते हैं।

लेकिन अभी के लिए, मानव सरलता पर ठोस मूल्य के साथ, जिसके लिए अन्य लोग भुगतान करते हैं, या ग्रेड देते हैं, और निकट निश्चितता के साथ कि OpenAI के उपकरण का दुरुपयोग किया जाएगा, हमें यह जानने की आवश्यकता है कि मानव मस्तिष्क कहाँ रुकता है और मशीनें शुरू होती हैं। वॉटरमार्क एक अच्छी शुरुआत होगी।

© 2022 ब्लूमबर्ग एल.पी


आज एक किफायती 5G स्मार्टफोन खरीदने का आमतौर पर मतलब है कि आप “5G टैक्स” चुकाएंगे। लॉन्च होते ही 5G नेटवर्क तक पहुंच पाने की चाहत रखने वालों के लिए इसका क्या मतलब है? जानिए इस हफ्ते के एपिसोड में। कक्षीय पर उपलब्ध है Spotify, गाना, JioSaavn, गूगल पॉडकास्ट, सेब पॉडकास्ट, अमेज़न संगीत और जहां भी आपको अपना पॉडकास्ट मिलता है।
संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – हमारा देखें नैतिक वक्तव्य ब्योरा हेतु।

Leave a Comment