भाषाओं पर भद्दा मजाक करता गूगल, कन्नड़ को बताया बुरी भाषा

Begin typing your search above and press return to search.

Home
/
जनज्वार विशेष
/
भाषाओं पर भद्दा मजाक...

भाषाओं पर भद्दा मजाक करता गूगल, कन्नड़ को बताया बुरी भाषा

(कन्नड़ को सबसे भद्दी भाषा वाले विवाद के बढ़ने के बाद गूगल ने इसे हटा लिया, एक माफीनामा प्रकाशित किया)

गूगल पर अब आप भारत की सबसे बेढंगी भाषा का जवाब खोजेंगे तो केवल गूगल के कन्नड़ विवाद से सम्बंधित समाचारपत्रों और वेबसाइट पर प्रकाशित आर्टिकल ही मिलेंगे....

महेंद्र पाण्डेय की टिप्पणी

जनज्वार। भाषाओं पर समाचार कम ही बनते हैं, और जो समाचार बनते भी हैं तो वे भाषा के विकास से अधिक लोगों की मानसिकता से सम्बंधित होते हैं। दो वर्ष पहले अमित शाह ने हिंदी को राष्ट्रभाषा बनाने से सम्बंधित बयान दिया था, जिसके बाद हिंदी के पक्ष और विपक्ष में बहुत प्रतिक्रियाएं आईं। पर इन विचारों में हिंदी भाषा से अधिक चर्चा इसे श्रेष्ठ साबित करने या फिर स्थानीय भाषाओं से कमतर आंकने पर हुई। भाषा पर दूसरी चर्चा जो होती है उसके अनुसार बहुत सारी भाषाएँ और बोलियाँ विलुप्त होती जा रही हैं।

हाल में ही सर्च इंजन गूगल ने भाषा पर एक नए विवाद को जन्म दिया। पिछले सप्ताह सबसे बेढंगी भारतीय भाषा का जवाब गूगल कन्नड़ को बता रहा था। जाहिर है, इसके बाद एक नया विवाद शुरू हो गया और इसके बाद अब गूगल ने माफी मांग ली है और बताया है कि जब भी हम गूगल पर कुछ खोजते हैं तब गूगल जवाब नहीं देता, बल्कि यह आर्टिफीसियल इंटेलिजेंस और अलोग्रिथ्म पर निर्भर करता है, जिसके आधार पर ढेर सारे वेबसाइट्स से सबसे अधिक मैच करने वाले जवाबों को प्रस्तुत कर दिया जाता है। इसे सर्च इंजन ऑप्टिमाइजेशन कहा जाता है। गूगल ने यह जवाब debtconsolidationsquestions.com नामक एक वेबसाइट पर प्रकाशित एक लेख से लिए थे। यह वेबसाईट ब्लॉग प्रकाशित करती है और अब इसने भी इस लेख को हटा लिया है।

कन्नड़ लगभग 4 करोड़ लोगों द्वारा बोली और लिखी जाती है, यह भारत की 22 सरकारी भाषा में एक है। इसका इतिहास 2000 वर्षों से भी अधिक पुराना है। गूगल के इस कारनामे के बाद कर्नाटक के अनेक मंत्रियों ने गूगल पर कानूनी कार्यवाही की बात कही थी। इस बढ़ाते विवाद के बाद गूगल ने इसे हटा लिया और एक माफीनामा प्रकाशित किया। गूगल पर अब आप भारत की सबसे बेढंगी भाषा का जवाब खोजेंगे तो केवल गूगल के कन्नड़ विवाद से सम्बंधित समाचारपत्रों और वेबसाइट पर प्रकाशित आर्टिकल ही मिलेंगे।

भले ही यह विवाद थम गया हो, पर कुछ प्रश्न तो लम्बे समय तक बने रहेंगे। सबसे बड़ा सवाल तो यह है कि आर्टिफीसियल इंटेलिजेंस के इस दौर में क्या मानवीय संवेदनाएं कम होने लगी हैं और यदि ऐसा है तो फिर जल्दी ही हम संवेदना शून्य हो जायेंगे, क्योंकि इस आर्टिफीसियल इंटेलिजेंस, अलोग्रिथ और रोबोटिक्स के जाल में हम इस कदर फंस चुके हैं कि धीरे-धीरे अपने मस्तिष्क पर भी हमारा नियंत्रण नहीं है और हम वही सोचने लगे हैं जो आधुनिक प्रौद्योगिकी हमें सोचने पर मजबूर करती है। वरना किसी भाषा, किसी संस्कृति और किसी समाज को हम संवेदना के साथ किस तरह कमतर या महान मान सकते हैं?

दूसरा बड़ा प्रश्न है कि, क्या कोई भाषा महान और कोई भाषा विकृत या बेढंगी मानी जा सकती है? जाहिर है गूगल और दूसरे सर्च इंजन हैं, तो कुछ भी संभव है। पर एक नए अनुसंधान से स्पष्ट होता है कि किसी भी भाषा की सूचना प्रचार की क्षमता एक सामान होती है, इससे कोई फर्क नहीं पड़ता कि वह भाषा जल्दी-जल्दी बोली जाती है या फिर उसका व्याकरण बहुत समृद्ध है। किसी भी भाषा में सूचना के प्रसार की दर 39 बिट्स प्रति सेकंड रहती है। तह गति टेलीग्राम के आधार मोर्स कोड से लगभग दोगुनी है।

माना जाता है कि इटली के निवासी विश्व के किसी और देश की तुलना में जल्दी बोलते हैं और इनके बोलने की दर लगभग 9 शब्दांश प्रति सेकंड रहती है। दूसरी तरफ जर्मनी के कुछ इलाकों में बोलने की दर 5 शब्दांश से अधिक नहीं रहती। हमारे देश में भी भाषाओं में इस तरह का अंतर रहता है। मैथिली और भोजपुरी अपेक्षाकृत धीरे बोली जाती हैं, जबकि हरयाणवी और पंजाबी जल्दी बोली जाती है। पर भाषा को धीरे बोलने या फिर जल्दी बोलने का महत्व क्या है? अब तक यही माना जाता रहा है कि जिस भाषा को जल्दी-जल्दी बोला जाता है उसके द्वारा किसी सूचना का प्रसार अधिक तेजी से होता होगा जबकि आराम से बोली जाने वाली भाषाओं में उसी सूचना के प्रसार में अपेक्षाकृत अधिक समय लगेगा।

वैज्ञानिकों ने सबसे पहले अंग्रेजी, इटालियन, जापानीज, वियतनामीज और हिन्दी जैसी 17 भाषाओं का चयन कर हरेक भाषा के सूचना घनत्व को बिट्स में परिवर्तित किया। बिट्स से पहले लोग अनजान थे, पर अब स्मार्टफोन के ज़माने में बिट्स एक सामान्य शब्द हो गया है। हमारा स्मार्टफोन, लैपटॉप या कंप्यूटर मॉडेम भी सूचनाओं का सम्प्रेषण बिट्स में ही करता है। हरेक भाषा का सूचना घनत्व अलग रहता है – जापानी भाषा में यह 5 बिट्स प्रति शब्दांश है, अंगरेजी में 7 बिट्स प्रति शब्दांश और वियातानामीज में 8 बिट्स प्रति शब्दांश।

इसके बाद एक ही आलेख का भाषा-विशेषज्ञों की मदद से हरेक भाषा में अनुवाद कराकर हरेक भाषा के जानकारों को इसे पढ़ने को दिया गया। एक ही आलेख को हरेक भाषा में पढ़ने का उद्देश्य यह था कि हरेक भाषा में सूचना के सम्प्रेषण में एकरूपता रहे। हरेक भाषा में उस आलेख को पढ़ने में कितना समय लगा, यह ज्ञात करने के बाद हरेक भाषा में बोलने की दर शब्दांश प्रति सेकंड में ज्ञात की गई। विशेषज्ञों को मालूम था कि कुछ भाषाएँ सामान्यतया जल्दी बोली जाती हैं, पर जब विशेषज्ञों ने भाषा के बोलने की दर को बिट्स दर से गुणा करने के बाद परिणाम देखा तो विस्मित रह गए। इस गुणा से यह जानने के लिए किया गया कि हरेक भाषा में प्रति सेकंड में कितनी सूचना का सम्प्रेषण हुआ।

इसका परिणाम आश्चर्यजनक था और किसी की उम्मीद से परे भी। हरेक भाषा में सूचना की सम्प्रेषण दर 39।15 बिट्स प्रति सेकंड के आसपास ही थी। इसका सीधा सा मतलब है कि भाषा भले ही जल्दी बोली जाती हो या फिर धीरे बोली जाती हो, भाषा क्लिष्ट हो या सरल, भाषा का व्याकरण विस्तृत हो या संक्षिप्त हो – हरेक भाषा द्वारा सूचना के सम्प्रेषण की दर लगभग एक रहती है। इस अध्ययन को साइंस एडवांसेज नामक जर्नल में प्रकाशित किया गया है। इस अध्ययन के मुख्य लेखक फ्रांस स्थित यूनिवर्सिटी ऑफ़ लियान के फ्रेंकोइस पेलेग्रिनो हैं।

किसी भाषा में बोलकर सूचना प्रसारण की तुलना में वर्ष 1959 में बने पहले कंप्यूटर मॉडेम की सम्प्रेषण क्षमता 110 बिट्स प्रति सेकंड थी, जबकि आधुनिक मॉडेम के लिए यह दर 100 मेगाबिट्स (10 करोड़ बिट्स) प्रति सेकंड है। फ्रेंकोइस पेलेग्रिनो के अनुसार भाषा के विज्ञान पर बहुत काम किया जा चुका है, पर आश्चर्य है कि इतने सीधे, सरल और मौलिक तथ्य पर पहले कभी किसी ने ध्यान नहीं दिया। इस अध्ययन से इतना तो स्पष्ट है कि सूचनाओं के प्रसार के सन्दर्भ में कोई भी भाषा किसी अन्य भाषा से श्रेष्ठ नहीं है, पर क्या गूगल को यह समझ आएगा?

Tagsugliest Indian language Kannada Kannada Top news Taza news Hindi language Google Google.com Ugly language is Kannada Mahendra Pandey सर्च इंजन गूगल Search Engine Google