Google अपनी ChatGPT के क्षण का सामना कर रहा है। तकनीकी विशेषज्ञों, वैज्ञानिकों और OpenAI के संस्थापक सैम अल्टमैन ने एक नए फीचर की प्रशंसा की है, जिसे NotebookLM में जोड़ा गया है। यह एक मुफ्त ऑनलाइन शोध उपकरण है, जिसे अल्फाबेट ने पिछले वर्ष जारी किया था।
इस साइट पर दस्तावेज़ अपलोड करने से उपयोगकर्ता उनके सामग्री के बारे में सवाल पूछ सकते हैं या उन्हें सारांश, ब्रीफिंग नोट्स और अन्य रूपों में समेट सकते हैं। अब यह सामग्री को एक आश्चर्यजनक मानव-समान पॉडकास्ट में भी बदल सकता है।
पुरुष और महिला AI-जनित मेज़बान न केवल गहरे, एफएम-रेडियो जैसे आवाज़ें रखते हैं, बल्कि अपनी बातचीत में ‘अम्स’, ठहराव और “यह लें” जैसे आकर्षक वाक्यांश भी शामिल करते हैं। उनकी बातचीत इतनी सहज लगती है कि आप यह सोचने में भूल सकते हैं कि वार्तालाप इंसानों के बीच हो रहा है।
मैंने इस उपकरण का उपयोग करके 208-पृष्ठीय प्रस्तुति के बारे में 15-मिनट का पॉडकास्ट तैयार किया, जिसे पढ़ने में एक घंटे या उससे अधिक का समय लगता, जबकि दूसरों ने इसका उपयोग शोध पत्रों या अपने डायरी में गहराई से जाने के लिए किया है। NotebookLM ने उस तरह के वायरल प्रयोगों को प्रेरित किया है, जैसा कि पहले ChatGPT के साथ हुआ था।
यह प्रणाली Google के प्रमुख AI मॉडल जेमिनी 1.5 पर चलती है, जो अब कई Google खोजों के शीर्ष परिणामों को प्रतिस्थापित कर रही है; लेकिन इसमें आवाज़ों को इतना मानव-समान बनाने के लिए अपना एक रहस्य भी है।
“इसमें कुछ नई ऑडियो तकनीक है, जो मुझे नहीं लगता कि पूरी तरह से सार्वजनिक है,” स्टेवेन्स जॉनसन, NotebookLM के Google के संपादकीय निदेशक, ने मुझे बताया। “यह कंप्यूटर द्वारा उत्पन्न सबसे यथार्थवादी बातचीत है।” उन्होंने यह भी बताया कि पॉडकास्ट-जनरेटर जोड़ने के बाद NotebookLM के उपयोग में एक “बड़ा उछाल” आया है।
विश्लेषकों ने इस फीचर को दिमाग चकरा देने वाला बताया है, जबकि OpenAI के सह-संस्थापक और Tesla के पूर्व AI प्रमुख आंद्रे कर्पाथी ने कहा कि यह “अब मेरा पसंदीदा पॉडकास्ट है।” जाहिर है, यही अब कर्पाथी के लिए सामग्री का मुख्य स्रोत हो सकता है।
यह सच है कि इस तकनीक की असली विघटन क्षमता यहीं पर है; पॉडकास्टरों को बदलने में नहीं, बल्कि जानकारी को समाहित करने का एक नया तरीका जोड़ने में। बाजार अनुसंधान फर्म Canalys के अनुसार, वायरलेस ईयरबड शिपमेंट इस वर्ष 11% और 2025 में 16% बढ़ेगा।
मेरी अपनी राय: आवाज़ें अद्वितीय हैं और मैंने सुनी गई अन्य AI-जनित ऑडियो की तुलना में यथार्थवाद का स्तर दिखाती हैं। लेकिन NotebookLM का उपयोगकर्ता इंटरफेस नेविगेट करने में निराशाजनक है, और इसके कई AI पॉडकास्ट सुनने के बाद, मैंने पाया कि कुछ बातचीत पर ध्यान केंद्रित करना मुश्किल हो गया।
शायद यह एक अमूर्त संबंध है जो मनुष्यों के बीच आवाज़ के माध्यम से स्वाभाविक रूप से ध्यान बनाए रखता है। मेरे रेडियो के शुरुआती वर्षों में, एक अनुभवी ने मुझे बताया कि महान समाचार पढ़ने का रहस्य किसी भी स्वर परिवर्तन में नहीं है, बल्कि उस पर ध्यान केंद्रित करना है जो आप पढ़ रहे हैं। किसी कारणवश, श्रोता अधिक संलग्न होते हैं। यह समझना मुश्किल है कि कंप्यूटर इसे कैसे दोहरा सकता है।
Google के लिए बड़ा सवाल यह है कि क्या यह अपनी जादुई विशेषता को व्यवसाय के लिए कुछ उपयोगी में बदल देगा। कंपनी के पास अपनी खुद की नवाचारों को लागू करने में विफल रहने का एक इतिहास है।
इसके शोधकर्ताओं ने उदाहरण के लिए, Transformer नामक एक प्रमुख एल्गोरिदम का आविष्कार किया—जो ChatGPT में ‘T’ है—लेकिन OpenAI ने इस तकनीक का लाभ उठाया।
शायद हमें एक ऐसे समूह से इतना उम्मीद करना चाहिए, जो अधिग्रहण के जरिए बनाया गया है, जैसे कि DeepMind, Android, YouTube और DoubleClick, और जिसे नवप्रवर्तक के दुविधा से बाधित किया गया है: AI खोजों को बहुत अच्छा बना दें और Google अपने लाभदायक खोज व्यवसाय को नष्ट करने का जोखिम उठाता है।
AI में ‘वाह फैक्टर’ भी प्रचार और अत्यधिक खर्च का कारण बन सकता है, जिसका मतलब है कि निवेशकों को नवीनतम हिट्स के बारे में सतर्क रहना चाहिए। वॉल स्ट्रीट पहले ही ChatGPT के साथ पहले अनुभवों और जनरेटिव AI की व्यावसायिक उपयोगिता के बीच के अंतर के बारे में सतर्क हो रहा है।
Google अंततः अपने पॉडकास्ट जनरेटर में अन्य आवाज़ें जोड़ देगा, और जॉनसन ने मुझे बताया कि कंपनी अंततः एक प्रीमियम संस्करण बेचेगी, जिसमें व्यवसायों के लिए एक विशेष रूप से शामिल होगा।
इस संदर्भ में, ऑडियो अवलोकन शायद NotebookLM के लिए एक सुव्यवस्थित विपणन ट्रिक के रूप में कार्य करेगा, जिसकी उपयोगिता कहीं अधिक स्पष्ट है: आपके अपने दस्तावेज़ों और डेटा पर Google के AI मॉडल का उपयोग करने के लिए एक सरल उपकरण।
यह सूक्ष्मता प्रक्रिया, जिसे उद्योग में RAG (या रिट्रीवल-ऑगमेंटेड जेनरेशन) के रूप में जाना जाता है, आमतौर पर Google के जेमिनी या अन्य AI मॉडल की आधिकारिक सदस्यता के भाग के रूप में लागू करने पर अधिक महंगी और जटिल होती है।
यदि जीवन्त AI आवाज़ें अधिक लोगों को NotebookLM और जेमिनी का उपयोग करने के लिए प्रेरित करती हैं, तो Google ने अपनी जादू को राजस्व में बदल दिया होगा। लेकिन व्यवसाय जनरेटिव AI के वास्तविक निवेश पर वापसी से जूझ रहे हैं, और इस क्षेत्र के बड़े संशयवादियों में से एक, डेरॉन एसेमोघ्लू, ने हाल ही में अर्थशास्त्र में नोबेल पुरस्कार जीता है, जो AI की वास्तविक उपयोगिता के बारे में उठते सवालों को विश्वास दिलाता है। Google के लिए, इसका मतलब है कि उसे एक मुश्किल रास्ता तय करना होगा।