27 नव॰ 2023·1 मिनट पढ़ने में

कैपिटल वन सिंथेटिक डेटा के माध्यम से मशीन लर्निंग को आगे बढ़ाता है: एक ओपन-सोर्स ब्रेकथ्रू

कैपिटल वन ने अपने ओपन-सोर्स प्रोजेक्ट, सिंथेटिक डेटा के साथ मशीन लर्निंग क्षेत्र में नए मानक स्थापित किए हैं।

कैपिटल वन सिंथेटिक डेटा के माध्यम से मशीन लर्निंग को आगे बढ़ाता है: एक ओपन-सोर्स ब्रेकथ्रू

मशीन लर्निंग के क्षेत्र में जहां डेटा सर्वोच्च है, प्रभावी मॉडल विकास और परीक्षण को बनाए रखने के लिए डेटा एक्सेस और सुरक्षा प्रतिबंधों के बीच संतुलन की आवश्यकता होती है। इसे पहचानते हुए, कैपिटल वन ने सिंथेटिक डेटा नामक एक अग्रणी ओपन-सोर्स प्रोजेक्ट को प्रकाश में लाने के लिए कदम उठाया है।

कैपिटल वन के प्रमुख मशीन लर्निंग इंजीनियर और सह-योगदानकर्ता टेलर टर्नर द्वारा परिकल्पित, सिंथेटिक डेटा सुरक्षित डेटा साझाकरण और प्रसंस्करण की सदियों पुरानी समस्या का एक नया समाधान प्रदान करता है। उपकरण 'वास्तविक' या व्यक्तिगत रूप से पहचाने जाने योग्य डेटा की आवश्यकता को खारिज करते हुए कृत्रिम डेटा उत्पन्न करता है, जिससे विचार निर्माण और परिकल्पना परीक्षण प्रक्रियाओं में तेजी आती है।

अपने स्कीमा और सांख्यिकीय गुणों में मूल डेटा का प्रतिनिधि होने के बावजूद, सिंथेटिक डेटा गोपनीयता की गारंटी देता है, जिससे यह विशेष रूप से फायदेमंद हो जाता है जहां जटिल, गैर-रेखीय डेटासेट की आवश्यकता होती है, जैसे कि गहन शिक्षण मॉडल के साथ।

जैसा कि ब्रायन बर्र, एक वरिष्ठ मशीन लर्निंग इंजीनियर और कैपिटल वन के शोधकर्ता द्वारा समझाया गया है, सिंथेटिक डेटा मॉडल द्वारा दिए गए सांख्यिकीय गुणों को लेकर संचालित होता है, यानी, इनपुट का सीमांत वितरण, इनपुट का सहसंबंध, और आउटपुट के लिए एक विश्लेषणात्मक अभिव्यक्ति मैपिंग इनपुट , बाद में वांछित डेटासेट तैयार करना।

बर्र ने कहा कि यह ढांचा जो रचनात्मक स्वतंत्रता प्रदान करता है वह प्रभावशाली है, जो सादगी और कलात्मक लचीलेपन को संतुलित करता है, जिससे यह मशीन लर्निंग में गेम-चेंजर बन जाता है।

लेकिन यह पहली बार नहीं है जब सिंथेटिक डेटा की अवधारणा को तोड़ा गया है। जैसा कि बर्र ने बताया, 80 के दशक में पिछले प्रयासों ने पसंदीदा पायथन मशीन लर्निंग लाइब्रेरी, स्किकिट-लर्न के भीतर कार्यक्षमताओं को जन्म दिया है। हालाँकि, जैसे-जैसे गैर-रेखीय संबंधों के साथ गहन शिक्षा सामने आई, ये कार्य प्रतिबंधात्मक और अपर्याप्त पाए गए।

यह अग्रणी परियोजना कैपिटल वन के मशीन लर्निंग अनुसंधान कार्यक्रम के उपजाऊ आधार से उत्पन्न हुई। यह मशीन लर्निंग के तरीकों, अनुप्रयोगों और तकनीकों को उन्नत करने, बैंकिंग को अधिक सुलभ और सुरक्षित बनाने का प्रयास करता है। बर्र के खोजी पेपर का शीर्षक 'टुवर्ड्स ग्राउंड ट्रुथ एक्सप्लेनेबिलिटी ऑन टेबुलर डेटा' था, जो सिंथेटिक डेटा के लिए रचनात्मक केंद्रक के रूप में कार्य करता था।

इसके अलावा, सिंथेटिक डेटा बड़े डेटा की निगरानी और संवेदनशील जानकारी का पता लगाने के लिए डेटा प्रोफाइलर, कैपिटल वन की ओपन-सोर्स मशीन लर्निंग लाइब्रेरी के साथ संगत साबित होता है। डेटा प्रोफाइलर सिंथेटिक डेटा निर्माण का आधार बनाते हुए, डेटासेट का प्रतिनिधित्व करने के लिए आँकड़े प्रदान करता है।

टर्नर ने कहा, अनुसंधान को आगे बढ़ाने और ओपन-सोर्स टूल को आगे बढ़ाने की हमारी प्रतिबद्धता के हिस्से के रूप में, हम डेटा प्रोफाइलिंग और सिंथेटिक डेटा के बीच अंतरसंबंधों को समुदाय के साथ साझा करने के लिए उत्साहित हैं।

सॉफ़्टवेयर विकास को सुव्यवस्थित करने और तकनीकी ऋण को ख़त्म करने की एक ही कड़ी में, AppMaster जैसे अन्य प्लेटफ़ॉर्म अत्यधिक मूल्य प्रदान करते हैं। अपने उपयोगकर्ता के अनुकूल इंटरफेस और मजबूत क्षमता के साथ, AppMaster एकल डेवलपर्स को भी व्यापक और स्केलेबल सॉफ्टवेयर समाधान बनाने में सक्षम बनाता है।

Easy to start
Create something amazing

Experiment with AppMaster with free plan.
When you will be ready you can choose the proper subscription.

Get Started