S40L12 – एक सरल अंक वर्गीकारक

html

Keras और MNIST के साथ अंक वर्गीकरण के लिए एक सरल न्यूरल नेटवर्क बनाना

विषय सूचि

  1. अंक वर्गीकरण के लिए न्यूरल नेटवर्क का परिचय
  2. MNIST डाटासेट को समझना
  3. पर्यावरण सेट करना
  4. MNIST डाटासेट लोड करना और उसका पता लगाना
  5. डेटा प्रीप्रोसेसिंग: पुनःआकार देना और वन-हॉट एन्कोडिंग
  6. Keras के साथ न्यूरल नेटवर्क मॉडल बनाना
  7. मॉडल कंपाइल करना: लॉस फंक्शन और ऑप्टिमाइज़र
  8. मॉडल को प्रशिक्षित करना: फिटिंग और वैधता
  9. मॉडल का मूल्यांकन: सटीकता और भविष्यवाणियाँ
  10. न्यूरल नेटवर्क संरचना का विज़ुअलाइज़ेशन
  11. प्रशिक्षण का अनुकूलन: GPUs का उपयोग करना
  12. निष्कर्ष

अंक वर्गीकरण के लिए न्यूरल नेटवर्क का परिचय

न्यूरल नेटवर्कों ने मशीनों के डेटा की व्याख्या और विश्लेषण करने के तरीके में क्रांति ला दी है, विशेष रूप से छवि मान्यता के क्षेत्र में। अंक वर्गीकरण, जिसका लक्ष्य हस्तलिखित अंकों की सटीक पहचान करना होता है, शुरुआती लोगों के लिए न्यूरल नेटवर्क के मूल सिद्धांतों को समझने के लिए एक आदर्श उदाहरण के रूप में कार्य करता है। Keras जैसी लोकप्रिय लाइब्रेरीज़ और MNIST जैसी डाटासेट्स का उपयोग करके, एक प्रभावी अंक वर्गीकर्ता बनाना सुलभ और शैक्षिक दोनों बन जाता है।

MNIST डाटासेट को समझना

MNIST (Modified National Institute of Standards and Technology) डाटासेट मशीन लर्निंग समुदाय में एक आधारशिला है। इसमें 70,000 ग्रेस्केल छवियाँ हैं जो हस्तलिखित अंकों (0-9) की हैं, जिनका आकार प्रत्येक 28x28 पिक्सेल है। इस डाटासेट को 60,000 प्रशिक्षण छवियों और 10,000 परीक्षण छवियों में विभाजित किया गया है, जिससे यह मशीन लर्निंग मॉडलों को प्रशिक्षित करने और मान्य करने के लिए आदर्श बनाता है।

MNIST की मुख्य विशेषताएँ:

  • आकार: 70,000 छवियाँ (60k प्रशिक्षण, 10k परीक्षण)
  • छवि आयाम: 28x28 पिक्सेल
  • श्रेणियाँ: 10 (अंक 0 से 9 तक)
  • ग्रेस्केल: प्रत्येक पिक्सेल मान 0 (काला) से 255 (सफेद) तक होता है

पर्यावरण सेट करना

मॉडल बनाने की प्रक्रिया में गोता लगाने से पहले, विकास पर्यावरण सेट करना आवश्यक है। सुनिश्चित करें कि आपके पास Python स्थापित है, और पैकेजों और निर्भरताओं को सहजता से प्रबंधित करने के लिए Anaconda जैसी एनवायरनमेंट का उपयोग करने पर विचार करें।

आवश्यक लाइब्रेरीज़:

  • NumPy: संख्यात्मक संचालन के लिए
  • Matplotlib: डेटा विज़ुअलाइज़ेशन के लिए
  • Keras: न्यूरल नेटवर्क बनाने और प्रशिक्षित करने के लिए
  • Scikit-learn: प्रीप्रोसेसिंग यूटिलिटीज़ के लिए
  • Pandas: डेटा मैनिपुलेशन के लिए

स्थापना कमांड्स:

MNIST डाटासेट लोड करना और उसका पता लगाना

Keras अपने datasets मॉड्यूल के माध्यम से MNIST डाटासेट तक पहुंचने की प्रक्रिया को सरल बनाता है। यहां बताया गया है कि आप डेटा कैसे लोड और निरीक्षण कर सकते हैं:

आउटपुट:

यह स्पष्ट करता है कि 60,000 प्रशिक्षण छवियाँ और 10,000 परीक्षण छवियाँ हैं, प्रत्येक का आकार 28x28 पिक्सेल है।

नमूना छवियों का विज़ुअलाइज़ेशन

डेटा की समझ प्राप्त करने के लिए, आइए एक नमूना छवि को विज़ुअलाइज़ करें:

आउटपुट:

नमूना छवि

नोट: वास्तविक छवि लेबल के अनुरूप एक हस्तलिखित अंक प्रदर्शित करेगी।

डेटा प्रीप्रोसेसिंग: पुनःआकार देना और वन-हॉट एन्कोडिंग

डेटा प्रीप्रोसेसिंग मशीन लर्निंग वर्कफ़्लोज़ में एक महत्वपूर्ण चरण है। न्यूरल नेटवर्क के लिए, डेटा को उचित रूप से फ़ॉर्मेट करना और लेबल्स को एन्कोड करना आवश्यक है।

डेटा का पुनःआकार देना

न्यूरल नेटवर्क्स को इनपुट डेटा एक विशेष आकार में चाहिए होता है। MNIST डाटासेट के लिए, हम 28x28 पिक्सेल छवियों को 784 तत्वों की 1D सरणी में फ्लैट करेंगे।

लेबल्स का वन-हॉट एन्कोडिंग

वन-हॉट एन्कोडिंग श्रेणात्मक लेबल्स को बाइनरी मैट्रिक्स में परिवर्तित करता है, जो प्रशिक्षण के लिए अधिक उपयुक्त होता है।

आउटपुट:

यह इंगित करता है कि प्रत्येक लेबल अब 10-आयामी बाइनरी वेक्टर के रूप में प्रतिनिधित्व किया गया है।

Keras के साथ न्यूरल नेटवर्क मॉडल बनाना

Keras एक उपयोगकर्ता-मित्रवत API प्रदान करता है जिससे न्यूरल नेटवर्क्स का निर्माण और प्रशिक्षण किया जा सकता है। हम कई डेंस लेयरों से मिलकर एक सरल Sequential मॉडल बनाएंगे।

मॉडल आर्किटेक्चर

मॉडल संरचना का यहां एक उच्च-स्तरीय अवलोकन है:

  1. Flatten Layer: 2D छवि डेटा को 1D सरणी में परिवर्तित करता है।
  2. Dense Layer 1: सिग्मॉइड सक्रियता के साथ 100 न्यूरॉन्स।
  3. Dense Layer 2: सिग्मॉइड सक्रियता के साथ 144 न्यूरॉन्स।
  4. Output Layer: 10 न्यूरॉन्स (प्रत्येक अंक के लिए एक) सॉफ्टमैक्स सक्रियता के साथ।

लेयरों की व्याख्या

  • Flatten Layer: इनपुट डेटा को 2D मैट्रिक्स (28x28) से 1D वेक्टर (784) में परिवर्तित करता है ताकि इसे डेंस लेयरों में फीड किया जा सके।
  • Dense Layers: ये पूर्ण रूप से जुड़े लेयर होते हैं जहां प्रत्येक न्यूरॉन को पिछले लेयर के सभी न्यूरॉन्स से इनपुट प्राप्त होता है। सक्रियण फ़ंक्शन्स गैर-रेखीयता पेश करते हैं:
    • Sigmoid Activation: 0 और 1 के बीच मान उत्पन्न करता है, बाइनरी वर्गीकरण के लिए उपयोगी है लेकिन मल्टी-क्लास समस्याओं के लिए गुप्त लेयरों में कम सामान्य है।
    • Softmax Activation: अंतिम लेयर के आउटपुट को 10 श्रेणियों पर प्रायिकता वितरण में परिवर्तित करता है।

मॉडल का निर्माण:

मॉडल समरी

मॉडल संरचना और पैरामीटर्स को विज़ुअलाइज़ करने के लिए:

आउटपुट:

यह समरी प्रत्येक लेयर के आउटपुट आकार और प्रशिक्षित किए जाने वाले पैरामीटर्स की संख्या के बारे में अंतर्दृष्टि प्रदान करती है।

मॉडल कंपाइल करना: लॉस फंक्शन और ऑप्टिमाइज़र

प्रशिक्षण से पहले, मॉडल को निर्दिष्ट लॉस फंक्शन और ऑप्टिमाइज़र के साथ कंपाइल करना आवश्यक है।

  • Loss Function: मापता है कि मॉडल की भविष्यवाणियाँ वास्तविक लेबल्स से कितनी मेल खाती हैं।
    • Categorical Crossentropy: मल्टी-क्लास वर्गीकरण समस्याओं के लिए उपयुक्त।
  • Optimizer: मॉडल के वेट्स को अपडेट करता है ताकि लॉस फंक्शन को न्यूनतम किया जा सके।
    • Adam Optimizer: एक प्रभावी स्टोकास्टिक ग्रेडियंट डिसेंट विधि है जो लर्निंग रेट को अनुकूलित करती है।

मॉडल कंपाइल करना:

मॉडल को प्रशिक्षित करना: फिटिंग और वैधता

प्रशिक्षण में मॉडल को डेटा प्रदान करना और इसे कई epochs के माध्यम से पैटर्न सीखने देना शामिल है।

  • Epochs: पूरे डाटासेट को नेटवर्क के माध्यम से पारित करने की संख्या।
  • Validation Data: प्रत्येक epoch के बाद अनदेखे डेटा पर मॉडल के प्रदर्शन का मूल्यांकन करने के लिए उपयोग किया जाता है।

प्रशिक्षण प्रक्रिया:

नमूना आउटपुट:

10 epochs के अंत तक, मॉडल ने प्रशिक्षण और वैधता दोनों डाटासेट पर लगभग 93% सटीकता प्राप्त की, जो एक अच्छा प्रदर्शन करने वाला मॉडल दर्शाती है।

मॉडल का मूल्यांकन: सटीकता और भविष्यवाणियाँ

प्रशिक्षण के बाद, मॉडल के प्रदर्शन का मूल्यांकन करना और नए डेटा पर भविष्यवाणियाँ करना महत्वपूर्ण है।

भविष्यवाणियाँ करना

प्रत्येक भविष्यवाणी 10 श्रेणियों पर एक प्रायिकता वितरण से मिलकर होती है। भविष्यवाणी की गई श्रेणी निर्धारित करने के लिए:

भविष्यवाणियों का विज़ुअलाइज़ेशन

आइए कुछ परीक्षण छवियों को उनकी भविष्यवाणी और वास्तविक लेबल्स के साथ विज़ुअलाइज़ करें:

आउटपुट:

छवि प्रदर्शित करती है जिसमें वास्तविक लेबल और मॉडल की भविष्यवाणी दोनों को संकेत करने वाले शीर्षक होते हैं।

मॉडल की सटीकता

मॉडल ने वैधता सेट पर 93% सटीकता प्राप्त की, जो अनदेखे डेटा पर अच्छी तरह से सामान्यीकरण करने की इसकी क्षमता को दर्शाता है। बेहतर प्रदर्शन के लिए, आगे की ट्यूनिंग और अधिक जटिल आर्किटेक्चर की खोज की जा सकती है।

न्यूरल नेटवर्क संरचना का विज़ुअलाइज़ेशन

न्यूरल नेटवर्क की संरचना को समझना यह समझने में मदद कर सकता है कि डेटा कैसे प्रवाहित होता है और परिवर्तनों का क्रम कैसे होता है। नीचे निर्मित न्यूरल नेटवर्क का एक विज़ुअल प्रतिनिधित्व है:

आउटपुट:

न्यूरल नेटवर्क संरचना

यह आरेख इनपुट न्यूरॉन्स (784) से गुप्त लेयरों के माध्यम से आउटपुट न्यूरॉन्स (10) तक प्रवाह को दर्शाता है।

प्रशिक्षण का अनुकूलन: GPUs का उपयोग करना

न्यूरल नेटवर्क्स का प्रशिक्षण, विशेष रूप से गहरे न्यूरल नेटवर्क्स, गणनात्मक रूप से भारी और समय लेने वाला हो सकता है। ग्राफ़िक्स प्रोसेसिंग यूनिट्स (GPUs) का उपयोग करके प्रशिक्षण प्रक्रिया को काफी तेज किया जा सकता है। यहां बताया गया है कि आप Keras के साथ GPUs का उपयोग कैसे कर सकते हैं:

  1. GPU संगतता सुनिश्चित करें:
    • NVIDIA CUDA Toolkit और cuDNN स्थापित करें।
    • सुनिश्चित करें कि आपका GPU TensorFlow (Keras के बैकएंड) के साथ संगत है।
  2. GPU-संगत TensorFlow स्थापित करें:
  3. GPU का उपयोग करने के लिए TensorFlow को कॉन्फ़िगर करें:

    TensorFlow स्वचालित रूप से GPUs का पता लगाता है और उनका उपयोग करता है। हालांकि, यदि आवश्यक हो तो आप स्पष्ट रूप से GPU सेटिंग्स निर्दिष्ट कर सकते हैं।

GPUs का उपयोग करने के लाभ:

  • पैरेलल प्रोसेसिंग: GPUs कई गणनाओं को एक साथ संभाल सकते हैं, जो न्यूरल नेटवर्क्स में मैट्रिक्स संचालन के लिए आदर्श हैं।
  • तेज़ प्रशिक्षण: मॉडल काफी तेजी से प्रशिक्षित होते हैं, जिससे अधिक प्रयोग और तेज पुनरावृत्तियाँ संभव होती हैं।

नोट: GPU उपयोग को अनुकूलित करने के लिए विशिष्ट सिस्टम सेटअप के आधार पर अतिरिक्त कॉन्फ़िगरेशन की आवश्यकता हो सकती है।

निष्कर्ष

Keras और MNIST डाटासेट का उपयोग करके अंक वर्गीकरण के लिए एक सरल न्यूरल नेटवर्क बनाना मशीन लर्निंग और डीप लर्निंग की दुनिया में एक उत्कृष्ट परिचय है। इस गाइड का अनुसरण करके, आपने यह सीखा है कि:

  • MNIST डाटासेट को समझें और प्रीप्रोसेस करें।
  • Keras के साथ एक न्यूरल नेटवर्क मॉडल का निर्माण करें।
  • मॉडल के प्रदर्शन को प्रशिक्षित और मूल्यांकन करें।
  • नेटवर्क आर्किटेक्चर को विज़ुअलाइज़ करें।
  • GPUs का उपयोग करके प्रशिक्षण को अनुकूलित करें।

हालांकि चर्चा किए गए मॉडल ने सम्मानजनक सटीकता प्राप्त की है, इसमें सुधार की पर्याप्त गुंजाइश है। अधिक जटिल आर्किटेक्चर की खोज, विभिन्न सक्रियण फ़ंक्शन्स के साथ प्रयोग, या नियमितीकरण तकनीकों को लागू करना बेहतर प्रदर्शन की ओर ले जा सकता है। जैसे-जैसे आप अपनी मशीन लर्निंग यात्रा जारी रखते हैं, इन मूल तत्वों पर निर्माण करना आपको और अधिक जटिल और प्रभावशाली परियोजनाओं को संभालने में सक्षम करेगा।

कोडिंग शुभकामनाएँ!

Share your love