html
पायथन में K-मीन्स क्लस्टरिंग को समझना: एक चरण-दर-चरण गाइड
सामग्री सूची
- डेटासेट का परिचय
- पुनरावृत्ति: एलबो मेथड
- K-मीन्स के साथ भविष्यवाणियाँ करना
- मैटप्लॉटलिब के साथ क्लस्टर्स का दृश्यांकन
- क्लस्टर्स की व्याख्या करना
- विशिष्ट क्लस्टर डेटा निकालना
- प्रायोगिक अनुप्रयोग: लक्षित विपणन
- निष्कर्ष और अगले कदम
स्वागत है, दोस्तों! इस गाइड में, हम पायथन का उपयोग करके K-मीन्स क्लस्टरिंग में गहराई से उतरेंगे, जो हमारे पिछले सत्र में कवर किए गए बुनियादी अवधारणाओं पर आधारित होगा। इस ट्यूटोरियल के अंत तक, आप K-मीन्स को लागू करने, क्लस्टर्स को दृश्यांकित करने, और अपने डेटा से सार्थक अंतर्दृष्टि निकालने में सक्षम हो जाएंगे।
डेटासेट का परिचय
आइए हमारे डेटासेट की जांच से शुरू करें, जिसमें तीन कॉलम शामिल हैं:
- यूज़र आईडी
- इंस्टाग्राम विज़िट स्कोर
- स्पेंडिंग रैंक
यह डेटासेट इंस्टाग्राम गतिविधि और खर्च व्यवहार के आधार पर उपयोगकर्ताओं को वर्गीकृत करने के लिए K-मीन्स क्लस्टरिंग लागू करने का एक आधार प्रदान करता है।
पुनरावृत्ति: एलबो मेथड
हमारे पिछले सत्र में, हमने एलबो मेथड का अन्वेषण किया था—एक तकनीक जो K-मीन्स में क्लस्टरों की इष्टतम संख्या (k) निर्धारित करने के लिए उपयोग की जाती है। प्रत्येक बिंदु से उसके निर्धारित क्लस्टर केंद्र तक की वर्गों के योग को प्लॉट करके, "एलबो" बिंदु आदर्श k का सुझाव देता है, जो अंडरफिटिंग और ओवरफिटिंग के बीच संतुलन स्थापित करता है।
K-मीन्स के साथ भविष्यवाणियाँ करना
अपने डेटा के लिए क्लस्टर असाइनमेंट की भविष्यवाणी करने के लिए:
- K-मीन्स प्रारंभ करना:
sklearn.cluster
से KMeans
क्लास का उपयोग करके, क्लस्टरों की संख्या निर्दिष्ट करें (उदा., k=4
)।
- मॉडल फिट करना: अपने डेटासेट पर K-मीन्स एल्गोरिदम लागू करें।
- क्लस्टर्स की भविष्यवाणी करना:
kmeans.predict(X)
का उपयोग करके प्रत्येक डेटा बिंदु को क्लस्टर असाइन करें, परिणामों को Y
वेरिएबल में संग्रहीत करते हुए।
12345
from sklearn.cluster import KMeans kmeans = KMeans(n_clusters=4)kmeans.fit(X)Y = kmeans.predict(X)
मैटप्लॉटलिब के साथ क्लस्टर्स का दृश्यांकन
दृश्यांकन क्लस्टरिंग के परिणामों की व्याख्या में मदद करता है। हम प्रत्येक क्लस्टर के लिए बिखराव वाले प्लॉट बनाने के लिए matplotlib.pyplot
का उपयोग करेंगे।
- लाइब्रेरी इम्पोर्ट करें:
1
import matplotlib.pyplot as plt
- प्रत्येक क्लस्टर को प्लॉट करें:
प्रत्येक क्लस्टर लेबल के माध्यम से पुनरावृत्ति करें, उस क्लस्टर से संबंधित डेटा बिंदुओं को फ़िल्टर करें, और उन्हें विशिष्ट रंगों और लेबल के साथ प्लॉट करें।
1234
colors = ['blue', 'red', 'pink', 'black']for i in range(4): plt.scatter(X[Y == i, 0], X[Y == i, 1], c=colors[i], label=f'Cluster {i}')
- क्लस्टर केंद्रों को प्रदर्शित करें:
प्रत्येक क्लस्टर के केंद्रीय बिंदु को उजागर करने के लिए क्लस्टर केंद्रों को प्लॉट करें।
123
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=300, c='green', label='Centroids')
- एक्सिस लेबलिंग और लीजेंड जोड़ना:
पाठ्यपाठ्यता बढ़ाने के लिए एक्सिस लेबल करें और लीजेंड जोड़ें।
1234
plt.xlabel('Instagram Visit Score')plt.ylabel('Spending Score')plt.legend()plt.show()
क्लस्टर्स की व्याख्या करना
दृश्यांकन करने पर, आप विभिन्न उपयोगकर्ता खंडों का प्रतिनिधित्व करने वाले स्पष्ट क्लस्टर्स देखेंगे:
- क्लस्टर 0 & 2: कम खर्च रैंकों वाले उपयोगकर्ता।
- क्लस्टर 1 & 3: उच्च खर्च रैंकों वाले उपयोगकर्ता, जो विपणन प्रयासों के लिए प्रमुख लक्ष्य बनते हैं।
विशिष्ट क्लस्टर डेटा निकालना
लक्षित विपणन करने के लिए, आप विशिष्ट क्लस्टर्स पर ध्यान केंद्रित करना चाह सकते हैं। उदाहरण के लिए, क्लस्टर 1 से उपयोगकर्ताओं को निकालने के लिए:
12
cluster_1_data = data[Y == 1]print(f"Number of users in Cluster 1: {len(cluster_1_data)}")
यह कोड डेटासेट को फिल्टर करता है ताकि केवल उन उपयोगकर्ताओं को शामिल किया जा सके जिन्हें क्लस्टर 1 सौंपा गया है, जिससे अनुकूलित विपणन रणनीतियों की अनुमति मिलती है।
प्रायोगिक अनुप्रयोग: लक्षित विपणन
अपने क्लस्टर्स को समझने से रणनीतिक निर्णय लेने में सहायता मिलती है। उदाहरण के लिए:
- विपणन बजट आवंटन: उच्च खर्च स्कोर वाले क्लस्टर्स में अधिक संसाधन आवंटित करें।
- व्यक्तिगत अभियान: प्रत्येक क्लस्टर की विशिष्ट विशेषताओं के साथ प्रतिध्वनित होने वाले अभियानों को डिज़ाइन करें।
निष्कर्ष और अगले कदम
K-मीन्स क्लस्टरिंग आपके डेटा में छुपे पैटर्न को उजागर करने के लिए एक शक्तिशाली उपकरण है। इन क्लस्टर्स को प्रभावी ढंग से दृश्यांकित और व्याख्या करके, व्यवसाय अपनी विपणन रणनीतियों को बेहतर बनाने के लिए सूचित निर्णय ले सकते हैं।
हमारे अगले सत्र में, हम एलबो मेथड के वैकल्पिक तरीकों का अन्वेषण करेंगे, जिससे इष्टतम क्लस्टर चयन के लिए अपने दृष्टिकोण को और परिष्कृत किया जा सकेगा। जुड़े रहें!
साथ देने के लिए धन्यवाद! मुझे उम्मीद है कि इस गाइड ने पायथन में K-मीन्स क्लस्टरिंग की प्रक्रिया को स्पष्ट किया है। खुश क्लस्टरिंग!