S36L06 – दृश्यांकन

html
पायथन में K-मीन्स क्लस्टरिंग को समझना: एक चरण-दर-चरण गाइड

सामग्री सूची

  डेटासेट का परिचय
  पुनरावृत्ति: एलबो मेथड
  K-मीन्स के साथ भविष्यवाणियाँ करना
  मैटप्लॉटलिब के साथ क्लस्टर्स का दृश्यांकन
  क्लस्टर्स की व्याख्या करना
  विशिष्ट क्लस्टर डेटा निकालना
  प्रायोगिक अनुप्रयोग: लक्षित विपणन
  निष्कर्ष और अगले कदम


स्वागत है, दोस्तों! इस गाइड में, हम पायथन का उपयोग करके K-मीन्स क्लस्टरिंग में गहराई से उतरेंगे, जो हमारे पिछले सत्र में कवर किए गए बुनियादी अवधारणाओं पर आधारित होगा। इस ट्यूटोरियल के अंत तक, आप K-मीन्स को लागू करने, क्लस्टर्स को दृश्यांकित करने, और अपने डेटा से सार्थक अंतर्दृष्टि निकालने में सक्षम हो जाएंगे।

डेटासेट का परिचय
आइए हमारे डेटासेट की जांच से शुरू करें, जिसमें तीन कॉलम शामिल हैं:

  यूज़र आईडी
  इंस्टाग्राम विज़िट स्कोर
  स्पेंडिंग रैंक

यह डेटासेट इंस्टाग्राम गतिविधि और खर्च व्यवहार के आधार पर उपयोगकर्ताओं को वर्गीकृत करने के लिए K-मीन्स क्लस्टरिंग लागू करने का एक आधार प्रदान करता है।

पुनरावृत्ति: एलबो मेथड
हमारे पिछले सत्र में, हमने एलबो मेथड का अन्वेषण किया था—एक तकनीक जो K-मीन्स में क्लस्टरों की इष्टतम संख्या (k) निर्धारित करने के लिए उपयोग की जाती है। प्रत्येक बिंदु से उसके निर्धारित क्लस्टर केंद्र तक की वर्गों के योग को प्लॉट करके, "एलबो" बिंदु आदर्श k का सुझाव देता है, जो अंडरफिटिंग और ओवरफिटिंग के बीच संतुलन स्थापित करता है।

K-मीन्स के साथ भविष्यवाणियाँ करना
अपने डेटा के लिए क्लस्टर असाइनमेंट की भविष्यवाणी करने के लिए:

  K-मीन्स प्रारंभ करना: sklearn.cluster से KMeans क्लास का उपयोग करके, क्लस्टरों की संख्या निर्दिष्ट करें (उदा., k=4)।
  मॉडल फिट करना: अपने डेटासेट पर K-मीन्स एल्गोरिदम लागू करें।
  क्लस्टर्स की भविष्यवाणी करना: kmeans.predict(X) का उपयोग करके प्रत्येक डेटा बिंदु को क्लस्टर असाइन करें, परिणामों को Y वेरिएबल में संग्रहीत करते हुए।





		
		
			
			
Java
			
			from sklearn.cluster import KMeans

kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
Y = kmeans.predict(X)
			
				
					
				
					1
2
3
4
5
				
						from sklearn.cluster import KMeans
 
kmeans = KMeans(n_clusters=4)
kmeans.fit(X)
Y = kmeans.predict(X)
					
				
			
		



मैटप्लॉटलिब के साथ क्लस्टर्स का दृश्यांकन
दृश्यांकन क्लस्टरिंग के परिणामों की व्याख्या में मदद करता है। हम प्रत्येक क्लस्टर के लिए बिखराव वाले प्लॉट बनाने के लिए matplotlib.pyplot का उपयोग करेंगे।

  लाइब्रेरी इम्पोर्ट करें:
    



		
		
			
			
Java
			
			import matplotlib.pyplot as plt
			
				
					
				
					1
				
						import matplotlib.pyplot as plt
					
				
			
		


  
  प्रत्येक क्लस्टर को प्लॉट करें:
    प्रत्येक क्लस्टर लेबल के माध्यम से पुनरावृत्ति करें, उस क्लस्टर से संबंधित डेटा बिंदुओं को फ़िल्टर करें, और उन्हें विशिष्ट रंगों और लेबल के साथ प्लॉट करें।
    



		
		
			
			
Java
			
			colors = ['blue', 'red', 'pink', 'black']
for i in range(4):
    plt.scatter(X[Y == i, 0], X[Y == i, 1], 
                c=colors[i], label=f'Cluster {i}')
			
				
					
				
					1
2
3
4
				
						colors = ['blue', 'red', 'pink', 'black']
for i in range(4):
    plt.scatter(X[Y == i, 0], X[Y == i, 1], 
                c=colors[i], label=f'Cluster {i}')
					
				
			
		


  
  क्लस्टर केंद्रों को प्रदर्शित करें:
    प्रत्येक क्लस्टर के केंद्रीय बिंदु को उजागर करने के लिए क्लस्टर केंद्रों को प्लॉट करें।
    



		
		
			
			
Java
			
			plt.scatter(kmeans.cluster_centers_[:, 0], 
            kmeans.cluster_centers_[:, 1], 
            s=300, c='green', label='Centroids')
			
				
					
				
					1
2
3
				
						plt.scatter(kmeans.cluster_centers_[:, 0], 
            kmeans.cluster_centers_[:, 1], 
            s=300, c='green', label='Centroids')
					
				
			
		


  
  एक्सिस लेबलिंग और लीजेंड जोड़ना:
    पाठ्यपाठ्यता बढ़ाने के लिए एक्सिस लेबल करें और लीजेंड जोड़ें।
    



		
		
			
			
Java
			
			plt.xlabel('Instagram Visit Score')
plt.ylabel('Spending Score')
plt.legend()
plt.show()
			
				
					
				
					1
2
3
4
				
						plt.xlabel('Instagram Visit Score')
plt.ylabel('Spending Score')
plt.legend()
plt.show()
					
				
			
		


  


क्लस्टर्स की व्याख्या करना
दृश्यांकन करने पर, आप विभिन्न उपयोगकर्ता खंडों का प्रतिनिधित्व करने वाले स्पष्ट क्लस्टर्स देखेंगे:

  क्लस्टर 0 & 2: कम खर्च रैंकों वाले उपयोगकर्ता।
  क्लस्टर 1 & 3: उच्च खर्च रैंकों वाले उपयोगकर्ता, जो विपणन प्रयासों के लिए प्रमुख लक्ष्य बनते हैं।


विशिष्ट क्लस्टर डेटा निकालना
लक्षित विपणन करने के लिए, आप विशिष्ट क्लस्टर्स पर ध्यान केंद्रित करना चाह सकते हैं। उदाहरण के लिए, क्लस्टर 1 से उपयोगकर्ताओं को निकालने के लिए:




		
		
			
			
Java
			
			cluster_1_data = data[Y == 1]
print(f"Number of users in Cluster 1: {len(cluster_1_data)}")
			
				
					
				
					1
2
				
						cluster_1_data = data[Y == 1]
print(f"Number of users in Cluster 1: {len(cluster_1_data)}")
					
				
			
		


यह कोड डेटासेट को फिल्टर करता है ताकि केवल उन उपयोगकर्ताओं को शामिल किया जा सके जिन्हें क्लस्टर 1 सौंपा गया है, जिससे अनुकूलित विपणन रणनीतियों की अनुमति मिलती है।

प्रायोगिक अनुप्रयोग: लक्षित विपणन
अपने क्लस्टर्स को समझने से रणनीतिक निर्णय लेने में सहायता मिलती है। उदाहरण के लिए:

  विपणन बजट आवंटन: उच्च खर्च स्कोर वाले क्लस्टर्स में अधिक संसाधन आवंटित करें।
  व्यक्तिगत अभियान: प्रत्येक क्लस्टर की विशिष्ट विशेषताओं के साथ प्रतिध्वनित होने वाले अभियानों को डिज़ाइन करें।


निष्कर्ष और अगले कदम
K-मीन्स क्लस्टरिंग आपके डेटा में छुपे पैटर्न को उजागर करने के लिए एक शक्तिशाली उपकरण है। इन क्लस्टर्स को प्रभावी ढंग से दृश्यांकित और व्याख्या करके, व्यवसाय अपनी विपणन रणनीतियों को बेहतर बनाने के लिए सूचित निर्णय ले सकते हैं।
हमारे अगले सत्र में, हम एलबो मेथड के वैकल्पिक तरीकों का अन्वेषण करेंगे, जिससे इष्टतम क्लस्टर चयन के लिए अपने दृष्टिकोण को और परिष्कृत किया जा सकेगा। जुड़े रहें!



साथ देने के लिए धन्यवाद! मुझे उम्मीद है कि इस गाइड ने पायथन में K-मीन्स क्लस्टरिंग की प्रक्रिया को स्पष्ट किया है। खुश क्लस्टरिंग!