S06L01 – रैखिक प्रतिगमन कार्यप्रणाली और लागत फलन

html
लीनियर रिग्रेशन को समझना: एआई और मशीन लर्निंग की नींव

सामग्री तालिका

लीनियर रिग्रेशन क्या है?

  लीनियर रिग्रेशन के मुख्य घटक
  
    परिकल्पना फ़ंक्शन
    परिमाण: B0 और B1
  

उदाहरण को समझना: आयु बनाम वजन
लागत फ़ंक्शन
उत्तम समाधान ढूंढना
चुनौतियाँ: स्थानीय न्यूनतम
निष्कर्ष


लीनियर रिग्रेशन क्या है?

लीनियर रिग्रेशन एक पर्यवेक्षित शिक्षा एल्गोरिदम है जो एक या अधिक पूर्वानुमानकर्ता चर के आधार पर एक सतत परिणाम चर की भविष्यवाणी करने के लिए उपयोग किया जाता है। सरल शब्दों में, यह चर के बीच के संबंध को समझने और भविष्य के रुझानों का पूर्वानुमान लगाने में मदद करता है।



चित्र: आयु और वजन के बीच संबंध दिखाने वाला एक सरल लीनियर रिग्रेशन ग्राफ।

लीनियर रिग्रेशन के मुख्य घटक

परिकल्पना फ़ंक्शन

लीनियर रिग्रेशन के मूल में परिकल्पना फ़ंक्शन होता है, जो इनपुट चर और आउटपुट के बीच के संबंध को मॉडल करता है। लीनियर रिग्रेशन में परिकल्पना फ़ंक्शन का सामान्य रूप है:





		
		
			
			
Java
			
			H = B0 + B1 × Y
			
				
					
				
					1
				
						H = B0 + B1 × Y
					
				
			
		



यहां, H पूर्वानुमानित मान का प्रतिनिधित्व करता है, B0 y-अवरोध है, और B1 रेखा की ढलान है।

परिमाण: B0 और B1


B0 (अवरोध): यह परिमाण तब Y का मान दर्शाता है जब सभी पूर्वानुमानकर्ता चर शून्य होते हैं। यह वह बिंदु है जहाँ रेखा Y-अक्ष को पार करती है।
B1 (ढलान): यह परिमाण रेखा की खड़ापन को निर्धारित करता है। यह संकेत देता है कि पूर्वानुमानकर्ता चर में एक इकाई परिवर्तन के साथ Y कितना बदलता है।


विभिन्न संसाधनों में B0 और B1 के स्थान पर θ₀ और θ₁ जैसे विभिन्न संकेतन भी उपयोग किए जाते हैं।

उदाहरण को समझना: आयु बनाम वजन

लीनियर रिग्रेशन को दृश्य रूप में समझने के लिए, चलिए एक काल्पनिक उदाहरण पर विचार करते हैं जहां हम एक बच्चे की आयु और उनके वजन के बीच के संबंध की जांच करते हैं। मान लीजिए हमारे पास ग्राफ पर चित्रित आँकड़ों की बिंदु हैं:


X-अक्ष: बच्चे की आयु (0 से 10 वर्ष तक का पैमाना)
Y-अक्ष: वजन किलोग्राम में




चित्र: फिट की गई लीनियर रिग्रेशन रेखा के साथ आयु बनाम वजन डेटा बिंदु।

इस ग्राफ में, प्रत्येक बिंदु एक बच्चे की आयु और संबंधित वजन को दर्शाता है। यहां लीनियर रिग्रेशन का उद्देश्य सबसे उपयुक्त सीधी रेखा ढूंढना है जो बच्चे की आयु के आधार पर उनके वजन की भविष्यवाणी करती है।

लागत फ़ंक्शन

यह निर्धारित करने के लिए कि हमारा लीनियर रिग्रेशन मॉडल डेटा में कितना फिट बैठता है, हम लागत फ़ंक्शन का उपयोग करते हैं। लागत फ़ंक्शन पूर्वानुमानित मानों और वास्तविक डेटा बिंदुओं के बीच त्रुटि को मापता है।

लागत फ़ंक्शन की गणना

लीनियर रिग्रेशन में सबसे सामान्य रूप से उपयोग किया जाने वाला लागत फ़ंक्शन मीन स्क्वायर्ड एरर (MSE) है, जिसे निम्नानुसार परिभाषित किया जाता है:





		
		
			
			
Java
			
			Cost = (1/m) * Σ (Hi - Yi)^2
			
				
					
				
					1
				
						Cost = (1/m) * Σ (Hi - Yi)^2
					
				
			
		



जहां:

m = डेटा बिंदुओं की संख्या
Hi = i^थ डेटा बिंदु के लिए पूर्वानुमानित मान
Yi = i^थ डेटा बिंदु के लिए वास्तविक मान



अंतर को वर्ग करके, लागत फ़ंक्शन सुनिश्चित करता है कि सभी त्रुटियाँ सकारात्मक हों और छोटे त्रुटियों की तुलना में बड़ी त्रुटियों पर अधिक जोर दिया जाए।



चित्र: डेटा बिंदुओं और रिग्रेशन लाइन के बीच की दूरी दिखाते हुए लागत फ़ंक्शन का विज़ुअलाइज़ेशन।

कम लागत मॉडल के डेटा में बेहतर फिट को संकेत करती है।

उत्तम समाधान ढूंढना

लीनियर रिग्रेशन में उद्देश्य लागत फ़ंक्शन को न्यूनतम करना है। इसमें परिमाण B0 और B1 को समायोजित करना शामिल है ताकि डेटा में सबसे उपयुक्त रेखा मिल सके।

स्टेप-बाय-स्टेप प्रक्रिया:


परिमाण प्रारंभ करना: B0 और B1 के लिए यादृच्छिक मानों से शुरू करें।
पूर्वानुमान की गणना: सभी डेटा बिंदुओं के लिए परिकल्पना फ़ंक्शन का उपयोग करके पूर्वानुमानित मान (H) की गणना करें।
लागत की गणना: पूर्वानुमानित और वास्तविक मानों का उपयोग करके लागत फ़ंक्शन का मूल्यांकन करें।
परिमाण अपडेट करें: लागत को कम करने के लिए B0 और B1 को समायोजित करें।
दोहराएं: प्रक्रिया को तब तक दोहराएं जब तक लागत न्यूनतम मान पर नहीं पहुँच जाती।


उदाहरण के लिए, B1 = 5 से शुरू करने पर लागत अधिक हो सकती है क्योंकि वास्तविक डेटा बिंदुओं से बड़े विचलन हो सकते हैं। B1 को 2.5 जैसे मान पर समायोजित करने से लागत में उल्लेखनीय कमी आ सकती है, जो बेहतर फिट को दर्शाता है।

चुनौतियाँ: स्थानीय न्यूनतम

लागत फ़ंक्शन को न्यूनतम करने की प्रक्रिया में, एल्गोरिदम स्थानीय न्यूनतम का सामना कर सकते हैं—ऐसे बिंदु जहां लागत किसी विशेष क्षेत्र के भीतर न्यूनतम होती है लेकिन यह सबसे कम संभव लागत नहीं होती। इसका मतलब है कि एल्गोरिदम उत्तम समाधान के बजाय एक निकटवर्ती समाधान पर ठहर सकता है।

हालांकि, व्यवहार में, विशेष रूप से लीनियर रिग्रेशन के साथ, लागत फ़ंक्शन के समकोणीय स्वभाव के कारण वैश्विक न्यूनतम को खोजना अक्सर सीधा होता है। फिर भी, स्थानीय न्यूनतम की अवधारणा को समझना महत्वपूर्ण है, विशेष रूप से जब अधिक जटिल मॉडलों से निपटते हैं।

निष्कर्ष

लीनियर रिग्रेशन एआई और मशीन लर्निंग की विशाल दुनिया में प्रवेश का एक कदम है। इसके मुख्य सिद्धांतों—जैसे परिकल्पना फ़ंक्शन, लागत फ़ंक्शन, और परिमाण अनुकूलन—को समझकर, आप अधिक उन्नत एल्गोरिदम और मॉडलों को संभालने के लिए एक ठोस आधार रखते हैं। चाहे आप आयु और वजन जैसे सरल डेटासेट का विश्लेषण कर रहे हों या जटिल एआई प्रणालियों में डुबकी लगा रहे हों, लीनियर रिग्रेशन में महारत हासिल करना अनिवार्य है।



कीवर्ड्स: लीनियर रिग्रेशन, एआई, मशीन लर्निंग, लागत फ़ंक्शन, परिकल्पना फ़ंक्शन, B0, B1, आयु बनाम वजन, पूर्वानुमान मॉडलिंग, पर्यवेक्षित शिक्षा, मीन स्क्वायर्ड एरर, स्थानीय न्यूनतम