S18L02 – सह-विविधता

html

वेरिएंस, कोवेरिएंस, और सहसंबंध को समझना: एक व्यापक गाइड

सामग्री सूची

  1. परिचय
  2. वेरिएंस: डेटा प्रसार को मापना
  3. कोवेरिएंस: संयुक्त परिवर्तनशीलता को समझना
  4. सहसंबंध: संबंधों की ताकत का मापन
  5. व्यावहारिक उदाहरण: वाइन में अवशिष्ट शुगर बनाम गुणवत्ता
  6. सकारात्मक और नकारात्मक ढलान: संबंधों की व्याख्या
  7. वेरिएंस, कोवेरिएंस, और सहसंबंध की गणना
  8. निष्कर्ष

परिचय

डेटासेट का विश्लेषण करते समय, यह समझना महत्वपूर्ण है कि प्रत्येक चर की व्यक्तिगत विशेषताओं के साथ-साथ वे एक-दूसरे के साथ कैसे इंटरैक्ट करते हैं। वेरिएंस यह मापता है कि एकल चर अपने माध्य से कितना विचलित होता है, जबकि कोवेरिएंस और सहसंबंध यह आंकलन करते हैं कि दो चर साथ में कैसे बदलते हैं। इन अवधारणाओं में महारत हासिल करने से डेटा की सटीक व्याख्याएं और सूचित निर्णय लेने में सक्षम बनता है।

वेरिएंस: डेटा प्रसार को मापना

वेरिएंस यह मापता है कि एक सेट में प्रत्येक डेटा बिंदु अपने माध्य (औसत) से कितना भिन्न होता है। यह डेटा के प्रसार या फैलाव के बारे में अंतर्दृष्टि प्रदान करता है।

वेरिएंस का सूत्र

\( n \) पर्यवेक्षणों वाले डेटासेट के लिए, वेरिएंस (\( \sigma^2 \)) इस प्रकार गणना की जाती है:

  • \( X_i \): प्रत्येक व्यक्तिगत डेटा बिंदु
  • \( \mu \): डेटासेट का माध्य
  • \( n \): पर्यवेक्षणों की संख्या

उदाहरण गणना

मान लीजिए एक विशिष्ट वाइन ब्रांड के गुणवत्ता स्कोर का निम्नलिखित डेटासेट है:

पर्यवेक्षण गुणवत्ता स्कोर (\( X \))
1 50
2 100
3 200
4 250
5 300
6 400
  1. माध्य (\( \mu \)) की गणना करें:
  1. माध्य से प्रत्येक विचलन की गणना करें और उसे वर्ग करें:
\( X_i \) \( X_i - \mu \) \( (X_i - \mu)^2 \)
50 -166.67 27,778
100 -116.67 13,611
200 -16.67 278
250 33.33 1,111
300 83.33 6,944
400 183.33 33,611
  1. वर्गीकृत विचलनों का योग:
  1. वेरिएंस की गणना करें:

व्याख्या: उच्च वेरिएंस उच्च प्रसार को इंगित करता है, जिसका अर्थ है कि गुणवत्ता स्कोर व्यापक सीमा में फैले हुए हैं।

कोवेरिएंस: संयुक्त परिवर्तनशीलता को समझना

कोवेरिएंस दो चर के बीच दिशात्मक संबंध को मापता है। यह इंगित करता है कि क्या एक चर में वृद्धि होने पर दूसरा चर भी वृद्धि (सकारात्मक कोवेरिएंस) या कमी (नकारात्मक कोवेरिएंस) की ओर प्रवृत्त होता है।

कोवेरिएंस का सूत्र

दो चर \( X \) और \( Y \) के लिए जिनमें प्रत्येक में \( n \) पर्यवेक्षण हैं, कोवेरिएंस (\( \text{Cov}(X,Y) \)) इस प्रकार गणना की जाती है:

  • \( \mu_X \), \( \mu_Y \): क्रमशः चर \( X \) और \( Y \) के माध्य

सकारात्मक बनाम नकारात्मक कोवेरिएंस

  • सकारात्मक कोवेरिएंस: यह इंगित करता है कि जैसे-जैसे \( X \) बढ़ता है, \( Y \) भी बढ़ने की प्रवृत्ति रखता है।
  • नकारात्मक कोवेरिएंस: यह सुझाव देता है कि जैसे-जैसे \( X \) बढ़ता है, \( Y \) कम होने की प्रवृत्ति रखता है।

उदाहरण गणना

पिछले डेटासेट का उपयोग करते हुए, मान लेते हैं कि उसी वाइन ब्रांड के अवशिष्ट शुगर स्तर निम्नलिखित हैं:

पर्यवेक्षण अवशिष्ट शुगर (\( Y \))
1 3
2 4
3 5
4 6
5 7
6 8
  1. माध्य की गणना करें:

- \( X \) (गुणवत्ता स्कोर) का माध्य:

- \( Y \) (अवशिष्ट शुगर) का माध्य:

  1. विचलनों के गुणनफल की गणना करें:
पर्यवेक्षण \( X_i - \mu_X \) \( Y_i - \mu_Y \) \( (X_i - \mu_X)(Y_i - \mu_Y) \)
1 -166.67 -2.5 416.675
2 -116.67 -1.5 175.005
3 -16.67 -0.5 8.335
4 33.33 0.5 16.665
5 83.33 1.5 124.995
6 183.33 2.5 458.325
  1. गुणनफलों का योग:
  1. कोवेरिएंस की गणना करें:

व्याख्या: लगभग 240 की सकारात्मक कोवेरिएंस यह इंगित करती है कि अवशिष्ट शुगर और गुणवत्ता के बीच सकारात्मक संबंध है। जैसे-जैसे अवशिष्ट शुगर बढ़ता है, गुणवत्ता स्कोर भी बढ़ने की प्रवृत्ति रखता है।

सहसंबंध: संबंधों की ताकत का मापन

जबकि कोवेरिएंस किसी संबंध की दिशा को इंगित करता है, सहसंबंध दो चर के बीच संबंध की ताकत और दिशा दोनों को मात्रात्मक रूप से व्यक्त करता है। कोवेरिएंस के विपरीत, सहसंबंध मानकीकृत होता है, जिससे इसे समझना और विभिन्न डेटासेट्स में तुलना करना आसान होता है।

सहसंबंध का सूत्र

पियर्सन सहसंबंध गुणांक (\( r \)) इस प्रकार गणना की जाती है:

  • \( \text{Cov}(X,Y) \): \( X \) और \( Y \) की कोवेरिएंस
  • \( \sigma_X \), \( \sigma_Y \): क्रमशः \( X \) और \( Y \) के मानक विचलन

सहसंबंध मानों की व्याख्या

  • \( r = 1 \): पूर्ण सकारात्मक सहसंबंध
  • \( r = -1 \): पूर्ण नकारात्मक सहसंबंध
  • \( r = 0 \): कोई सहसंबंध नहीं
  • \( 0 < |r| < 1 \): विभिन्न डिग्री का सकारात्मक या नकारात्मक सहसंबंध

उदाहरण गणना

पिछली कोवेरिएंस मान (\( \text{Cov}(X,Y) = 240 \)) और \( X \) का वेरिएंस (\( \sigma_X^2 = 16,446.6 \)) का उपयोग करते हुए, मानक विचलन की गणना करते हैं:

  1. \( X \) का मानक विचलन:
  1. \( Y \) का वेरिएंस:

अवशिष्ट शुगर के लिए वेरिएंस की गणना करें:

  1. \( Y \) का मानक विचलन:
  1. सहसंबंध की गणना करें:

सूचना: मध्यवर्ती चरणों में राउंडिंग त्रुटियों के कारण गणितीय सहसंबंध थोड़ा 1 से अधिक हो सकता है। व्यवहार में, सहसंबंध गुणांक -1 और 1 के बीच होता है।

व्याख्या: 1 के करीब सहसंबंध गुणांक यह दर्शाता है कि अवशिष्ट शुगर और गुणवत्ता के बीच बहुत मजबूत सकारात्मक संबंध है, जो पहले देखे गए सकारात्मक कोवेरिएंस को मजबूत करता है।

व्यावहारिक उदाहरण: वाइन में अवशिष्ट शुगर बनाम गुणवत्ता

आइए अवशिष्ट शुगर और वाइन गुणवत्ता के बीच संबंध पर ध्यान केंद्रित करते हुए अपने ज्ञान को एक व्यावहारिक उदाहरण से मजबूत करें।

डेटासेट का अवलोकन

पर्यवेक्षण अवशिष्ट शुगर (\( Y \)) गुणवत्ता स्कोर (\( X \))
1 3 50
2 4 100
3 5 200
4 6 250
5 7 300
6 8 400

रिश्ते का विश्लेषण करने के कदम

  1. माध्य की गणना करें:
  1. विचलन और गुणनफल की गणना करें:

- जैसा कि पहले दिखाया गया है, कोवेरिएंस खोजने के लिए विचलनों के गुणनफल को जोड़ें।

  1. कोवेरिएंस और सहसंबंध निर्धारित करें:

- कोवेरिएंस \( \approx 240 \)

- सहसंबंध \( \approx 1.002 \)

व्याख्या

सकारात्मक कोवेरिएंस और उच्च सहसंबंध गुणांक यह इंगित करते हैं कि अवशिष्ट शुगर और गुणवत्ता स्कोर के बीच मजबूत सकारात्मक संबंध है। यह सुझाव देता है कि इस डेटासेट में, जैसे-जैसे अवशिष्ट शुगर बढ़ता है, वाइन की गुणवत्ता स्कोर भी बढ़ने की प्रवृत्ति रखती है।

सीमितता: जबकि सहसंबंध मजबूत संबंध को इंगित करता है, यह कारणता का संकेत नहीं देता। अन्य कारक भी अवशिष्ट शुगर और गुणवत्ता स्कोर दोनों को प्रभावित कर सकते हैं।

सकारात्मक और नकारात्मक ढलान: संबंधों की व्याख्या

चर के बीच संबंध की दिशा को समझना सटीक डेटा व्याख्या के लिए महत्वपूर्ण है।

सकारात्मक ढलान

एक सकारात्मक ढलान का मतलब है कि जैसे-जैसे एक चर बढ़ता है, दूसरा चर भी बढ़ता है। यह हमारे व्यावहारिक उदाहरण में स्पष्ट है जहां अवशिष्ट शुगर और गुणवत्ता स्कोर दोनों एक ही दिशा में बढ़ते हैं।

नकारात्मक ढलान

एक नकारात्मक ढलान यह इंगित करता है कि जैसे-जैसे एक चर बढ़ता है, दूसरा चर घटता है। उदाहरण के लिए, यदि किसी उत्पाद की कीमत और उसकी मांग के बीच संबंध विश्लेषण किया जाए, तो एक नकारात्मक सहसंबंध यह सुझाव दे सकता है कि उच्च कीमतें कम मांग की ओर ले जाती हैं।

दृश्य प्रस्तुति

एक फिटेड रिग्रेशन लाइन के साथ स्कैटर प्लॉट बनाना इन संबंधों को दृश्य रूप में दिखाने में मदद कर सकता है। सकारात्मक ढलान ऊपर की ओर बढ़ेगी, जबकि नकारात्मक ढलान नीचे की ओर बढ़ेगी।

वेरिएंस, कोवेरिएंस, और सहसंबंध की गणना

आइए हमारे डेटासेट का उपयोग करके चरण-दर-चरण गणनाओं पर चलते हैं।

चरण 1: माध्य की गणना करें

चरण 2: विचलन और गुणनफल की गणना करें

\( X_i \) \( Y_i \) \( X_i - \mu_X \) \( Y_i - \mu_Y \) \((X_i - \mu_X)(Y_i - \mu_Y)\)
50 3 -166.67 -2.5 416.675
100 4 -116.67 -1.5 175.005
200 5 -16.67 -0.5 8.335
250 6 33.33 0.5 16.665
300 7 83.33 1.5 124.995
400 8 183.33 2.5 458.325

गुणनफलों का योग: \( \sum (X_i - \mu_X)(Y_i - \mu_Y) = 1,199.975 \)

चरण 3: कोवेरिएंस की गणना करें

चरण 4: मानक विचलन की गणना करें

  • \( X \) का मानक विचलन:
  • \( Y \) का मानक विचलन:

चरण 5: सहसंबंध की गणना करें

सूचना: सहसंबंध मानों में विसंगतियों से बचने के लिए गणनाओं में सटीकता सुनिश्चित करें।

निष्कर्ष

वेरिएंस, कोवेरिएंस, और सहसंबंध बुनियादी सांख्यिकीय माप हैं जो विश्लेषकों को डेटा वितरण और अंतर-चर संबंधों को समग्र रूप से समझने में सक्षम बनाते हैं। इन अवधारणाओं में महारत हासिल करके, आप सार्थक पैटर्न खोज सकते हैं, सूचित निर्णय ले सकते हैं, और विभिन्न क्षेत्रों में रणनीतिक पहलों को आगे बढ़ा सकते हैं।

चाहे आप डेटा विज्ञान, वित्त, विपणन, या किसी भी क्षेत्र में हों जो डेटा-आधारित अंतर्दृष्टियों पर निर्भर करता है, इन सांख्यिकीय उपकरणों को समझना अनिवार्य है। याद रखें, जबकि सांख्यिकीय माप मूल्यवान जानकारी प्रदान करते हैं, हमेशा व्यापक संदर्भ और अन्य प्रभावी कारकों पर विचार करें ताकि सटीक और व्यावहारिक व्याख्याएं सुनिश्चित की जा सकें।


कीवर्ड्स: वेरिएंस, कोवेरिएंस, सहसंबंध, डेटा विश्लेषण, सांख्यिकीय माप, अवशिष्ट शुगर, वाइन गुणवत्ता, सकारात्मक ढलान, नकारात्मक ढलान, पियर्सन सहसंबंध गुणांक, डेटा प्रसार, संयुक्त परिवर्तनशीलता, चर के बीच संबंध

Share your love