כיצד לחשב את המשתנות?
כדי לחשב את המשתנות, התחל על ידי הפחתת הממוצע של נקודות x-data מכל אחת מנקודות ה- x-data. לאחר מכן, חזור על נקודות ה- y-data. לאחר מכן, הכפל את התוצאות עבור כל זוג נקודות נתונים xy והוסף את כל המוצרים יחד. לבסוף, חלק את המספר הזה במספר הזוגות הכולל מינוס 1 כדי לקבל את המשתנות. כדי ללמוד כיצד לחשב את המשתנות באמצעות גיליון אלקטרוני של Excel, גלול מטה!
משתנה הוא חישוב סטטיסטי המסייע לך להבין כיצד שתי קבוצות נתונים קשורות זו לזו. לדוגמא, נניח שאנתרופולוגים בוחנים את הגבהים והמשקלים של אוכלוסיית אנשים בתרבות כלשהי. עבור כל אדם במחקר, ניתן לייצג את הגובה והמשקל על ידי זוג נתונים (x, y). ניתן להשתמש בערכים אלה עם נוסחה סטנדרטית לחישוב הקשר המשותף. מאמר זה יסביר תחילה את החישובים הנמצאים במציאת המשתנות של מערך נתונים. לאחר מכן היא תטפל בשתי דרכים אוטומטיות נוספות למצוא את התוצאה.
שיטה 1 מתוך 4: חישוב המשתנות ביד בעזרת הנוסחה הסטנדרטית
- 1למדו את הנוסחה הקובריאנטית הסטנדרטית וחלקיה. הנוסחה הסטנדרטית לחישוב המשתנות היא Σ (xi − xavg) (yi − yavg) / (n − 1) {\ displaystyle \ Sigma (x_ {i} -x _ {\ text {avg}}) (y_ {i} - y _ {\ text {avg}}) / (n-1)}. כדי להשתמש בנוסחה זו, עליך להבין את משמעות המשתנים והסמלים:
- Σ {\ displaystyle \ Sigma} - סמל זה הוא האות היוונית "סיגמא". בפונקציות מתמטיקה פירושו להוסיף סדרה של כל מה שעוקב אחריה. בנוסחה זו, הסימן Σ פירושו שתחשב את הערכים הבאים במונה השבר, ותוסיף את כולם יחד, לפני שתחלק לפי המכנה.
- xi {\ displaystyle x_ {i}} - משתנה זה נקרא "x תת i." כתב ה- i מייצג מונה. המשמעות היא שתבצע את החישוב עבור כל ערך x שיש לך בערכת הנתונים שלך.
- xavg {\ displaystyle x_ {avg}} - "ממוצע" מציין ש- x (ממוצע) הוא הערך הממוצע של כל נקודות ה- x של הנתונים שלך. הממוצע נכתב לפעמים גם כ- x עם קו אופקי קצר שנמשך מעליו. בסגנון זה, המשתנה נקרא "סרגל x", אך עדיין פירושו הממוצע של מערך הנתונים.
- yi {\ displaystyle y_ {i}} - משתנה זה נקרא "y sub i". כתב ה- i מייצג מונה. המשמעות היא שתבצע את החישוב עבור כל ערך y שיש לך במערך הנתונים שלך.
- yavg {\ displaystyle y_ {avg}} - "ממוצע" מציין ש- y (ממוצע) הוא הערך הממוצע של כל נקודות הנתונים y שלך. לפעמים הממוצע נכתב גם כ ay עם קו אופקי קצר שנמשך מעליו. בסגנון זה, המשתנה נקרא "סרגל y", אך עדיין פירושו הממוצע של מערך הנתונים.
- n {\ displaystyle n} - משתנה זה מייצג את מספר הפריטים במערכת הנתונים שלך. זכור כי לבעיית ריבוי משתנה, "פריט" אחד מורכב גם מ- x וגם מ- y. הערך של n הוא מספר זוגות נקודות הנתונים, ולא מספרים בודדים.
- 2הגדר את טבלת הנתונים שלך. לפני שתתחיל לעבוד, כדאי לאסוף את הנתונים שלך. עליכם ליצור טבלה המורכבת מחמש עמודות. עליך לתייג כל עמודה באופן הבא:
- x {\ displaystyle x} - מלא עמודה זו בערכים של נקודות ה- x-data שלך.
- y {\ displaystyle y} - מלא עמודה זו בערכים של נקודות ה- y שלך. היזהר ליישר את ערכי ה- y לערכי ה- x המתאימים. בבעיית משתנות, סדר נקודות הנקודות והזיווג של x ו- y חשובים.
- (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} - השאר עמודה זו ריקה בהתחלה. תוכלו למלא אותו בנתונים לאחר חישוב הממוצע של נקודות ה- x-data.
- (yi − yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})} - השאר עמודה זו ריקה בהתחלה. תוכלו למלא אותו בנתונים לאחר חישוב הממוצע של נקודות ה- y.
- מוצר {\ displaystyle {\ text {Product}}} - השאר גם עמודה אחרונה ריקה. אתה תמלא אותו ככל שתעבור.
- 3חשב את הממוצע של נקודות ה- x-data. ערכת נתונים לדוגמא זו מכילה 9 מספרים. כדי למצוא את הממוצע, הוסף אותם יחד וחלק את הסכום ב- 9. זה נותן לך את התוצאה של 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. כשמחלקים ב- 9, הממוצע הוא 4,89. זה הערך שתשתמש בו כ- x (ממוצע) לחישובים הבאים.
- 4חשב את הממוצע של נקודות נתוני y. באופן דומה, עמודה y צריכה להיות מורכבת מ -9 נקודות נתונים העולות בקנה אחד עם נקודות ה- x-data. מצא את הממוצע של אלה. עבור ערכת נתונים לדוגמא זו, זה יהיה 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. חלק את הסכום הזה ב 9 כדי לקבל 5,44 בממוצע. תשתמש ב -5,44 כערך y (ממוצע) לחישובים הבאים.
- 5חשב את הערכים (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} . עבור כל פריט בעמודה x, עליך למצוא את ההבדל בין מספר זה לערך הממוצע. לבעיית דוגמה זו פירוש הדבר לחסר 4,89 מכל נקודת x-data. אם נקודת הנתונים המקורית נמוכה מהממוצע, התוצאה שלך תהיה שלילית. אם נקודת הנתונים המקורית גדולה מהממוצע, התוצאה שלך תהיה חיובית. הקפד לעקוב אחר הסימנים השליליים.
- לדוגמה, נקודת הנתונים הראשונה בעמודה x היא 1. הערך שיש להזין בשורה הראשונה של העמודה (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} הוא 1-4,89, שזה -3,89.
- חזור על התהליך עבור כל נקודת נתונים. לכן השורה השנייה תהיה 3-4,89 שהם -1,89. השורה השלישית תהיה 2-4,89, או -2,89. המשך בתהליך עבור כל נקודות הנתונים. תשעת המספרים בעמודה זו צריכים להיות -3,89, -1,89, -2,89, 0,11, 3,11, 2,11, 7,11, -2,89, -0,89.
- 6חשב את הערכים (yi − yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})} . בעמודה זו תבצע חיסורים דומים תוך שימוש בנקודות נתוני y ובממוצע y. אם נקודת הנתונים המקורית נמוכה מהממוצע, התוצאה שלך תהיה שלילית. אם נקודת הנתונים המקורית גדולה מהממוצע, התוצאה שלך תהיה חיובית. הקפד לעקוב אחר הסימנים השליליים.
- לכן בשורה הראשונה החישוב שלך יהיה 8-5,44, שהם 2,56.
- השורה השנייה תהיה 6-5,44, שהם 0,56.
- המשך בחיסורים אלה עד סוף רשימת הנתונים. כשתסיים, תשעת הערכים בעמודה זו צריכים להיות 2,56, 0,56, 3,56, -1,44, -2,44, -2,44, -3,44, 1,56, 1, 56.
- 7חשב את המוצרים עבור כל שורת נתונים. תמלא את שורות העמודה הסופית על ידי הכפלת המספרים שחישבת בשתי העמודות הקודמות של (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} ו- (yi −yavg) {\ displaystyle (y_ {i} -y _ {\ text {avg}})} . הקפידו לעבוד שורה אחר שורה, והכפלו את שני המספרים לנקודות הנתונים המתאימות. עקוב אחר כל הסימנים השליליים תוך כדי.
- בשורה הראשונה של דוגמת הנתונים הזו, (xi − xavg) {\ displaystyle (x_ {i} -x _ {\ text {avg}})} שחישבתם הוא -3,89, וה- (yi − yavg) הערך {\ displaystyle (y_ {i} -y _ {\ text {avg}})} הוא 2,56. התוצר של שני המספרים האלה הוא -3,89 * 2,56 = -9,96.
- בשורה השנייה תכפיל את שני המספרים -1,88 * 0,56 = -1,06.
- המשך להכפיל שורה אחר שורה עד סוף מערך הנתונים. בסיום, תשעת הערכים בעמודה זו צריכים להיות -9,96, -1,06, -10,29, -0,16, -7,59, -5,15, -24,46, -4, 51, -1,39.
- 8מצא את סכום הערכים בעמודה האחרונה. כאן נכנס לתמונה סמל into. לאחר ביצוע כל החישובים שעשית עד כה, תוסיף את התוצאות. עבור קבוצת נתונים לדוגמה זו, אמורים להיות לך תשעה ערכים בעמודה הסופית. הוסף את תשעת המספרים האלה יחד. שים לב בזהירות אם כל מספר חיובי או שלילי.
- עבור קבוצת נתונים לדוגמה זו, הסכום צריך להיות -64,57. כתוב את הסכום הזה ברווח שבתחתית העמודה. זה מייצג את הערך של המונה של הנוסחה המשותפת הסטנדרטית.
- 9חשב את המכנה לנוסחת השונות. המונה לנוסחת הקובריאנטיות הסטנדרטית הוא הערך שרק סיימת לחשב. המכנה מיוצג על ידי (n-1), שהוא אחד פחות ממספר זוגות הנתונים בערכת הנתונים שלך.
- לבעיית דוגמה זו ישנם תשעה זוגות נתונים, כך ש- n הוא 9. הערך של (n-1), לפיכך, הוא 8.
- 10חלק את המונה לפי המכנה. השלב האחרון בחישוב המשתנות הוא לחלק את המונה שלך, Σ (xi − xavg) (yi − yavg) {\ displaystyle \ Sigma (x_ {i} -x _ {\ text {avg}}) (y_ {i} - y _ {\ text {avg}})} לפי המכנה שלך, (n − 1) {\ displaystyle (n-1)} . המרכיב הוא המשתנות של הנתונים שלך.
- עבור קבוצת נתונים לדוגמה זו, חישוב זה הוא -64,50.88, שנותן את התוצאה של -8,07.
שיטה 2 מתוך 4: שימוש בגליון אלקטרוני של Excel לחישוב משתנות
- 1שימו לב לחישובים החוזרים על עצמם. משתנות היא חישוב שכדאי לבצע כמה פעמים ביד, כך שתבינו את משמעות התוצאה. עם זאת, אם אתה עומד להשתמש בערכי משתנות באופן שגרתי בפרשנות נתונים, תרצה למצוא דרך מהירה ואוטומטית יותר להשיג את התוצאות שלך. אתה צריך לשים לב עד עכשיו עבור מערך הנתונים הקטן יחסית שלנו של תשעה זוגות נתונים בלבד, החישובים כללו מציאת שני ממוצעים, ביצוע שמונה עשרה חיסורים בודדים, תשעה כפלות נפרדות, תוספת אחת וחלוקה סופית. זה 31 חישובים קלים יחסית בכדי למצוא פיתרון אחד. בדרך, אתה מסתכן בהשמטת סימנים שליליים או להעתיק את התוצאות שלך באופן שגוי, ובכך להרוס את התוצאה.
- 2צור גיליון אלקטרוני לחישוב המשתנות. אם נוח לך להשתמש באקסל (או בגיליון אלקטרוני אחר עם יכולות חישוב), תוכל להגדיר טבלה בקלות כדי למצוא משתנות. תייג את הכותרות של חמש עמודות כמו לחישובי הידיים: x, y, (x (i) -x (ממוצע)), (y (i) -y (ממוצע)) ומוצר.
- כדי לפשט את התיוג שלך, אתה יכול לקרוא לעמודה השלישית משהו כמו "x הפרש" והעמודה הרביעית "הפרש y", כל עוד אתה זוכר את משמעות הנתונים.
- אם אתה מתחיל את הטבלה בפינה השמאלית העליונה של הגיליון האלקטרוני, תא A1 יהיה התווית x, כאשר התוויות האחרות עוברות לתא E1.
- 3מלא את נקודות הנתונים. הזן את ערכי הנתונים שלך בשתי העמודות שכותרתו x ו- y. זכור כי סדר נקודות הנתונים חשוב, לכן עליך להתאים כל y לערך ה- x המתאים לו.
- ערכי ה- x שלך יתחילו בתא A2 וימשיכו לרדת במשך כמה נקודות נתונים שתזדקק.
- ערכי y שלך יתחילו בתא B2 וימשיכו לרדת במשך כמה נקודות נתונים שאתה צריך.
- 4מצא את הממוצעים של ערכי x ו- y. אקסל יחשב את הממוצעים עבורך במהירות רבה. בתא הפנוי הראשון שמתחת לכל עמודה של נתונים, הזן את הנוסחה = AVG (A2: A__). מלא את החלל הריק עם מספר התא המתאים לנקודת הנתונים האחרונה שלך.
- לדוגמא, אם יש לך 100 נקודות נתונים, הן ימלאו את התאים A2 עד A101, אז תזין = AVG (A2: A101).
- עבור נתוני y, הזן את הנוסחה = AVG (B2: B101).
- זכור שאתה מתחיל נוסחה ב- Excel עם סימן =.
- 5הזן את הנוסחה עבור העמודה (x (i) -x (ממוצע)). בתא C2 יהיה עליך להזין את הנוסחה כדי לחשב את החיסור הראשון. נוסחה זו תהיה = A2 -__. תוכלו למלא את החלל הריק עם כתובת התא המכילה את הממוצע של נתוני ה- x שלכם.
- לדוגמא של 100 נקודות נתונים, הממוצע יהיה בתא A103, כך שהנוסחה שלך תהיה = A2-A103.
- 6חזור על הנוסחה עבור נקודות הנתונים (y (i) -y (ממוצע)). בעקבות אותה דוגמה, זה יעבור לתא D2. הנוסחה תהיה = B2-B103.
- 7הזן את הנוסחה עבור העמודה "מוצר". בעמודה החמישית, בתא E2, יהיה עליך להזין את הנוסחה כדי לחשב את המוצר של שני התאים הקודמים. זה פשוט יהיה = C2 * D2.
- 8העתק את הנוסחאות למטה כדי למלא את הטבלה. עד כה תכננתם רק את צמד נקודות הנתונים הראשונות בשורה 2. בעזרת העכבר הדגישו את התאים C2, D2 ו- E2. לאחר מכן מקם את הסמן מעל התיבה הקטנה בפינה הימנית התחתונה עד להופעת סימן פלוס. לחץ על לחצן העכבר, החזק אותו כלפי מטה וגרור את העכבר כלפי מטה כדי להרחיב את התיבה המודגשת כדי למלא את כל טבלת הנתונים שלך. שלב זה יעתיק אוטומטית את שלוש הנוסחאות מהתאים C2, D2 ו- E2 לכל הטבלה. אתה אמור לראות את הטבלה באופן אוטומטי עם כל החישובים.
- 9תכנת את סכום העמודה האחרונה. עליכם למצוא את סכום הפריטים בעמודה "מוצר". בתא הפנוי מיד מתחת לנקודת הנתונים האחרונה באותה עמודה, הזן את הנוסחה = סכום (E2: E__). מלא את החלל הריק עם כתובת התא של נקודת הנתונים האחרונה.
- לדוגמא של 100 נקודות נתונים, נוסחה זו תיכנס לתא E103. תזין = סכום (E2: E102).
- 10מצא את המשתנות. אתה יכול לגרום ל- Excel לבצע את החישוב הסופי גם עבורך. החישוב האחרון, בתא E103 בדוגמה שלנו, מייצג את המונה של נוסחת השונות. מיד מתחת לאותו תא, אתה יכול להזין את הנוסחה = E103 / __. מלא את החלל הריק עם מספר נקודות הנתונים שברשותך. בדוגמה שלנו זה יהיה 100. התוצאה תהיה המשתנות של הנתונים שלך.
שיטה 3 מתוך 4: שימוש במחשבונים משתנים באתר
- 1חפש באינטרנט מחשבונים משתנים. מספר בתי ספר, חברות תכנות או מקורות אחרים יצרו אתרים אשר יחשבו עבורך בקלות את ערכי השונות. באמצעות כל מנוע חיפוש, הזן את מונח החיפוש "מחשבון משתנות".
- 2הכנס את המידע שלך. קרא בעיון את ההוראות באתר כדי לוודא שאתה מזין את הנתונים שלך כהלכה. חשוב שזוגות הנתונים שלך יישמרו בסדר, אחרת תניב תוצאה משתנה שגויה. לאתרים שונים יש סגנונות שונים להזנת הנתונים שלך.
- לדוגמא, באתר http://ncalculators.com/statistics/covariance-calculator.htm, יש תיבה אופקית להזנת ערכי x ותיבה אופקית שניה להזנת ערכי y. אתה מוזמן להזין את התנאים שלך, מופרדים רק בפסיקים. לפיכך, ערכת נתוני ה- x שחושבה מוקדם יותר במאמר זה תוזן כ- 13,25,87,122,4. מערך נתוני ה- y יהיה 86,94,33,27,7.
- באתר אחר, https://thecalculator.co/math/Covariance-Calculator-705.html, תתבקש להזין את נתוני ה- x שלך בתיבה הראשונה. הנתונים מוזנים אנכית, עם פריט אחד בכל שורה. לכן הערך באתר זה ייראה כך:
- 1
- 3
- 2
- 5
- 8
- 7
- 12
- 2
- 4
- 3חשב את התוצאות שלך. האטרקציה של אתרי החישוב הללו היא שלאחר הזנת הנתונים שלכם, בדרך כלל עליכם רק ללחוץ על הכפתור שאומר "חשב", והתוצאות יופיעו אוטומטית. רוב האתרים יספקו לך את חישובי הביניים של x (ממוצע), y (ממוצע) ו- n.
שיטה 4 מתוך 4: פירוש תוצאות הדו-משתנות
- 1חפש קשר חיובי או שלילי. המשתנות היא נתון סטטיסטי יחיד המייצג את האופן שבו מערך נתונים אחד מתייחס לאחר. בדוגמה שהוזכרה בהקדמה נמדדים גובה ומשקל. היית מצפה שככל שאנשים יגדלו גבוה יותר, גם משקלם יגדל, מה שמוביל לנתון קויבריאנטיות חיובי. כדוגמה נוספת, נניח שנאספים נתונים המייצגים את מספר השעות שמישהו מתאמן בגולף ואת הציון שהוא או היא עשויים להרוויח. במקרה זה, היית מצפה למשתנות שלילית, כלומר ככל שמספר שעות האימון גדל, ציון הגולף יקטן. (בגולף, ציון נמוך יותר טוב יותר).
- שקול את מערך הנתונים לדוגמא שחושב לעיל. המשתנות המתקבלת היא -8,07. משמעות הסימן השלילי כאן היא שככל שערכי ה- x גדלים, ערכי ה- y נוטים לרדת. למעשה, אתה יכול לראות שזה נכון על ידי התבוננות בכמה מהערכים. לדוגמא, ערכי ה- x של 1 ו- 2 תואמים לערכי ה- y של 7, 8 ו- 9. ערכי ה- x של 8 ו- 12 משויכים בהתאמה לערכי ה- y של 3 ו- 2.
- 2פרש את גודל השונות. אם מספר ציון המשותף הוא גדול, או מספר חיובי גדול או מספר שלילי גדול, אז אתה יכול לפרש זאת כמשמעות ששני אלמנטים הנתונים מחוברים חזק מאוד, באופן חיובי או שלילי.
- עבור קבוצת הנתונים לדוגמה, המשתנות של -8,07 גדולה למדי. שימו לב שערכי הנתונים נעים בין 1 ל -12, ולכן 8 הוא מספר די גבוה. זה מצביע על חיבור חזק בין מערכי הנתונים x ו- y.
- 3להבין חוסר יחסים. אם אתה מסיים עם משתנות שווה ל- 0 או קרוב לה, אתה יכול להסיק שנקודות הנתונים אינן קשורות יחסית. כלומר, עלייה בערך אחד עשויה להוביל לעליית ערך אחר או לא. שני המונחים קשורים באופן אקראי כמעט.
- לדוגמה, נניח שאתה השוואת גדלים נעליים נגד ציוני פסיכומטרי. מכיוון שישנם כל כך הרבה גורמים המשפיעים על ציוני ה- SAT של התלמיד, היינו מצפים לציון קואוריאנטיות של קרוב ל 0. זה כמעט ולא מעיד על קשר בין שני הערכים.
- 4צפה ביחסים בצורה גרפית. כדי להבין את המשתנות באופן חזותי, אתה יכול לשרטט את נקודות הנתונים שלך במישור הקואורדינטות xy. כשאתה עושה זאת, אתה אמור לראות די בקלות שהנקודות, אם כי לא בקו ישר בדיוק, נוטות ליצור אשכול המקורב קו אלכסוני מצד שמאל למעלה לימין תחתון. זהו התיאור של משתנות שלילית. שימו לב גם כי ערך המשתנות הוא -8,07. זהו מספר גדול למדי בהשוואה לנקודות הנתונים. המספר הגבוה מרמז כי המשתנות היא חזקה למדי, אותה תוכלו לראות על ידי המראה הליניארי של נקודות הנתונים.
- כדי לסקור כמה נקודות ההתוויה במישור הקואורדינטות, לראות נקודות גרף במישור הקואורדינטות.
- ל- Covariance יש יישום מוגבל בסטטיסטיקה. לעתים קרובות זהו צעד לעבר חישוב מקדמי המתאם או מונחים אחרים. היו זהירים בפרשנות רבה מדי על סמך ציון השונות.
תגובות (8)
- אהבתי את הגישה שלב אחר שלב המקשרת עם כל נוסחה. זה נתן לי ביטחון רב יותר בפתרון שאלות ביחידות.
- זה היה רענון נהדר!
- קל מאוד להבנה.
- מאמר זה עזר לי להבין כיצד לחשב את המשתנות בפייתון.
- אני מעריך את הגישה שלב אחר שלב, שהפכה אותה לפשוטה מאוד.
- עזר לי לחשב את המשתנות לבד.
- זה עזר לי בכך שהפך את הכל לסופר פשוט.
- זה מאמר נחמד. רציתי לצחצח את בסיס הידע שלי בימי הקולג '. תודה.