כיצד להעריך מובהקות סטטיסטית?
כדי להעריך מובהקות סטטיסטית, התחל בחישוב סטיית התקן לשתי קבוצות המדגם שלך. לאחר מכן, השתמש בסטיית התקן של כל קבוצה כדי לחשב את השונות בין שתי הקבוצות. לאחר מכן, חבר את השונות לנוסחה עבור ציון t וחשב את ציון t של הנתונים שלך. לאחר שמצאת את ציון ה- t, קבע את דרגות החופש של קבוצות המדגם שלך על ידי הוספת המספר הכולל של הדגימות מכל קבוצה והחסר 2. לבסוף, חפש את דרגות החופש שלך וציון ה- t בטבלה כדי למצוא המשמעות הסטטיסטית. לטיפים נוספים כיצד לחשב את סטיות התקן שלך, המשך לקרוא את המאמר!
בדיקת השערה מונחית על ידי ניתוח סטטיסטי. המשמעות הסטטיסטית מחושבת באמצעות ערך p, אשר אומר לך את ההסתברות שהתוצאה שלך תישמר, בהתחשב בכך שאמירה מסוימת (השערת האפס) נכונה. אם ערך p זה נמוך מרמת המשמעות שנקבעה (בדרך כלל 0,05), הנסיין יכול להניח שהשערת האפס שגויה ולקבל את ההשערה החלופית. באמצעות מבחן t פשוט ניתן לחשב ערך p ולקבוע משמעות בין שתי קבוצות שונות של מערך נתונים.
חלק 1 מתוך 3: הגדרת הניסוי שלך
- 1הגדר את ההשערות שלך. השלב הראשון בהערכת המובהקות הסטטיסטית הוא הגדרת השאלה עליה תרצה לענות ואמירת ההשערה שלך. ההשערה היא הצהרה על נתוני הניסוי שלך ועל ההבדלים העשויים להתרחש באוכלוסייה. עבור כל ניסוי, קיימת השערה בטלה ואלטרנטיבית. באופן כללי, תשווה בין שתי קבוצות כדי לראות אם הן זהות או שונות.
- השערת האפס (H 0) קובעת בדרך כלל כי אין הבדל בין שתי מערכי הנתונים שלך. לדוגמא: סטודנטים שקוראים את החומר לפני השיעור אינם מקבלים ציונים סופיים טובים יותר.
- ההשערה האלטרנטיבית (H a) היא ההפוכה מהשערת האפס והיא ההצהרה שאתה מנסה לתמוך בה עם נתוני הניסוי שלך. לדוגמא: סטודנטים שקוראים את החומר לפני השיעור אכן מקבלים ציונים סופיים טובים יותר.
- 2הגדר את רמת המשמעות כדי לקבוע עד כמה הנתונים שלך חייבים להיות חריגים לפני שהם יכולים להיחשב משמעותיים. רמת המשמעות (נקראת גם אלפא) היא הסף שקבעת לקביעת המשמעות. אם ערך ה- p שלך קטן או שווה לרמת המשמעות שנקבעה, הנתונים נחשבים למובהקים סטטיסטית.
- ככלל, לרוב נקבעת רמת המשמעות (או אלפא) ל -0.05, כלומר הסבירות להתבונן בהבדלים שרואים בנתונים שלך במקרה היא 5% בלבד.
- רמת ביטחון גבוהה יותר (ולפיכך ערך p נמוך יותר) פירושה שהתוצאות משמעותיות יותר.
- אם אתה רוצה ביטחון גבוה יותר בנתונים שלך, הגדר את ערך ה- p נמוך יותר ל -0.01. בדרך כלל משתמשים בערכי p נמוכים יותר בייצור בעת גילוי פגמים במוצרים. חשוב מאוד להיות בטוחים שכל חלק יעבוד בדיוק כפי שהוא אמור.
- ברוב הניסויים המונעים על ידי השערה, רמת מובהקות של 0,05 מקובלת.
- 3החליטו להשתמש במבחן חד זנב או דו זנב. אחת ההנחות שמבחינת t מבצעת היא שהנתונים שלך מופצים כרגיל. התפלגות נורמאלי של נתונים יוצרת עקומת פעמון עם רוב הדגימות נופלות באמצע. מבחן t הוא מבחן מתמטי כדי לראות אם הנתונים שלך נופלים מחוץ להתפלגות הנורמלית, מעל או מתחת, ב"זנבות "העקומה.
- מבחן חד-זנב חזק יותר ממבחן דו-זנב, שכן הוא בוחן את הפוטנציאל של מערכת יחסים בכיוון אחד (כגון מעל לקבוצת הביקורת), ואילו מבחן דו-זנב בוחן את הפוטנציאל של קשר בשניהם הוראות (כגון מעל או מתחת לקבוצת הבקרה).
- אם אינך בטוח אם הנתונים שלך יהיו מעל או מתחת לקבוצת הבקרה, השתמש במבחן דו זנבי. זה מאפשר לך לבדוק משמעות לשני הכיוונים.
- אם אתה יודע לאיזה כיוון אתה מצפה שהנתונים שלך יתפתחו, השתמש במבחן חד זנב. בדוגמה הנתונה אתה מצפה שהציונים של התלמיד ישתפרו; לכן, תשתמש במבחן חד זנב.
- 4קבע גודל מדגם באמצעות ניתוח כוח. כוחה של בדיקה הוא ההסתברות להתבונן בתוצאה הצפויה, בהתחשב בגודל מדגם ספציפי. הסף המשותף לכוח (או β) הוא 80%. ניתוח כוח יכול להיות קצת מסובך ללא נתונים ראשוניים, מכיוון שאתה זקוק למידע על האמצעים הצפויים שלך בין כל קבוצה וסטיות התקן שלה. השתמש באינטרנט במחשבון ניתוח כוח כדי לקבוע את גודל המדגם האופטימלי עבור הנתונים שלך.
- החוקרים בדרך כלל עורכים מחקר פיילוט קטן בכדי ליידע את ניתוח הכוח שלהם ולקבוע את גודל המדגם הדרוש למחקר גדול ומקיף יותר.
- אם אין לך את האמצעים לעשות מחקר פיילוט מורכב, ערוך הערכות לגבי אמצעים אפשריים על בסיס קריאת הספרות ומחקרים שאנשים אחרים עשו. זה ייתן לך מקום טוב להתחיל בגודל המדגם.
חלק 2 מתוך 3: חישוב סטיית התקן
- 1הגדר את הנוסחה לסטיית התקן. סטיית התקן היא מדד למידת התפשטות הנתונים שלך. זה נותן לך מידע על כמה כל נקודת נתונים דומה במדגם שלך, מה שעוזר לך לקבוע אם הנתונים משמעותיים. במבט ראשון, המשוואה אולי נראית מעט מסובכת, אך צעדים אלה יובילו אתכם בתהליך החישוב. הנוסחה היא s = √∑ ((x i - µ) 2 / (N - 1)).
- s היא סטיית התקן.
- ∑ מציין כי תסכמו את כל ערכי המדגם שנאספו.
- x i מייצג כל ערך נפרד מהנתונים שלך.
- µ הוא הממוצע (או הממוצע) של הנתונים שלך עבור כל קבוצה.
- N הוא מספר המדגם הכולל.
- 2ממוצע הדגימות בכל קבוצה. כדי לחשב את סטיית התקן, ראשית עליך לקחת את ממוצע הדגימות בקבוצות הבודדות. הממוצע מוגדר באות היוונית mu או µ. לשם כך, פשוט הוסף כל דגימה יחד ואז חלק את המספר הכולל של הדגימות.
- לדוגמה, כדי למצוא את הציון הממוצע של הקבוצה שקראה את החומר לפני השיעור, בואו נסתכל על כמה נתונים. לשם פשטות נשתמש במערך נתונים של 5 נקודות: 90, 91, 85, 83 ו- 94.
- הוסף את כל הדוגמאות יחד: 90 + 91 + 85 + 83 + 94 = 443.
- חלק את הסכום במספר המדגם, N = 5: 440,6 = 88,6.
- הציון הממוצע לקבוצה זו הוא 88,6.
- 3מחסרים כל דגימה מהממוצע. החלק הבא של החישוב כולל את החלק (x i - µ) של המשוואה. תוכלו לחסר כל דגימה מהממוצע שזה עתה חישב. לדוגמא שלנו בסופו של דבר תגיע לחמש חיסורים.
- (90 - 88,6), (91- 88,6), (85 - 88,6), (83 - 88,6) ו- (94 - 88,6).
- המספרים המחושבים כיום 1,4, 2,4, -3,6, -5,6, ו 5,4.
- 4ריבוע כל אחד מהמספרים הללו והוסף אותם יחד. כעת כל אחד מהמספרים החדשים שחישבתם יהיה בריבוע. שלב זה ידאג גם לכל הסימנים השליליים. אם יש לך סימן שלילי לאחר שלב זה או בסוף החישוב שלך, ייתכן ששכחת שלב זה.
- בדוגמה שלנו, אנו עובדים כעת עם 1,96, 5,76, 12,96, 31,36 ו- 29,16.
- סיכום ריבועים אלה יחד מניב: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
- 5חלקו במספר המדגם הכולל מינוס 1. הנוסחה מתחלקת ב- N - 1 מכיוון שהיא מתקנת לעובדה שלא ספרתם אוכלוסיה שלמה; אתה לוקח מדגם מאוכלוסיית כל התלמידים כדי להעריך.
- חיסור: N - 1 = 5 - 1 = 4
- מחלקים: 81,0.5 = 20,3
- 6קח את השורש הריבועי. לאחר שחילקתם למספר המדגם מינוס אחד, קחו את השורש הריבועי של המספר הסופי הזה. זהו השלב האחרון בחישוב סטיית התקן. ישנן תוכניות סטטיסטיות שיעשו את החישוב הזה עבורך לאחר הזנת הנתונים הגולמיים.
- לדוגמא, סטיית התקן של הציונים הסופיים של התלמידים שקראו לפני השיעור היא: s = √20,3 = 4,51.
חלק 3 מתוך 3: קביעת משמעות
- 1חשב את השונות בין שתי קבוצות המדגם שלך. עד לנקודה זו, הדוגמה עסקה רק באחת מקבוצות המדגם. אם אתה מנסה להשוות בין שתי קבוצות, ברור שיהיו לך נתונים משניהם. חשב את סטיית התקן של הקבוצה השנייה של הדגימות והשתמש בה כדי לחשב את השונות בין שתי קבוצות הניסוי. הנוסחה לשונות היא s d = √ ((s 1 / N 1) + (s 2 / N 2)).
- s d הוא השונות בין הקבוצות שלך.
- s 1 הוא סטיית התקן של קבוצה 1 ו- N 1 הוא גודל המדגם של קבוצה 1.
- s 2 הוא סטיית התקן של קבוצה 2 ו- N 2 הוא גודל המדגם של קבוצה 2.
- לדוגמא, נניח לנתונים מקבוצה 2 (תלמידים שלא קראו לפני השיעור) גודל מדגם 5 וסטיית תקן של 5,81. השונות היא:
- s d = √ ((s 1) 2 / N 1) + ((s 2) 2 / N 2))
- ים ד = √ (((4,51) 2 /5) + ((5,81) 2 /5)) = √ ((20,30.8) + (33,71.2)) = √ (4,07 + 6, 75) = √10,82 = 3,29.
- 2חשב את ציון t של הנתונים שלך. ציון t מאפשר לך להמיר את הנתונים לטופס המאפשר לך להשוות אותם לנתונים אחרים. ציוני T מאפשרים לך לבצע מבחן t המאפשר לך לחשב את ההסתברות ששתי קבוצות יהיו שונות באופן משמעותי זו מזו. הנוסחה לניקוד t היא: t = (µ 1 - µ 2) / s d.
- µ 1 הוא הממוצע של הקבוצה הראשונה.
- µ 2 הוא הממוצע של הקבוצה השנייה.
- s d הוא השונות בין הדגימות שלך.
- השתמש בממוצע הגדול יותר כ- µ 1 כך שלא יהיה לך ערך t שלילי.
- לדוגמא, נניח שהממוצע המדגם לקבוצה 2 (אלו שלא קראו) היה 80. ציון ה- t הוא: t = (µ 1 - µ 2) / s d = (88,6 - 80) / 3,29 = 2,61.
- 3קבע את דרגות החופש של המדגם שלך. כאשר משתמשים בניקוד t, מספר דרגות החופש נקבע על פי גודל המדגם. הוסף את מספר הדגימות מכל קבוצה ולאחר מכן חיסר שתיים. לדוגמא שלנו, דרגות החופש (df) הן 8 מכיוון שיש חמש דגימות בקבוצה הראשונה וחמש דגימות בקבוצה השנייה ((5 + 5) - 2 = 8).
- 4השתמש בטבלה כדי להעריך משמעות. טבלה של ציוני t ודרגות חופש ניתן למצוא בספר סטטיסטיקה סטנדרטי או באינטרנט. עיין בשורה המכילה את דרגות החופש עבור הנתונים שלך ומצא את ערך ה- p המתאים לציון ה- t שלך.
- עם 8 df וציון t של 2,61, ערך p עבור בדיקה חד-זוויתית נופל בין 0,01 ל -0,025. מכיוון שקבענו את רמת המובהקות שלנו פחות או פחות מ- 0,05, הנתונים שלנו הם מובהקים סטטיסטית. עם נתונים אלה אנו דוחים את השערת האפס ומקבלים את ההשערה החלופית: סטודנטים שקוראים את החומר לפני השיעור מקבלים ציונים סופיים טובים יותר.
- 5שקול מחקר מעקב. חוקרים רבים עורכים מחקר פיילוט קטן עם כמה מדידות כדי לעזור להם להבין כיצד לעצב מחקר גדול יותר. ביצוע מחקר נוסף, עם יותר מדידות, יסייע בהגברת הביטחון שלך לגבי המסקנה שלך.
- מחקר המשך יכול לעזור לך לקבוע אם אחת ממסקנותיך הכילה שגיאה מסוג I (התבוננות בהבדל כשאין כזה, או דחייה כוזבת של השערת האפס) או שגיאה מסוג II (כישלון לבחון הבדל כשיש אחת, או קבלה כוזבת של השערת האפס).
- סטטיסטיקה היא תחום גדול ומסובך. השתתף בקורס תיכון או מכללה (או מעבר לכך) בנושא היסק סטטיסטי כדי להבין את המשמעות הסטטיסטית.
- ניתוח זה ספציפי למבחן t לבדיקת ההבדלים בין 2 אוכלוסיות המופצות באופן נורמלי. עשית צורך להשתמש במבחן סטטיסטי אחר בהתאם למורכבות מערך הנתונים שלך.
שאלות ותשובות
- מדוע אתה מרובע את S1 שלך בדוגמת השונות שלך, אך לא בהסבר שלך על הנוסחה?הנוסחה בפועל מהמקור אליו הוא מתייחס לשונות היא השורש הריבועי. זה גורם לי להאמין שהסימון ללא השורש הריבועי הוא פשוט טעות של המחבר.
- האם אתה יכול להסביר את מידת החופש, כיצד הגעת למספר טווח הערכים P וכיצד הם קשורים לשלבים האחרונים?דרגות החופש הן מספר הדגימות באוכלוסייה שלך פחות אחת. המינוס הוא ממך תוך שימוש בדרגת חופש אחת לחישוב הממוצע.
- מה ההבדל בין ANOVA למבחן t? יש לי קבוצות קטגוריות למשקל וגובה ואני רוצה להשוות את הנתונים בכל קבוצה ולראות אם יש משמעות.נעשה שימוש במבחן t להשוואת האמצעים של אוכלוסיות 2 בלבד. אם תרצה להשוות את האמצעים של יותר מ -2 אוכלוסיות, תשתמש ב- ANOVA.
- מה המשמעות הדרסטית של 12 שגיאות ב 989000 שאלות?
- כיצד ניתן להגיע למסקנה על התיאוריה המדעית תוך שימוש רק באמצעים ולא בסטטיסטיקה?
- האם השגיאה הסטנדרטית תהיה זהה או שונה עבור מספר אנשים שעוברים אותה בדיקה?
- כיצד אוכל להעריך מובהקות סטטיסטית בכל הקשור למגדרים?
- מתי סטטי מוביל לדחייה של תיאוריה?
תגובות (1)
- אני מפתח תוכנת SQL שעושה אופטימיזציה מהירה בתוכנת לקוח, ומדדתי את המדדים "לפני" לעומת "אחרי". כן, שיפרתי את המהירות. האם העלייה הזו משמעותית? המאמר שלך עזר לי בשאלה זו. תודה!