איך משווים בין שני פרופורציות?
לעתים קרובות יש צורך בהשוואה בין שני פרופורציות כדי לראות אם הם שונים זה מזה באופן משמעותי. לדוגמא, נניח שאתה מבצע מחקר ביקורת אקראי על 40 אנשים, מחציתם מוקצים לטיפול וחצי אחרים מוקצים לפלצבו. 140 מקבוצת הניסויים השתפרו, בעוד שגם 12,50 מקבוצת הביקורת השתפרו. האם שני פרופורציות אלה שונות זו מזו באופן משמעותי? האם הטיפול יעיל? לאחר שתדע כיצד להשוות פרופורציות, תוכל לענות על שאלות אלה.
- 1הגדר את השערת האפס ואת ההשערה האלטרנטיבית. השערת האפס ( H0 {\ displaystyle H_ {0}} ) מכילה תמיד שוויון והיא זו שאתה מנסה להפריך. ההשערה האלטרנטיבית (המחקרית) לעולם אינה מכילה שוויון והיא זו שאתה מנסה לאשר. שתי השערות אלה נאמרות כך שהן בלעדיות וממצות באופן קולקטיבי. משמעות בלעדית הדדית היא שאם אחד נכון, השני חייב להיות שקרי, ולהיפך. באופן ממצה קולקטיבי פירושו שלפחות אחת התוצאות חייבת להתרחש. ההשערות שלך מנוסחות בהתאם לשאלה 1 או 2:
- חד זנב: שאלת מחקר: האם פרופורציה אחת גדולה יותר מהשנייה? השערות שלך יהיה הצהיר כדלקמן: {H0: p ^ 1≤p ^ 2Ha: p ^ 1> p ^ 2 {\ displaystyle {\ להתחיל {במקרים} H_ {0}: {\ כובע {פ}} _ {1 } \ leq {\ hat {p}} _ {2} \\ H_ {a}: {\ hat {p}} _ {1}> {\ hat {p}} _ {2} \ end {cases}} } . השתמש בזנב חד פעמי אם אתה מעוניין בהבדל בכיוון אחד בלבד. לדוגמא, לדוגמא זו, אנו מעוניינים רק אם הטיפול עובד, כלומר שהשיעור גדול יותר בקבוצת הטיפול. אם נקבע את קבוצת הטיפול כ -1 וקבוצת הביקורת כ- 2, ההשערות הן {H0: p ^ 1≤p ^ 2Ha: p ^ 1> p ^ 2 {\ displaystyle {\ begin {cases} H_ {0}: {\ hat {p}} _ {1} \ leq {\ hat {p}} _ {2} \\ H_ {a}: {\ hat {p}} _ {1}> {\ hat {p}} _ {2} \ end {cases}}} .
- דו זנב: שאלת מחקר: האם פרופורציה המדגם שונה משיעור האוכלוסייה המשוער? השערותיך יופיעו באופן הבא: {H0: p ^ = p0Ha: p ^ ≠ p0 {\ displaystyle {\ begin {cases} H_ {0}: {\ hat {p}} = p_ {0} \\ H_ { a}: {\ hat {p}} \ neq p_ {0} \ end {cases}}}.
- אם אין סיבה אפריורית להאמין שהבדל כלשהו אינו חד כיווני, המבחן הדו-זנב עדיף שכן מדובר במבחן מחמיר יותר.
- 2הגדר רמת משמעות מתאימה ( α {\ displaystyle \ alpha} aka "אלפא"). בהגדרה, רמת האלפא היא ההסתברות לדחות את השערת האפס כאשר השערת האפס נכונה. לרוב, אלפא מוגדרת ל -0.05, אם כי ניתן להשתמש בכל ערכים אחרים (בין 0 ל -1, בלעדיים). אחרים נפוצים בשימוש ערכי אלפא כולל 0,01 ו 0,10.
- 3חשב את שתי הפרופורציות לדוגמא. חלק הוא מספר ה"הצלחות "חלקי סך המדגם בקבוצה. בדוגמה זו, {p ^ 1 = 1820 = 0,9p ^ 2 = 1520 = 0,75 {\ displaystyle {\ begin {cases} {\ hat {p}} _ {1} = {\ frac {18} { 20}} = 0,9 \\ {\ hat {p}} _ {2} = {\ frac {15} {20}} = 0,75 \ end {cases}}} .
- 4חשב את שיעור המדגם הכולל. פרופורציה כוללת, p ^ {\ displaystyle {\ hat {p}}} , היא המספר הכולל של "הצלחות" חלקי המדגם הכולל בין כל הקבוצות. הנוסחה היא p ^ = n1p ^ 1 + n2p ^ 2n1 + n2 {\ displaystyle {\ hat {p}} = {\ frac {n_ {1} {\ hat {p}} _ {1} + n_ {2} { \ hat {p}} _ {2}} {n_ {1} + n_ {2}}}} , כאשר n1 {\ displaystyle n_ {1}} ו- n2 {\ displaystyle n_ {2}} הם הגדלים לדוגמה קבוצות 1 ו -2 בהתאמה. בדוגמה זו, p ^ = 18 + 1520 + 20 = 0,825 {\ displaystyle {\ hat {p}} = {\ frac {18 + 15} {20 + 20}} = 0,825} .
- 5חשב את השגיאה הסטנדרטית של ההפרש. שגיאת התקן, SE, מחושבת p ^ (1-p ^) (1n1 + 1n2) {\ displaystyle {\ sqrt {{\ כובע {פ}} (1 - {\ כובע {פ}}) \ שמאלה ({\ frac {1} {n_ {1}}} + {\ frac {1} {n_ {2}}} \ ימין)}}} . בדוגמה זו, SE = 0,825 (1−0,825) (120 + 120) = 0,120156 {\ displaystyle SE = {\ sqrt {0,825 (1-0,825) \ left ({\ frac {1} {20}} + {\ frac {1} {20}} \ right)}} = 0,120156} .
- 6חשב את נתון הבדיקה, z. הנוסחה היא z = p ^ 1 − p ^ 2SE {\ displaystyle z = {\ frac {{\ hat {p}} _ {1} - {\ hat {p}} _ {2}} {SE}}} . בדוגמה זו, z = 0,9−0,750.120156 = 1,248 {\ displaystyle z = {\ frac {0,9-0,75} {0,120156}} = 1,248} .
- 7להמיר את נתון הבדיקה לערך p. ערך p הוא ההסתברות שלמדגם שנבחר באופן אקראי של n יהיה נתון מדגם שונה לפחות מזה שהתקבל. ערך p הוא אזור הזנב מתחת לעיקול הרגיל לכיוון ההשערה האלטרנטיבית. לדוגמא, אם משתמשים בבדיקת זנב ימני, ערך p הוא האזור בעל הזנב הימני, או אזור מימין לערך z. אם משתמשים במבחן דו-זנב, ערך p הוא השטח בשני הזנבות. ניתן למצוא ערך p באמצעות אחת מכמה שיטות:
- הסתברות התפלגות נורמלית z-table. דוגמאות ניתן למצוא באינטרנט, כגון זה. חשוב לקרוא את תיאור הטבלה כדי לציין איזו הסתברות רשומה בטבלה. חלק מהטבלאות מפרטות שטח מצטבר (בצד שמאל), אחרות מפרטות אזור זנב ימני, ואילו אחרות מפרטות רק שטח ממוצע עד ערך חיובי.
- להצטין. פונקציית ה- excel = norm.s.dist (z, מצטבר). החלף את הערך המספרי עבור z ו- "true" עבור מצטבר. נוסחת אקסל זו נותנת שטח מצטבר משמאל לערך z נתון. אם אתה זקוק לאזור הזנב הימני, חיסר מ -1.
- בדוגמה זו, אנו זקוקים לאזור הזנב הימני, כך שערך p = 1- NORM.S.DIST (1,248, TRUE) = 0,106.
- מחשבון מכשיר טקסס, כגון TI-83 או TI-84.
- מחשבוני הפצה נורמליים מקוונים, כגון זה.
- 8להחליט בין השערת אפס או השערה חלופית. אם הערך <α {\ displaystyle p_ {value} <\ alpha} , דחה H0 {\ displaystyle H_ {0}} . אחרת, אל תדחה את H0 {\ displaystyle H_ {0}} . בדוגמה זו, מכיוון ש- pvalue = 0,106 {\ displaystyle p_ {value} = 0,106} גדול מ- α = 0,05 {\ displaystyle \ alpha = 0,05} , הנסיין לא מצליח לדחות את H0 {\ displaystyle H_ {0} } .
- 9ציין מסקנה לגבי שאלת המחקר. בדוגמה זו, הנסיין אינו מצליח לדחות את השערת האפס ואין לו מספיק ראיות התומכות בטענה כי הטיפול יעיל. שיעור האנשים שהשתפרו בטיפול, 90%, אינו שונה באופן משמעותי משיעור האנשים שהשתפרו בפלצבו, 75%.
- 10חישב רווח ביטחון להפרש הפרופורציות. הנוסחה היא Difference ± Z ∗ SE {\ displaystyle {\ text {Difference}} \ pm Z * SE} .
- בחרו רמת ביטחון. הנפוץ ביותר הוא 95%, המקביל ל- α = 0,05 {\ displaystyle \ alpha = 0,05} .
- קבע את ציון ה- z המתאים לרמת האלפא. נוסחת Excel היא = norm.s.inv (1 - אלפא / 2). עבור α = 0,05 {\ displaystyle \ alpha = 0,05} , יש לנו z = norm.s.inv (1-0,02.5) = 1,96.
- חשב את הגבול התחתון של רווח הביטחון כהפרש − Z ∗ SE {\ displaystyle {\ text {Difference}} - Z * SE} . בדוגמה זו, הגבול התחתון הוא 0,15−1,96 ∗ 0,120156 = −0,086 {\ displaystyle 0,15-1,96 * 0,120156 = -0,086} .
- חשב את הגבול העליון של רווח בר-סמך כמו ההבדל-Z * SE {\ displaystyle {\ text {ההבדל}} - Z * SE} . בדוגמה זו, הגבול התחתון הוא 0,15 + 1,96 ∗ 0,120156 = 0,386 {\ displaystyle 0,15 + 1,96 * 0,120156 = 0,386} .
- כתוב את רווח הביטחון של 95% להפרש הפרופורציות כ- 0,150 ± 0,236 {\ displaystyle 0,150 \ pm 0,236} , או -0,086 ל- 0,386.
- לפרש את התוצאה. במקרה זה, אנו בטוחים ב -95% שההפרש הפרופורציוני האמיתי הוא -0,086 ל -0,386. מכיוון שטווח זה כולל 0, אין מספיק ראיות לכך ששני הפרופורציות שונות.
- אתה יכול לקבוע את גודל המדגם המינימלי הדרוש כדי לזהות הבדל בפרופורציות. בדוגמה זו, ההבדל בשני הפרופורציות הוא 0,90−0,75 = 0,15 {\ displaystyle 0,90-0,75 = 0,15} , אך הוא לא היה מובהק סטטיסטית בהתחשב בגודל המדגם הכולל של 40. איזה גודל מדגם נדרש כדי לזהות הבדל?
- לצורך הבדל משמעותי, ערך ה- p חייב להיות קטן מ- α = 0,05 {\ displaystyle \ alpha = 0,05} .
- נתון ה- z המקביל ל- pvalue = 0,05 {\ displaystyle p_ {value} = 0,05} הוא 1,96. ניתן לחשב את זה ב- excel כ = NORM.S.INV (1-0,02.5).
- חבר את זה לנוסחה לנתון z: 1,96 = p1 − p2SE = p1 − p2p (1 − p) (1n1 + 1n2) = p1 − p24p (1 − p) n {\ displaystyle 1,96 = {\ frac {p_ {1} -p_ {2}} {SE}} = {\ frac {p_ {1} -p_ {2}} {\ sqrt {p (1-p) \ שמאל ({\ frac {1} {n_ {1}}} + {\ frac {1} {n_ {2}}} \ right)}}} = {\ frac {p_ {1} -p_ {2}} {\ sqrt {\ frac {4p (1-p)} {n}}}}}, בהנחה ש- n1 = n2 = n2 {\ displaystyle n_ {1} = n_ {2} = {\ frac {n} {2}}} . אז p1 − p2 = 1,964p (1 − p) n = 3,92p (1 − p) n {\ displaystyle p_ {1} -p_ {2} = 1,96 {\ sqrt {\ frac {4p (1- p)} {n}}} = {\ frac {3,92 {\ sqrt {p (1-p)}}} {\ sqrt {n}}}} . אז n = 15,3664p (1-p) (p1-p2) 2 {\ displaystyle n = {\ frac {15,3664p (1-p)} {(p_ {1} -p_ {2}) ^ {2 }}}} הוא גודל המדגם המינימלי הדרוש.
- שים לב שהנגזרת הראשונה של p (1-p) {\ displaystyle p (1-p)} היא 1−2p {\ displaystyle 1-2p} ושווה ל- 0 כאשר p = 0,5 {\ displaystyle p = 0,5 } , ואילו הנגזרת השנייה של p (1-p) {\ displaystyle p (1-p)} היא -2. לכן, p = 0,5 {\ displaystyle p = 0,5} מייצג מקסימום את הפונקציה p (1 − p) {\ displaystyle p (1-p)} . אז אם אנחנו לא יודעים מה זה p {\ displaystyle p} , שימוש ב- p = 0,5 {\ displaystyle p = 0,5} יבטיח ש- n תהיה גדולה מספיק לכל ערך אפשרי של p. אז n = 3,8416 (p1 − p2) 2 {\ displaystyle n = {\ frac {3,8416} {(p_ {1} -p_ {2}) ^ {2}}}} הוא גודל המדגם המינימלי הדרוש כדי לזהות הפרש פרופורציות של p1 − p2 {\ displaystyle p_ {1} -p_ {2}} . בדוגמה זו, אם נרצה לזהות הפרש פרופורציות של 0,15, נצטרך גודל מדגם n לפחות 3,84160.152 = 171 {\ displaystyle {\ frac {3,8416} {0,15 ^ {2} }} = 171} .
קרא גם: כיצד להשתמש בכלל הקוסינוס?
שאלות ותשובות
- כיצד חישבתם 'הפרש' בשלב 10? אני לא מצליח להבין מאיפה קיבלת 0,15.0,15 הוא ההבדל בין שני הפרופורציות שהוזכרו בשלב 9.