כיצד למצוא את המצב של קבוצת מספרים?
כדי למצוא את המצב, כתוב את כל המספרים בערכת הנתונים, וסדר אותם מהנמוך לגבוה ביותר. לאחר מכן, עברו וספרו את מספר הפעמים שכל ערך מופיע. המספר המתרחש לרוב הוא המצב. זכור שלעיתים יכול להיות יותר ממצב אחד. לדוגמא, אם המספר 11 והמספר 18 מתרחשים שלוש פעמים, יותר מכל מספר אחר, שניהם מצבים. היזהר לא לבלבל בין מצב לחציון, המספר האמצעי במערכת נתונים או הממוצע שהוא הממוצע. כדי למצוא את המצב במקרים מיוחדים, המשך לקרוא.
בסטטיסטיקה, מצב קבוצה של מספרים הוא המספר המופיע בתדירות הגבוהה ביותר. מערך נתונים לא בהכרח חייב להיות במצב אחד בלבד - אם שני "ערכים או יותר" נקשרים "להיותם הנפוצים ביותר, ניתן לומר כי הסט הוא דו- מודלי או רב-מודלי, בהתאמה - במילים אחרות, כל ערכים משותפים הם מצבי הסט. לקבלת מבט מפורט על תהליך קביעת מצבי מערכת הנתונים, ראה שלב 1 להלן כדי להתחיל.
שיטה 1 מתוך 2: מציאת מצב של מערך נתונים
- 1כתוב את המספרים בערכת הנתונים שלך. מצבים נלקחים בדרך כלל מקבוצות של נקודות נתונים סטטיסטיות או מרשימות ערכים מספריים. לפיכך, כדי למצוא מצב, תצטרך מערך נתונים כדי למצוא אותו עבורו. קשה לעשות חישובי מצב באופן נפשי עבור כל מערכי הנתונים, למעט הקטנים ביותר, ולכן, ברוב המקרים, זה חכם להתחיל לכתוב (או להקליד) את הנתונים שלך. אם אתה עובד עם נייר ועיפרון, פשוט תספיק לכתוב את ערכי מערך הנתונים שלך ברצף, ואילו אם אתה משתמש במחשב, ייתכן שתרצה להשתמש בתוכנית גיליונות אלקטרוניים כדי לייעל את התהליך.
- קל יותר להבין את התהליך של מציאת מצב של מערך נתונים על ידי מעקב אחר בעיה לדוגמה. בקטע זה, נשתמש בקבוצת הערכים הזו למטרות הדוגמה שלנו: {18, 21, 11, 21, 15, 19, 17, 21, 17}. בשלבים הבאים, אנו נמצא את מצב הסט הזה.
- 2סדר את המספרים מהקטן לגדול ביותר. לאחר מכן, לרוב זה רעיון נבון למיין את הערכים של מערך הנתונים שלך כך שהם יהיו בסדר עולה. למרות שזה לא נדרש בהחלט, זה מקל על תהליך מציאת המצב מכיוון שהוא מקבץ ערכים זהים זה ליד זה. עבור מערכי נתונים גדולים, זה יכול להיות כמעט צורך, שכן מיון בין רשימות ערכים ארוכות ושמירה על סיכומים נפשיים של כמה פעמים כל מספר מופיע ברשימה הוא קשה ויכול להוביל לטעויות.
- אם אתה עובד עם נייר ועיפרון, כתיבה מחדש יכולה לחסוך זמן בתוך בטווח הארוך. סרוק את קבוצת המספרים עבור המספר הנמוך ביותר, וכשאתה מוצא אותו, חוצה אותו בערכת הנתונים הראשונה וכתב אותו מחדש בערכת הנתונים החדשה שלך. חזור על המספר השני הנמוך ביותר, השלישי הנמוך ביותר וכן הלאה, וודא שאתה כותב כל מספר פעמים כפי שהוא קיים בערכת הנתונים המקורית.
- עם מחשב האפשרויות שלך נרחבות יותר - למשל, ברוב תוכניות הגיליונות האלקטרוניים תהיה אפשרות לסדר מחדש רשימות ערכים מהגדול לגדול ביותר עם לחיצות בודדות בלבד.
- בדוגמה שלנו, לאחר הזמנה מחודשת, רשימת הערכים החדשה צריכה להיקרא: {11, 15, 17, 17, 18, 19, 21, 21, 21}.
- 3ספר את מספר הפעמים שכל מספר חוזר עליו. לאחר מכן, ספר את מספר הפעמים שכל מספר בערכה מופיע. חפש את הערך המופיע לרוב בערכת הנתונים. עבור מערכי נתונים קטנים יחסית עם נקודות המסודרות בסדר עולה, זה בדרך כלל עניין פשוט למצוא את "האשכול" הגדול ביותר של ערכים זהים ולספור את מספר ההתרחשויות.
- אם אתה עובד עם עיפרון ונייר, כדי לעקוב אחר ספירותיך, נסה לכתוב את מספר הפעמים שכל ערך מופיע מעל כל אשכול של מספרים זהים. אם אתה משתמש בתוכנית גיליון אלקטרוני במחשב, אתה יכול לעשות את אותו הדבר על ידי כתיבת הסיכומים שלך בתאים סמוכים או לחלופין, באמצעות אחת מאפשרויות התוכנית למיון נקודות נתונים.
- בדוגמה שלנו, ({11, 15, 17, 17, 18, 19, 21, 21, 21}), 11 מתרחשת פעם אחת, 15 מתרחשת פעם אחת, 17 מתרחשת פעמיים, 18 מתרחשת פעם אחת, 19 מתרחשת פעם אחת, ו- 21 מתרחשות שלוש פעמים. 21 הוא הערך הנפוץ ביותר במערך נתונים זה.
- 4זהה את הערך (או הערכים) המתרחשים בתדירות הגבוהה ביותר. כאשר אתה יודע כמה פעמים כל ערך מתרחש במערכת הנתונים שלך, מצא את הערך המתרחש במספר הפעמים הגדול ביותר. זהו מצב מערך הנתונים שלך. שים לב שיכול להיות יותר ממצב אחד בערכת הנתונים. אם שני הערכים קשורים להיות הערכים הנפוצים ביותר בערכה, ניתן לומר שקבוצת הנתונים היא דו- מודאלית, ואילו אם שלושה ערכים נקשרים, הסט הוא טרי- מודלי וכן הלאה.
- במערך הדוגמאות שלנו, ({11, 15, 17, 17, 18, 19, 21, 21, 21}), מכיוון ש- 21 מתרחשת פעמים רבות יותר מכל ערך אחר, 21 הוא המצב.
- אם ערך מלבד 21 היה גם התרחש שלוש פעמים, (כמו, למשל, אם היו עוד 17 בערכת הנתונים), 21 ומספר שני זה היה שניהם להיות במצב.
- 5אל תבלבל בין מצב ערכת נתונים לבין ממוצע או חציון. שלושה מושגים סטטיסטיים שנדונים לעיתים קרובות יחד הם אמצעים, חציון ואופנים. מכיוון שלמושגים אלה יש שמות נשמעים דומים ומכיוון שלערך נתונים יחיד ערך אחד יכול לפעמים להיות יותר מאחד מהדברים האלה, קל לבלבל אותם. עם זאת, לא משנה אם מצב מערך הנתונים הוא גם חציון או ממוצע, חשוב להבין כי שלושת המושגים הללו אינם תלויים זה בזה. ראה למטה:
- ממוצע של מערך נתונים הוא הממוצע. כדי למצוא את הממוצע, הוסף את כל הערכים בערכת הנתונים ואז חלק עם מספר הערכים בערכה. למשל, עבור מערך הנתונים לדוגמא שלנו ({11, 15, 17, 17, 18, 19, 21, 21, 21}), הממוצע יהיה 11 + 15 + 17 + 17 + 18 + 19 + 21 + 21 + 21 = 160/9 = 17,78. שים לב שחילקנו את סכום הערכים ב- 9 מכיוון שיש בסך הכל 9 ערכים בערכת הנתונים.
- חציון מערך הנתונים הוא "המספר האמצעי" המפריד בין הערכים התחתונים והגבוהים יותר של מערך הנתונים לשני חצאים שווים. למשל, במערך הנתונים לדוגמא שלנו, ({11, 15, 17, 17, 18, 19, 21, 21, 21}) 18 הוא החציון מכיוון שהוא המספר האמצעי - ישנם ארבעה מספרים בדיוק ממנו ו ארבעה מספרים נמוכים ממנו. שים לב שאם יש בערך הנתונים מספר זוגי של ערכים, אין חציון אחד. במקרים אלה, החציון נלקח בדרך כלל כממוצע של שני המספרים האמצעיים.
שיטה 2 מתוך 2: מציאת המצב במקרים מיוחדים
- 1דע כי אין מצב עבור ערכות נתונים בהן כל ערך מתרחש באותו מספר פעמים. אם הערכים בערכה נתונה מתרחשים באותו מספר פעמים, למערכת הנתונים אין מצב מכיוון שאף מספר אינו נפוץ יותר מכל אחר. למשל, לערכות נתונים בהן כל ערך מתרחש פעם אחת אין מצב. הדבר נכון גם לגבי ערכות נתונים בהן כל ערך מתרחש פעמיים, שלוש וכו '.
- אם נשנה את ערכת הנתונים לדוגמה שלנו ל {11, 15, 17, 18, 19, 21} כך שכל ערך יתרחש פעם אחת בלבד, כעת אין למערכת הנתונים מצב. הדבר נכון גם אם נשנה את מערך הנתונים כך שכל ערך יתרחש פעמיים: {11, 11, 15, 15, 17, 17, 18, 18, 19, 19, 21, 21}.
- 2דע כי מצבים עבור קבוצות נתונים שאינן מספריות יכולים להימצא באותו אופן כמו עבור קבוצות נתונים מספריות. באופן כללי, רוב מערכי הנתונים הם כמותיים - הם עוסקים בנתונים בצורת מספרים. עם זאת, חלק ממערכי הנתונים עוסקים בנתונים שאינם באים לידי ביטוי בצורת מספרים. במקרים אלה, ניתן לומר כי "המצב" הוא הערך היחיד המתרחש הכי הרבה במערך הנתונים, בדיוק כמו בערכות נתונים מספריות. במקרים אלה, יתכן ויהיה אפשרי למצוא את המצב בעוד שאי אפשר למצוא חציון או ממוצע משמעותי עבור מערך הנתונים.
- לדוגמא, נניח כי סקר ביולוגי קובע את המין של כל עץ בחלק מקומי קטן. מערך הנתונים עבור סוגי העצים בפארק הוא {ארז, אלדר, ארז, אורן, ארז, ארז, אלדר, אלדר, אורן, ארז}. סוג זה של מערך נתונים נקרא מערך נתונים נומינלי מכיוון שנקודות הנתונים נבדלות רק בשמותיהן. במקרה זה, מצב מערך הנתונים הוא ארז משום שהוא מתרחש בתדירות הגבוהה ביותר (חמש פעמים לעומת שלוש עבור אלדר ושניים עבור אורן).
- שים לב, עבור הנתונים המוגדרים לעיל, אי אפשר לחשב ממוצע או חציון מכיוון שלנקודות הנתונים אין ערך מספרי.
- 3דעו כי עבור התפלגויות סימטריות לא מודליות, המצב, הממוצע והחציון חופפים. כפי שצוין לעיל, ייתכן שהמצב, החציון ו / או הממוצע חופפים במקרים מסוימים. באופן מיוחד, בחר במקרים שבהם פונקציית הצפיפות של מערך הנתונים יוצרת עקומה סימטרית לחלוטין עם מצב אחד (למשל, העקומה הגאוסית או "בצורת פעמון"), המצב, הממוצע והחציון יהיו כולם באותו ערך. מכיוון שפונקציית התפלגות משרטטת את המופע היחסי של נקודות נתונים, המצב באופן טבעי יהיה באמצע המדויק של עקומת התפלגות סימטרית, מכיוון שזו הנקודה הגבוהה ביותר בגרף ומתאימה לערך הנפוץ ביותר. מכיוון שמערכת הנתונים היא סימטרית, נקודה זו בגרף תתאים לחציון - הערך האמצעי במערכת הנתונים - והממוצע - הממוצע של מערך הנתונים.
- לדוגמה, בואו ניקח בחשבון את מערך הנתונים {1, 2, 2, 3, 3, 3, 4, 4, 5}. אם נשרטט את התפלגות מערך הנתונים הזה, היינו מקבלים עקומה סימטרית שמגיעה לגובה 3 ב- x = 3 ומתחדדת לגובה 1 ב- x = 1 ו- x = 5. מכיוון ש -3 הוא הערך הנפוץ ביותר, זה המצב. מכיוון שבמרכז הנתונים 3 יש ערכים משני צידיו, 3 הוא גם החציון. לבסוף, הממוצע של מערך הנתונים מסתדר ל- 1 + 2 + 2 + 3 + 3 + 3 + 4 + 4 + 5 = 20,78 = 3, כלומר 3 הוא גם הממוצע.
- היוצא מן הכלל לכלל זה הוא עבור ערכות נתונים סימטריות עם יותר ממצב אחד - במקרה זה, מכיוון שיכול להיות חציון אחד בלבד וממוצע עבור מערך הנתונים, שני המצבים לא יעלו בקנה אחד עם הנקודות האחרות הללו.
- אפשר לקבל יותר ממצב אחד.
- אם כל המספרים רשומים פעם אחת בלבד, אין מצב.
- נייר, עיפרון ומחק
שאלות ותשובות
- כיצד אוכל למצוא את המצב ללא מספרים חוזרים?אם אין מספרים שחוזרים על עצמם, אין לך מצב. אתה פשוט כותב, "אין מצב."
- מה ניתן לומר על מערך נתונים בו כל הערכים זהים?אם כל התוצאות מתרחשות באותה תדירות (למשל, זריקת מוות הוגן), יש לך חלוקה אחידה. התפלגויות אחידות הן אמודליות; אין להם מצב.
- האם המספר 0 יכול להיות מצב?כן, אם אפס מופיע בערכה בתדירות גבוהה יותר מכל מספר אחר. לדוגמה, אם שאלתם אנשים בכיתתכם כמה חיות מחמד יש להם, ורוב האנשים אמרו 0, המצב יהיה 0.
- האם זה מרמז שלערכת נתונים אין מצב?לא, זה לא מרמז על כך. עם זאת, הוא קובע שמערכת הנתונים היא "אמודאלית" או לא מודאלית אם הערכה אינה מכילה מספר שמופיע לעתים קרובות יותר מכל מספר אחר בערכה.
- האם ניתן לחשב רב-מודאלי עוד יותר?לא. מספר הוא מצב של קבוצת נתונים או שהוא לא. פירוש "רב-מודאלי" פשוט כי יותר ממספר אחד מתרחש לרוב בסט. לפיכך, אם (למשל) המספרים 3, 7 ו- 11 כל אחד מתרחש ארבע פעמים בערכת נתונים, וכל שאר המספרים מתרחשים פחות מארבע פעמים, אומרים שהסט הוא רב-מודאלי (או תלת-מודאלי בזה). מקרה), וזה ככל שאתה יכול לבצע את הניתוח.
- מה אם שניים (או כל מספר אחר שאינו סך הכל) מופיעים באותה כמות פעמים? האם יש עדיין מצב? אם כן, כיצד אוכל למצוא אותו?יש מצב, אבל אם יש שניים מהמספר הזה, זה נקרא bimodal, ואם יש יותר משני מצבים, הוא מסווג כרב-מודאלי.
- מה המצב של. 2, 3, 5, 6, 5, 7, 9, 7, 8?הסט הוא דו-מודאלי: ישנם שני מספרים (5 ו -7) המופיעים בתדירות גבוהה יותר מהשאר.
- כיצד אוכל למצוא את הטווח?הזמינו את הנתונים לפחות מהגדולים. לאחר מכן, חיסר את הערך הקטן ביותר מהערך הגדול ביותר בערכה.
- האם הממוצע זהה לחציון עבור קבוצות מוזרות של מספרים?לא בהכרח. המדגם {1, 10, 100} כולל חציון 10 (תוצאות מעל 10 שכיחות באותה מידה כתוצאות מתחת ל -10). הממוצע הוא (100 + 10 + 1) / 3 = 37. התפלגויות בהן הממוצע והחציון אינן שוות נקראות התפלגויות מוטות.
- מה המצב של הדברים הבאים; 15, 25, 20, 35?אין מצב מכיוון שכל מספר מופיע באותו מספר פעמים (פעם אחת).