תוֹכֶן
אי התאמה היא ערך בערכת נתונים שהוא רחוק מערכים אחרים. אי התאמות יכולות להיגרם על ידי שגיאות ניסוי או מדידה. במקרים הראשונים, ייתכן שיהיה רצוי לזהות חריגים ולהסיר אותם מנתונים אחרים לפני ביצוע ניתוח סטטיסטי כדי למנוע השפעה על התוצאות, מכיוון שהם אינם מייצגים נאמנה את אוכלוסיית המדגם. הדרך הפשוטה ביותר לזהות פערים היא בשיטת הרבעון.
שלב 1
רשום את הנתונים בסדר עולה. שקול את מערך הנתונים {4, 5, 2, 3, 15, 3, 3, 5}. מסודר, דוגמת ערכת הנתונים היא: {2, 3, 3, 3, 4, 5, 5, 15}.
שלב 2
מצא את החציון. זהו המספר המרכזי המחלק את המחצית הגדולה מהמחצית הקטנה. אם יש מספר זוגי של נתונים, יש לחשב את הממוצע של השניים. לדוגמא: במערך הנתונים שצוטט, נקודות האמצע הן 3 ו -4, כך שהחציון הוא (3 + 4) / 2 = 3.5.
שלב 3
מצא את הרבעון העליון, Q2, נקודת הנתונים המחלקת את הקבוצה בין 75% הקטנה ל 25% הגדולה ביותר. אם מערך הנתונים הוא שווה, ממוצע שתי נקודות סביב הרבעון. בדוגמה הקודמת: (5 + 5) / 2 = 5.
שלב 4
מצא את הרבעון הנמוך ביותר, Q1, נקודת הנתונים המפרידה בין 25% הקטנים לבין 75% הגדולים ביותר. אם מערך הנתונים הוא שווה, ממוצע שתי נקודות סביב הרבעון. בדוגמה: (3 + 3) / 2 = 3.
שלב 5
מחסירים את הרבעון התחתון מהרבעון העליון כדי להשיג את הטווח הבין-רביעי, מנת המשכל. בדוגמה: Q2 - Q1 = 5 - 3 = 2.
שלב 6
הכפל את הטווח הבין-רבעוני ב -1.5. הוסף את הרבעון העליון לתוצאה וחסר את הרבעון התחתון. כל נקודת נתונים מחוץ לערכים אלה היא אי התאמה קלה. לדוגמא שניתנה: 1.5 x 2 = 3. 3 - 3 = 0 ו- 5 +3 = 8. לפיכך, כל ערך נמוך מ- 0 ומעלה מ- 8 יהיה פער קל. משמעות הדבר היא כי 15 כשיר כאי התאמה קלה.
שלב 7
הכפל את הטווח הבין-רביעי ב- 3. הוסף לרביעית העליונה והחסר את הרבעון התחתון. כל נקודת נתונים מחוץ לערכים אלה היא אי התאמה קיצונית. בדוגמה שניתנה, 3 x 2 = 6. 3-6 = -3 ו- 5 + 6 = 11. לפיכך, כל ערך הנמוך מ -3 או גדול מ 11 הוא אי-התאמה קיצונית. משמעות הדבר היא כי 15 כשיר כאי התאמה קיצונית.