מאת: מ.א עזרה אקדמית |
עודכן לאחרונה: 2026-01-04

תוכן עניינים

מדריך מקיף: ביצוע מבחני t ומבחני חי בריבוע למחקר – כל מה שחוקר צריך לדעת

הבנת עומק של נתונים היא אבן יסוד בכל מחקר אקדמי או יישומי. מבחנים סטטיסטיים, ובפרט מבחני t ומבחני חי בריבוע, מהווים כלים חיוניים לחוקרים המעוניינים להסיק מסקנות מבוססות ומהימנות מממצאי מחקרם. מאמר זה נועד לספק מדריך מקיף ומעמיק לביצוע מבחני t ומבחני חי בריבוע למחקר, החל מהבנת העקרונות הבסיסיים, דרך בחירת המבחן המתאים ועד לפרשנות התוצאות. נצלול לפרטים הטכניים, נדגים שימושים נפוצים ונציע טיפים מעשיים שיסייעו לכם לבצע ניתוח סטטיסטי מדויק ואפקטיבי.

הבסיס התיאורטי: מבחני מובהקות סטטיסטית

A man sits on a truck, surrounded by a light halo under a starry sky.

צילום: Aidan Roof

מהי מובהקות סטטיסטית ולמה היא חשובה?

מובהקות סטטיסטית היא מושג יסוד בכל מחקר כמותי, והיא מתייחסת להסתברות שהתוצאות שנצפו במחקר אינן מקריות, אלא משקפות קשר או הבדל אמיתי באוכלוסייה. כאשר חוקר מדווח על ממצאים "מובהקים סטטיסטית", הוא למעשה אומר כי הסיכוי שההבדל או הקשר שנמצא במדגם נוצר בטעות או במקרה בלבד הוא נמוך מאוד. חשיבותה של מובהקות סטטיסטית טמונה ביכולתה להעניק תוקף למסקנות המחקר, ולאפשר לחוקרים להכליל את הממצאים מהמדגם לאוכלוסייה הרחבה ממנה נלקח המדגם, תוך שמירה על רמה מסוימת של ודאות.

התהליך של בדיקת השערות סטטיסטיות מתחיל בניסוח שתי השערות מרכזיות: השערת האפס (H0) וההשערה האלטרנטיבית (H1). השערת האפס תמיד מניחה שאין הבדל או קשר בין המשתנים, או שאין כל אפקט. לדוגמה, במבחן t, השערת האפס תטען כי אין הבדל בממוצעים בין שתי קבוצות. לעומתה, ההשערה האלטרנטיבית היא ההשערה שהחוקר מקווה לאשש, והיא טוענת שהבדל או קשר אכן קיימים. מטרת המבחן הסטטיסטי היא לבחון האם יש מספיק ראיות לדחות את השערת האפס לטובת ההשערה האלטרנטיבית.

רמת המובהקות, המכונה גם אלפא (α), היא סף שנקבע מראש על ידי החוקר, וקובעת את הסיכון המרבי שהוא מוכן לקחת בדחיית השערת האפס כאשר היא למעשה נכונה (טעות מסוג I). הערכים הנפוצים ביותר לאלפא הם 0.05, 0.01 או 0.001. אם אלפא נקבעה ל-0.05, פירוש הדבר שהחוקר מוכן לקחת סיכון של 5% לדחות בטעות את השערת האפס. ערך ה-p, לעומת זאת, הוא ההסתברות לקבל את התוצאות שנצפו במדגם (או תוצאות קיצוניות יותר), בהנחה שהשערת האפס נכונה. אם ערך ה-p נמוך מרמת האלפא שנקבעה (לדוגמה, p < 0.05), אזי אנו דוחים את השערת האפס ומסיקים שהממצאים מובהקים סטטיסטית. במילים אחרות, הסיכוי שהתוצאות התקבלו במקרה הוא נמוך מסף הסיכון שהגדרנו, ולכן אנו מעדיפים את ההשערה האלטרנטיבית.

בחירת המבחן הסטטיסטי הנכון: מתי ואיזה?

בחירת המבחן הסטטיסטי המתאים היא שלב קריטי ומשמעותי בתהליך הניתוח, שכן בחירה שגויה עלולה להוביל למסקנות שגויות וחסרות תוקף. הבחירה תלויה במספר גורמים מרכזיים, ובראשם סוגי המשתנים המעורבים במחקר. ישנם שני סוגים עיקריים של משתנים: משתנים כמותיים ומשתנים איכותיים. משתנים כמותיים הם משתנים שניתן למדוד באופן מספרי, כגון גובה, משקל, ציון במבחן או מספר שעות שינה. הם יכולים להיות רציפים (כמו גובה, שיכול לקבל כל ערך בטווח מסוים) או בדידים (כמו מספר ילדים, שיכול לקבל רק ערכים שלמים). משתנים איכותיים, לעומת זאת, מתארים קטגוריות או תכונות שאינן ניתנות למדידה מספרית ישירה, כמו מין (זכר/נקבה), צבע עיניים או סוג דם. הם יכולים להיות נומינליים (ללא סדר פנימי, כמו צבע עיניים) או אורדינליים (עם סדר פנימי, כמו רמת השכלה: יסודי, תיכון, אקדמי).

גורם נוסף המשפיע על בחירת המבחן הוא שאלת המחקר או ההשערה שהחוקר מבקש לבדוק. האם המטרה היא להשוות ממוצעים בין קבוצות שונות (לדוגמה, האם יש הבדל בציון הממוצע בין סטודנטים שלמדו בשיטה א' לסטודנטים שלמדו בשיטה ב')? במקרה כזה, נטה להשתמש במבחני t או ב-ANOVA (ניתוח שונות). האם המטרה היא לבחון קשר או תלות בין שני משתנים (לדוגמה, האם יש קשר בין מין להעדפה פוליטית)? במצב זה, מבחני חי בריבוע או מתאמים (כמו מתאם פירסון או ספירמן) יהיו מתאימים יותר. כל מבחן סטטיסטי מיועד לענות על סוג ספציפי של שאלה, ולכן הבנת מטרת המחקר היא חיונית.

מעבר לסוגי המשתנים והשערות המחקר, ישנן גם הנחות יסוד ספציפיות לכל מבחן סטטיסטי, שחובה לבדוק לפני יישומו. הנחות אלו כוללות, בין היתר, את התפלגות הנתונים (האם הם מתפלגים נורמלית?), שוויון שונויות בין קבוצות (במבחני t ו-ANOVA), ואי-תלות בין התצפיות. אי-עמידה בהנחות אלו עלולה לפגוע בתוקף המבחן ולהוביל למסקנות שגויות. לדוגמה, במבחן t למדגמים בלתי תלויים, קיימת הנחה של שוויון שונויות (הומוגניות). אם הנחה זו מופרת, יש להשתמש בגרסה מתוקנת של המבחן. לכן, לפני ביצוע כל ניתוח, חיוני לבצע בדיקות מקדימות להנחות המבחן, ובמידת הצורך, לבחור במבחן אלטרנטיבי שאינו רגיש להפרות אלו (לדוגמה, מבחנים לא פרמטריים).

מבחני t: השוואת ממוצעים בין קבוצות

A surreal pink pyramid topped with a staircase, surrounded by fluffy clouds.

צילום: Mo Eid

מהו מבחן t ומתי משתמשים בו?

מבחן t הוא כלי סטטיסטי פרמטרי רב עוצמה, המשמש בעיקר להשוואת ממוצעים של משתנה כמותי בין שתי קבוצות. מטרתו העיקרית היא לקבוע האם ההבדל הנצפה בממוצעים בין המדגמים הוא מספיק גדול כדי להסיק כי קיים הבדל אמיתי בממוצעי האוכלוסיות מהן נלקחו המדגמים, או שמא ההבדל מקרי ונובע מטעות דגימה. מבחן זה מבוסס על התפלגות t של סטודנט, והוא נמצא בשימוש נרחב במחקרים במדעי החברה, הרפואה, החינוך ועוד.

השימוש במבחן t מתאים במיוחד כאשר שאלת המחקר מתמקדת בהשוואת ממוצעים של משתנה תלוי כמותי, כאשר המשתנה הבלתי תלוי הוא קטגוריאלי בעל שתי רמות בלבד. לדוגמה, חוקר עשוי לרצות לבדוק האם יש הבדל בציון הממוצע במבחן מתמטיקה (משתנה כמותי) בין בנים לבנות (משתנה קטגוריאלי עם שתי רמות). דוגמה נוספת יכולה להיות בחינת האפקטיביות של טיפול חדש: האם מטופלים שקיבלו טיפול תרופתי חדש מציגים שיפור ממוצע גבוה יותר במצבם (משתנה כמותי) בהשוואה למטופלים שקיבלו פלצבו (משתנה קטגוריאלי עם שתי רמות: טיפול/פלצבו)?

דוגמאות נוספות לשאלות מחקר המתאימות למבחן t כוללות: האם יש הבדל ממוצע בגובה בין קבוצת ספורטאים לקבוצת לא-ספורטאים? האם קיים הבדל ממוצע בשביעות רצון מהעבודה בין עובדים ותיקים לעובדים חדשים? האם תלמידים שלמדו בשיטה חדשנית השיגו ממוצע ציונים גבוה יותר בהשוואה לתלמידים שלמדו בשיטה המסורתית? בכל המקרים הללו, אנו מעוניינים להשוות את הממוצע של משתנה רציף או בדיד בין שתי קבוצות נפרדות, ומבחן t מספק את הכלי הסטטיסטי המתאים לבדיקת השערה זו.

סוגי מבחני t ודרכי ביצועם

מבחן t למדגם בודד (One-Sample t-Test)

מבחן t למדגם בודד משמש כאשר מעוניינים להשוות את הממוצע של מדגם יחיד לערך ידוע מראש באוכלוסייה, או לערך תיאורטי מסוים. לדוגמה, אם ידוע שהציון הממוצע הארצי במבחן מסוים הוא 70, וחוקר מעוניין לבדוק האם הציון הממוצע של תלמידי בית ספר מסוים שונה באופן מובהק מציון זה, הוא ישתמש במבחן t למדגם בודד. כאן, אין שתי קבוצות להשוות ביניהן, אלא השוואה של הממוצע של קבוצה אחת לנקודת ייחוס קבועה.

שלבי הביצוע של מבחן t למדגם בודד כוללים מספר שלבים: ראשית, מוגדרות השערת האפס (H0), הטוענת כי ממוצע המדגם שווה לערך האוכלוסייה, וההשערה האלטרנטיבית (H1), הטוענת כי הוא שונה (או גדול/קטן יותר, בהתאם לכיוון ההשערה). שנית, יש לבדוק את הנחות המבחן, שהעיקרית שבהן היא שהנתונים מתפלגים נורמלית באוכלוסייה. אם גודל המדגם גדול מספיק (בדרך כלל מעל 30), ניתן להסתמך על משפט הגבול המרכזי שקובע כי התפלגות הדגימה של הממוצע תהיה נורמלית גם אם התפלגות האוכלוסייה אינה נורמלית לחלוטין. שלישית, מחשבים את סטטיסטי ה-t באמצעות נוסחה הכוללת את ממוצע המדגם, ערך האוכלוסייה המשוער, סטיית התקן של המדגם וגודל המדגם. לבסוף, משווים את ערך ה-p המתקבל מערך ה-t לרמת המובהקות (אלפא) שנקבעה מראש. אם p < אלפא, דוחים את השערת האפס ומסיקים שהממוצע של המדגם שונה מובהק מהערך הנקוב.

מבחן t לשני מדגמים בלתי תלויים (Independent Samples t-Test)

מבחן t לשני מדגמים בלתי תלויים הוא הנפוץ ביותר מבין מבחני ה-t, והוא משמש להשוואת ממוצעים של משתנה כמותי בין שתי קבוצות שונות ובלתי תלויות זו בזו. "בלתי תלויות" משמעותו שנבדקים בקבוצה אחת אינם קשורים או משפיעים על נבדקים בקבוצה השנייה. לדוגמה, השוואת ציונים בין סטודנטים שלמדו בשיטה א' לסטודנטים שלמדו בשיטה ב', כאשר כל סטודנט שייך לקבוצה אחת בלבד. זהו הכלי הסטנדרטי לבדיקת הבדלים בין קבוצות ניסוי וביקורת.

הנחות המבחן כוללות: א. התצפיות בתוך כל קבוצה בלתי תלויות זו בזו. ב. הנתונים בכל אחת מהקבוצות מתפלגים נורמלית באוכלוסייה (שוב, עבור מדגמים גדולים מספיק, ניתן להסתמך על משפט הגבול המרכזי). ג. הנחת שוויון שונויות (הומוגניות של השונויות) בין שתי הקבוצות. הנחה זו נבדקת באמצעות מבחן לוין (Levene's Test for Equality of Variances). אם מבחן לוין אינו מובהק (p > 0.05), אנו מקבלים את הנחת שוויון השונויות ומשתמשים בסטטיסטי ה-t המניח שונויות שוות. אם מבחן לוין מובהק (p < 0.05), הנחת שוויון השונויות מופרת, ויש להשתמש בסטטיסטי ה-t המתוקן שאינו מניח שונויות שוות (מכונה לעיתים "תיקון וולש" או "Welch's t-test").

פרשנות התוצאות במבחן t למדגמים בלתי תלויים כוללת התייחסות לערך ה-t, דרגות החופש (df), וערך ה-p. ערך ה-t מייצג את גודל ההבדל בין הממוצעים ביחס לשונות בתוך הקבוצות. דרגות החופש קשורות לגודל המדגם. ערך ה-p הוא הקריטריון המרכזי לקבלת החלטה: אם p נמוך מרמת האלפא (לדוגמה, p < 0.05), אנו דוחים את השערת האפס ומסיקים כי קיים הבדל מובהק סטטיסטית בין ממוצעי הקבוצות. בנוסף, מומלץ לדווח על רווחי סמך להפרש הממוצעים, המספקים טווח ערכים סביר להפרש האמיתי באוכלוסייה, וכן על מדדי גודל אפקט (כמו Cohen's d) המצביעים על עוצמת ההבדל בין הקבוצות, ללא תלות בגודל המדגם.

מבחן t למדגמים תלויים / מזווגים (Paired Samples t-Test)

מבחן t למדגמים תלויים, המכונה גם מבחן t למדגמים מזווגים או חוזרים, משמש כאשר אנו מעוניינים להשוות את הממוצע של אותו משתנה כמותי בקרב אותם נבדקים בשני מצבים שונים. המאפיין המרכזי כאן הוא שהתצפיות אינן בלתי תלויות, אלא קיימת תלות טבעית או מכוונת בין המדידות. המקרים הנפוצים ביותר לשימוש במבחן זה הם מדידות מסוג "לפני-אחרי" (לדוגמה, מדידת רמת חרדה במטופלים לפני טיפול ולאחריו), או השוואת זוגות תואמים (לדוגמה, השוואת ציוני אחים תאומים, או התאמת נבדקים על בסיס משתנים דמוגרפיים).

ההבדל המהותי בין מבחן t למדגמים תלויים לבין מבחן t למדגמים בלתי תלויים הוא במבנה הנתונים ובהנחות הבסיסיות. במדגמים תלויים, אנו מתמקדים בהפרש בין שתי המדידות עבור כל נבדק. במקום להשוות ממוצעים של שתי קבוצות נפרדות, אנו מחשבים את ממוצע ההפרשים ובודקים האם הוא שונה באופן מובהק מאפס. הנחות המבחן כוללות שהפרשי הציונים מתפלגים נורמלית באוכלוסייה, ושאין חריגים קיצוניים בהפרשים. היתרון של מבחן זה הוא שהוא מפחית את השונות הנובעת מהבדלים אינדיבידואליים בין נבדקים, ובכך מגביר את העוצמה הסטטיסטית של המבחן לזהות אפקט אמיתי, אם קיים.

לדוגמה, אם חוקר רוצה לבחון האם תוכנית אימונים חדשה משפרת את סיבולת לב-ריאה, הוא ימדוד את סיבולת לב-ריאה של קבוצת נבדקים לפני התוכנית ולאחריה. כל נבדק משמש כביקורת של עצמו, וההשוואה מתבצעת בין שתי המדידות של אותו נבדק. דוגמה נוספת היא השוואת ביצועים של תלמידים במבחן מסוים תחת שני תנאים שונים (לדוגמה, עם מוזיקה ובלי מוזיקה), כאשר כל תלמיד עובר את שני התנאים. במקרים אלו, מבחן t למדגמים תלויים הוא הכלי הנכון לניתוח, והוא מאפשר להסיק מסקנות מדויקות יותר לגבי ההשפעה של ההתערבות או התנאי.

דוגמא מעשית לביצוע מבחן t בתוכנת SPSS/R

לצורך הדגמה מעשית, נתאר כיצד לבצע מבחן t לשני מדגמים בלתי תלויים באמצעות תוכנת SPSS, שהיא פופולרית במיוחד במדעי החברה. נניח שאנו רוצים לבדוק האם קיים הבדל מובהק בציון הממוצע במבחן (משתנה כמותי) בין קבוצת גברים לקבוצת נשים (משתנה קטגוריאלי). ראשית, יש להכין את הנתונים בגיליון הנתונים של SPSS. עמודה אחת תכלול את ציוני המבחן (לדוגמה, נקרא לה "ציון"), ועמודה שנייה תכלול את קוד הקבוצה (לדוגמה, "מין", כאשר 1 מייצג גברים ו-2 מייצג נשים). חשוב לוודא שהוגדרו ערכים (Values) עבור המשתנה הקטגוריאלי.

לאחר הכנת הנתונים, יש לבחור באופציה המתאימה בתפריט. ב-SPSS, יש ללכת ל-Analyze -> Compare Means -> Independent-Samples T Test. בחלון שנפתח, יש להעביר את המשתנה הכמותי (ציון) לתיבת "Test Variable(s)" ואת המשתנה הקטגוריאלי (מין) לתיבת "Grouping Variable". לאחר מכן, יש ללחוץ על כפתור "Define Groups" ולהזין את הערכים המייצגים כל קבוצה (לדוגמה, Group 1 = 1, Group 2 = 2). ניתן גם לבדוק את אופציות "Options" כדי להגדיר את רמת הסמך (בדרך כלל 95%) או לטפל בערכים חסרים. לאחר מכן, לוחצים על "OK" כדי להריץ את הניתוח.

פלט התוכנה יציג שתי טבלאות עיקריות. הטבלה הראשונה, "Group Statistics", תציג את הממוצעים, סטיות התקן, וגודלי המדגם עבור כל אחת מהקבוצות. הטבלה השנייה, "Independent Samples Test", תכלול את תוצאות מבחן לוין ואת תוצאות מבחן t. יש להתמקד בשורה המתאימה במבחן לוין: אם ערך ה-Sig. (p-value) של מבחן לוין גבוה מ-0.05, אנו מקבלים את הנחת שוויון השונויות ומסתכלים על השורה הראשונה בפלט ה-t-test (Assumed Equal Variances). אם ערך ה-Sig. של מבחן לוין נמוך מ-0.05, אנו דוחים את הנחת שוויון השונויות ומסתכלים על השורה השנייה (Equal Variances Not Assumed). בשורה הנבחרת, נבדוק את ערך ה-Sig. (2-tailed) של מבחן t. אם ערך זה נמוך מ-0.05, אנו מסיקים כי קיים הבדל מובהק סטטיסטית בין ממוצעי הקבוצות. חשוב לדווח גם על ערך ה-t, דרגות החופש (df), והממוצעים של כל קבוצה כדי לספק תמונה מלאה של הממצאים.

מבחני חי בריבוע: ניתוח קשרים בין משתנים קטגוריאליים

Stunning abstract image featuring gold particles floating against a dark background, creating a magical atmosphere.

צילום: cottonbro studio

מהו מבחן חי בריבוע ומתי משתמשים בו?

מבחן חי בריבוע (Chi-Square test, מסומן כ-χ²) הוא מבחן סטטיסטי לא-פרמטרי המשמש לבחינת קשרים או הבדלים בין משתנים קטגוריאליים (איכותיים). בניגוד למבחני t העוסקים בהשוואת ממוצעים של משתנים כמותיים, מבחן חי בריבוע מתמקד בשכיחויות או פרופורציות של נתונים בקטגוריות שונות. מטרתו העיקרית היא לקבוע האם התפלגות השכיחויות הנצפית של המשתנים שונה באופן מובהק מהתפלגות השכיחויות הצפויה, בהנחה שאין קשר בין המשתנים או שהם מתאימים להתפלגות מסוימת.

השימוש במבחן חי בריבוע מתאים במיוחד כאשר שאלת המחקר עוסקת בקשר בין שני משתנים איכותיים, או בבדיקת התאמה של התפלגות משתנה יחיד להתפלגות תיאורטית. לדוגמה, חוקר עשוי לרצות לבדוק האם קיים קשר בין מין (גברים/נשים) להעדפה פוליטית (מפלגה א'/מפלגה ב'/אחר). בשאלה זו, שני המשתנים הם קטגוריאליים, ומבחן חי בריבוע יאפשר לבדוק האם התפלגות ההעדפה הפוליטית שונה באופן מובהק בין גברים לנשים. דוגמה נוספת היא בחינה האם תוכנית חינוכית מסוימת השפיעה על שיעור המעבר (עבר/נכשל) בהשוואה לקבוצת ביקורת.

דוגמאות נוספות לשאלות מחקר המתאימות למבחן חי בריבוע כוללות: האם יש קשר בין רמת השכלה (יסודי, תיכון, אקדמי) לבין סטטוס עישון (מעשן, לא מעשן, לשעבר)? האם יש תלות בין סוג הטיפול שניתן לחולה (טיפול א', טיפול ב') לבין תוצאת הטיפול (החלמה, שיפור, ללא שינוי)? האם התפלגות קבוצות הדם במדגם תואמת את ההתפלגות הידועה באוכלוסייה הכללית? בכל המקרים הללו, אנו עוסקים בספירת תצפיות בקטגוריות שונות, ומבחן חי בריבוע מספק את הכלי הסטטיסטי המתאים לבדיקת קשרים או התאמות אלו.

סוגי מבחני חי בריבוע ודרכי ביצועם

מבחן חי בריבוע לטיב התאמה (Chi-Square Goodness-of-Fit Test)

מבחן חי בריבוע לטיב התאמה משמש לבדיקת האם התפלגות השכיחויות הנצפית של משתנה קטגוריאלי בודד תואמת להתפלגות תיאורטית או צפויה מסוימת. ההתפלגות הצפויה יכולה להיות התפלגות אחידה (כל הקטגוריות צפויות להופיע באותה מידה), התפלגות היסטורית ידועה, או התפלגות תיאורטית אחרת. לדוגמה, אם יצרן קוביות משחק טוען שהקוביות שלו הוגנות, היינו מצפים שכל אחד מהמספרים (1 עד 6) יופיע בערך באותה שכיחות. מבחן חי בריבוע לטיב התאמה יכול לבדוק האם השכיחויות הנצפות בפועל, לאחר מספר רב של הטלות, תואמות את ההתפלגות האחידה הצפויה.

שלבי הביצוע כוללים: א. הגדרת השערת האפס (H0) הטוענת שההתפלגות הנצפית תואמת את ההתפלגות הצפויה, וההשערה האלטרנטיבית (H1) הטוענת שהן שונות. ב. חישוב השכיחויות הצפויות (Expected Frequencies) עבור כל קטגוריה, על בסיס השערת האפס וגודל המדגם הכולל. ג. חישוב סטטיסטי חי בריבוע באמצעות הנוסחה: Σ [(נצפה – צפוי)² / צפוי], כאשר הסכום נלקח על פני כל הקטגוריות. ד. קביעת דרגות החופש (df), שהן מספר הקטגוריות פחות 1. ה. השוואת ערך חי בריבוע המחושב לערך קריטי מטבלאות חי בריבוע, או שימוש בערך ה-p המתקבל מתוכנת סטטיסטיקה. אם ערך ה-p נמוך מרמת המובהקות (אלפא), אנו דוחים את השערת האפס ומסיקים שההתפלגות הנצפית אינה תואמת את ההתפלגות הצפויה.

מבחן חי בריבוע לאי-תלות (Chi-Square Test of Independence)

מבחן חי בריבוע לאי-תלות הוא הסוג הנפוץ ביותר של מבחן חי בריבוע, והוא משמש לבחינת קשר או תלות בין שני משתנים קטגוריאליים. השאלה המרכזית היא האם ההתפלגות של משתנה אחד תלויה בהתפלגות של המשתנה השני. במילים אחרות, האם השכיחות של קטגוריה מסוימת במשתנה אחד משתנה בהתאם לקטגוריות של המשתנה השני. לדוגמה, האם שיעור המעשנים שונה בין קבוצות גיל שונות? כאן אנו בוחנים קשר בין "סטטוס עישון" ל"קבוצת גיל", שניהם משתנים קטגוריאליים.

הנחות המבחן כוללות: א. התצפיות בלתי תלויות זו בזו (כל נבדק תורם רק פעם אחת לטבלת השכיחויות). ב. הנתונים מתוארים כשכיחויות ולא כאחוזים או ממוצעים. ג. השכיחויות הצפויות בתאים אינן קטנות מדי. כלל אצבע מקובל הוא שלפחות 80% מהתאים צריכים לכלול שכיחות צפויה של 5 ומעלה, ואף תא לא צריך להיות בעל שכיחות צפויה של פחות מ-1. אם הנחה זו מופרת, יש לשקול איחוד קטגוריות או שימוש במבחנים מדויקים (כמו מבחן פישר המדויק).

פרשנות התוצאות מתחילה בהצגת טבלת שכיחויות דו-ממדית (Contingency Table), המציגה את השכיחויות הנצפות עבור כל שילוב של קטגוריות. הפלט הסטטיסטי יכלול את ערך חי בריבוע, דרגות החופש (df = (מספר שורות – 1) * (מספר עמודות – 1)), וערך ה-p. אם ערך ה-p נמוך מרמת המובהקות (לדוגמה, p < 0.05), אנו דוחים את השערת האפס (הטוענת לאי-תלות) ומסיקים כי קיים קשר מובהק סטטיסטית בין שני המשתנים. חשוב לציין שמבחן חי בריבוע מצביע רק על קיום קשר, לא על כיוונו או עוצמתו. לשם כך, יש להשתמש במדדי עוצמה נלווים, כגון מדד פי (φ) עבור טבלאות 2X2, או מדד קרמר V (Cramer's V) עבור טבלאות גדולות יותר, המצביעים על חוזק הקשר בין המשתנים. בנוסף, מומלץ לבחון את השכיחויות הנצפות והצפויות בתאים כדי להבין היכן הקשר בא לידי ביטוי.

דוגמא מעשית לביצוע מבחן חי בריבוע בתוכנת SPSS/R

לצורך הדגמה מעשית של מבחן חי בריבוע לאי-תלות באמצעות תוכנת SPSS, נניח שאנו רוצים לבדוק האם קיים קשר בין מין (גברים/נשים) לבין העדפה לסוג משקה מסוים (קפה/תה/מיץ). במקרה זה, שני המשתנים הם קטגוריאליים. ראשית, יש להכין את הנתונים בגיליון הנתונים של SPSS. עמודה אחת תכלול את המין (לדוגמה, "מין", כאשר 1=גברים, 2=נשים) ועמודה שנייה תכלול את העדפת המשקה (לדוגמה, "משקה", כאשר 1=קפה, 2=תה, 3=מיץ). חשוב לוודא שהוגדרו ערכים (Values) עבור שני המשתנים.

לאחר הכנת הנתונים, יש לבחור באופציה המתאימה בתפריט. ב-SPSS, יש ללכת ל-Analyze -> Descriptive Statistics -> Crosstabs. בחלון שנפתח, יש להעביר את אחד המשתנים (לדוגמה, "מין") לתיבת "Row(s)" ואת המשתנה השני (לדוגמה, "משקה") לתיבת "Column(s)". לאחר מכן, יש ללחוץ על כפתור "Statistics" ולסמן את "Chi-square" ואת "Phi and Cramer's V" (אם רוצים גם מדדי עוצמה). בנוסף, מומלץ ללחוץ על כפתור "Cells" ולסמן את "Observed" (שכיחויות נצפות) ואת "Expected" (שכיחויות צפויות), וכן את אחוזי השורות, עמודות וכלל, על מנת לקבל תמונה מלאה של הנתונים. לאחר מכן, לוחצים על "Continue" ואז על "OK" כדי להריץ את הניתוח.

פלט התוכנה יציג מספר טבלאות. הטבלה הראשונה, "Crosstabulation", תציג את טבלת השכיחויות הדו-ממדית עם השכיחויות הנצפות והצפויות, ואת האחוזים שבחרתם. טבלה זו חיונית להבנת הנתונים הגולמיים. הטבלה השנייה, "Chi-Square Tests", ת

צריכים עזרה עם העבודה האקדמית או פתרון חכם לעסק?

לחצו כאן למעבר לכרטיס הביקור הדיגיטלי »