יום רביעי, 17 בנובמבר 2010

שלב 2 בביצוע סקר - הגדרת אוכלוסיית המחקר והמדגם

השלב השני בביצוע הסקר הוא להגדיר את אוכלוסיית המטרה ולתכנן את מערך הדגימה (כלומר להחליט לגבי גודל המדגם ואופן הדגימה).

מושגים עיקריים הקשורים לדגימה:
1. אוכלוסיית מטרה
2. מדגם
3. מסגרת דגימה וטעות כיסוי
4. טעות דגימה
5. דגימה הסתברותית

1. אוכלוסיית המטרה בסקר היא אוסף של פרטים שאותה החוקר מעוניין לתאר או להסיק מסקנות לגביה. בדרך כלל האוכלוסייה בסקרים מורכבת מאנשים (עובדים, לקוחות, סטודנטים, אזרחים במדינה וכו').
הגדרת אוכלוסיית המטרה בסקר צריכה להיות מנוסחת במונחים אופרציונאליים, כך שיהיה ברור מי נכלל בה.

2. מדגם הוא אוסף של פרטים ("יחידות דגימה") שנבחרו מתוך האוכלוסיה והמשמש את החוקר להסקת מסקנות לגבי האוכלוסיה.
כאשר אוכלוסיית המטרה קטנה אפשר לבצע את המחקר בקרב כלל האוכלוסייה. כאשר האוכלוסייה מאוד גדולה ומעוניינים לחסוך בעלויות ובזמן ביצוע הסקר – מבצעים את המחקר בקרב חלק מהאוכלוסייה.

3. מסגרת הדגימה היא רשימה שכוללת את כל הפרטים באוכלוסייה שמתוכם נבחר המדגם בפועל.
טעות כיסוי מתרחשת כאשר מסגרת הדגימה קטנה מאוכלוסיית המטרה. לדוגמא, בסקר המבוצע באינטרנט לא לכל הפרטים באוכלוסיית המחקר יש גישה לאינטרנט. מי שאין להם גישה לאינטרנט לא נכללים במסגרת הדגימה והסיכוי שלהם להבחר למדגם הוא 0. כאשר טעות הכיסוי גבוהה מדי (כלומר, אחוז גבוה מהפרטים באוכלוסייה אינם נכללים במסגרת הדגימה) מסקנות המחקר במדגם רלוונטיות רק למסגרת הדגימה ולא ניתן להסיק מהן על אוכלוסיית המטרה. על מנת להתמודד על ההטיות הנובעות מבעיות כיסוי, החוקר צריך להיות מודע למגבלות יכולת ההכללה של ממצאי הסקר ולציין זאת בשלב סיכום הסקר.

4. טעות הדגימה מבטאת את הפער בין הסטטיסטי שחושב במדגם לפרמטר האמיתי באוכלוסייה – פער אשר נובע מכך שהסקר מבוצע רק בקרב מדגם ולא בקרב כלל האוכלוסייה.
מבחינה סטטיסטית, טעות הדגימה היא סטיית התקן של התפלגות הדגימה של הסטטיטי שחושב במדגם. באמצעות טעות הדגימה ניתן לחשב רווח בר סמך בו נמצא הפרמטר באוכלוסייה (עם סיכוי מינימלי לטעות, בד"כ 5%).
טעות הדגימה מושפעת משני גורמים: סטיית התקן של המשתנה הנמדד באוכלוסייה וגודל המדגם. ככל שסטיית התקן באוכלוסייה גדולה יותר (ככל שהאוכלוסייה יותר הטרוגנית בתכונה הנחקרת), טעות דגימה תגדל. ככל שהמדגם גדול יותר – תקטן טעות הדגימה, ויגדל הסיכוי שהסטטיסטי שחושב במדגם יהיה אומדן טוב (מדוייק) לפרמטר שבאוכלוסייה.
את טעות הדגימה אפשר לחשב רק במדגמים שנדגמו בשיטת הדגימה ההסתברותית.

5. הדגימה ההסתברותית מנסה להבטיח שהמדגם ייצג את האוכלוסיה ושהסיכוי לטעות בהסקה מהמדגם לאוכלוסיה יהיה קטן ככל האפשר.
בדגימה הסתברותית מתקיימים שלושה תנאים: לכל הפרטים במסגרת הדגימה יש הסתברות ידועה להבחר למדגם; לשום פרט אין סיכוי ודאי להבחר; שום פרט אינו יוצא מכלל האפשרות להבחר.
קיימות 3 שיטות עיקריות של דגימה הסתברותית:
- דגימה אקראית פשוטה
- דגימת שכבות
- דגימת אשכולות

בדגימה אקראית פשוטה לכל פרט באוכלוסייה יש הסתברות זהה להכלל במדגם. השיטה השכיחה לדגימה מקרית פשוטה היא על פי לוח המספרים המקריים (כאשר המדגם קטן) או באמצעות תוכנות סטטיסטיות (כאשר המדגם גדול).

בדגימת שכבות מסגרת הדגימה נחלקת למספר שכבות (קבוצות) על פי משתנים מגדירים ומכל שכבה דוגמים פרטים בשיטה אקראית פשוטה. דגימת שכבות נועדה להבטיח שהמדגם ייצג באופן הולם את כל הקבוצות באוכלוסיית המחקר. ההחלטה על המשתנים המגדירים את השכבות תלויה במטרות המחקר.
החיסרון של השיטה הוא שלא ניתן להשתמש בשיטות מורכבות לניתוח סטטיסטי המניחות שהמדגם מבוסס על דגימה אקראית פשוטה.
כאשר הדגימה מהשכבות נעשית יחסית לגודלן באוכלוסיית המחקר, שיטה זו נקראת – דגימת שכבות פרופורציונית. כאשר מחליטים שהפרופורציות של קבוצות במדגם יהיו שונות מאלה שבאוכלוסייה – מדובר על דגימת שכבות לא פרופורציונית. השימוש בדגימת שכבות (פרופורציונית ולא פרופורציונית) ובחירת המשתנים שקובעים את השכבות תלויים בזמינות הנתונים במסגרת הדגימה.

בדגימת אשכולות אוכלוסיית המחקר מחולקת לקבוצות (אשכולות) והחוקר בוחר מדגם אקראי של אשכולות. בדגימת אשכולות פרופורציונית, מבטיחים שהסיכוי של כל אשכול להדגם הוא ביחס לגודלו (כלומר לא לכל האשכולות יש הסתברות זהה).
החוקר יכול לבחור שכל הפרטים באשכולות שנבחרו יהיו במדגם, או שהוא יכול לבחור מתוך כל אשכול מדגם הסתברותי (באמצעות דגימה אקראית פשוטה או שכבות) (דגימת אשכולות רב שלבית).
נהוג להשתמש בדגימת אשכולות רק כאשר יש קושי בבניית מסגרת דגימה של הפרטים באוכלוסיית המחקר.
גם כאן, לא ניתן להשתמש בשיטות מורכבות לניתוח סטטיסטי.

הפוסט הבא יעסוק בניסוח שאלונים בסקרים...