נגישות
Review 3

גיליון 3 – המחקר מנקודת מבטו של המטפל הקליני

שיטות סטטיסטיות בניתוח נתונים רפואיים, ד"ר נירה קורן-מורג

דר' נירה קורן-מורג החוג לאפידמיולוגיה,
הפקולטה לרפואה ע"ש סאקלר, אוניברסיטת ת"א

לא ניתן להוכיח סיבתיות באמצעות ניתוח סטטיסטי, אך ניתן לכמת בצורה טובה את הקשר בין משתנים, זאת מכיוון שבמודלים סטטיסטיים רבי משתנים קיימת טעות אפשרית בתיאור הקשר בין המשתנים. תכנון נכון של המחקר, ובחירה מתאימה של השיטות הסטטיסטיות מבטיחות צמצום הטעות האפשרית בהסקת המסקנות הנובעות מן המחקר.

הסטטיסטיקה מלווה את המחקר הרפואי על כל שלביו – מהשלב הראשוני של תכנון הניסוי ועד לשלב הסופי של פרסום התוצאות. מקומה של הסטטיסטיקה אינו מתחיל בניתוח התוצאות, ישנה חשיבות רבה בשילוב הסטטיסטיקאי החל מהשלבים הראשונים של תכנון המחקר, אחרת לעיתים….מאוחר מידי.

ניתן לראות את הסטטיסטיקה כמתחלקת לשלושה תחומים עיקריים: תכנון ניסויים, סטטיסטיקה תיאורית והסקה סטטיסטית.

סוג הניסוי טבלאות שכיחות הסקה ממדגם סוג הדגימה הצגה גרפית לאוכלוסייה. גודל המדגם מדדי מרכז ופיזור

תכנון ניסויים

על מנת לתכנן ניסוי יש צורך בידע מעמיק בנושאי שיטות מחקר. חשוב להחליט על סוג הניסוי, סוג הדגימה וגודל המדגם בשלב ראשון.

סוג הניסוי סוגי ניסויים שכיחים ברפואה הם: ניסוי תצפיתי – מעקב אחר תופעות ומשתנים באוכלוסייה נתונה. כמו קשר בין עישון לסרטן או קשר בין רמות שומנים להארעות מחלות לב וכו'. ניסוי מקרה-ביקורת – שהוא מקרה פרטי של ניסוי תצפיתי. התאמת קבוצת ביקורת לקבוצת חולים במחלה נדירה לצורך בדיקת השפעת משתנים שונים על הארעות המחלה. ניסוי מבוקר – חלוקת האוכלוסייה לקבוצות ניסוי וביקורת, לבדיקת טיפולים או התערבות רפואית מכל סוג.

סוג הדגימה קיימות שיטות דגימה רבות שבחירתן תלויה במטרות המחקר: מדגם מקרי פשוט – דגימה מתוך האוכלוסייה בעזרת טבלת מספרים מקריים. מדגם מקרי שיטתי – באופן שיטתי לקחת כל אדם עשירי לדוגמא. דגימת שכבות – חלוקת האוכלוסייה לקבוצות בעלות עניין (לדוגמא קבוצות גיל שונות) ודגימה מקרית מכל שכבה. דגימת אשכולות – חלוקת האוכלוסייה לאשכולות (לדוגמא: שכונות, ערים וכו') ודגימה מקרית מתוך האשכולות בהתאם לגודלן.

גודל המדגם חישוב גודל המדגם נעשה בהתאם למשתנים העיקריים: סוג המשתנים, סטית התקן שלהם, גודל האפקט הצפוי ורמת המובהקות שבה מתבצע המבחן הסטטיסטי. לחישוב גודל המדגם יש חשיבות רבה ביכולת להסיק מסקנות מהמדגם לאוכלוסייה. מחקר המבוסס על מדגם קטן, גם אם התוצאות בו תומכות בהשערת החוקר באופן ברור, לא יוכל להוכיח שהתוצאות אינן מקריות.

סטטיסטיקה תיאורית

לאחר ביצוע המחקר ניתן להציג את תוצאות המחקר ע"י: טבלאות שכיחות של המשתנים (שאלות המחקר) – הצגת מכלול התוצאות שהתקבלו, שכיחותם וחישוב אחוזים, הצגה גרפית מתאימה לכל משתנה על פי רמת המדידה שלו וחישוב מדדי מרכז ופיזור של כל המשתנים כמו: ממוצע, חציון וסטית תקן לבדיקת מידת ההומוגניות של משתני המחקר.

הסקה סטטיסטית ההסקה הסטטיסטית היא ליבה של הסטטיסטיקה. מטרתה העיקרית של ההסקה הסטטיסטית היא להסיק מהנתונים שהתקבלו במדגם על כלל האוכלוסייה הרלוונטית לאותו מחקר. לצורך הסקה סטטיסטית יש צורך במודלים הסתברותיים שבאמצעותם נאפיין את התפלגות המדדים שנבדקים במחקר. לדוגמא: אם מטרת המחקר היא הצגת גורמי סיכון לשבץ מוחי ובכלל זה רמות כולסטרול בדם, בדיקה ראשונית של ההבדל ברמות סך הכולסטרול אצל חולי השבץ לעומת אנשים בריאים תיעשה על סמך התפלגות ההפרש בין ממוצע רמות הכולסטרול. לדוגמא: ממוצע סך כולסטרול אצל חולי שבץ הוא 230 מ"ג לד"ל עם סטית תקן של 44 מ"ג לד"ל, לעומת ממוצע של 220 מ"ג לד"ל אצל אנשים בריאים עם סטית תקן של 40 מ"ג לד"ל. ההפרש בממוצע רמות הכולסטרול הוא 10 מ"ג לד"ל. השאלה היא האם ההבדל בין שתי הקבוצות נובע מתוך הבדלים מקריים בין מדגמים שונים או שהבדל זה נובע מתוך שוני אמיתי בין שתי האוכלוסיות הנבדקות (אוכלוסיית חולי השבץ ואוכלוסיית האנשים הבריאים). בדיקת מובהקות ההבדל (האם ניתן להסיק מההבדל שהתקבל בין שני המדגמים על הבדל אמיתי בין שתי האוכלוסיות) תלויה בהתפלגות הפרש הממוצעים, ובפרט בסטיית התקן של ההפרש. ככל שסטית התקן קטנה יותר כך הסבירות לקבל הבדל גדול בין שני המדגמים קטנה יותר. הבדל גדול מעיד על הבדל אמיתי בין שתי האוכלוסיות.

המשמעות של מובהקות סטטיסטית

הבנת המשמעות של מובהקות סטטיסטית היא אחד הכלים החשובים בהבנת הממצאים של המחקר. טעות רווחת היא לחשוב שמובהקות סטטיסטית מעידה על עוצמת האפקט או על מידת הקשר בין משתני המחקר. מובהקות סטטיסטית מעידה אך ורק על היכולת להסיק מהתוצאות שהוצגו במחקר לגבי כלל האוכלוסייה הרלוונטית למחקר.

לדוגמא: בבדיקת קשר לינארי בין גיל ללחץ דם סיסטולי נמצא קשר לינארי r=0.70 (טווח הערכים של מקדם המתאם נע בין אפס לאחד, כאשר קשר לינארי קרוב לאחד מעיד על קשר לינארי חזק בין שני המשתנים). קשר זה לא נמצא מובהק סטטיסטית (P=0.20). למרות שמקדם מתאם של 0.70 מעיד על קשר לינארי די חזק בין שני המשתנים, העובדה שהתוצאה אינה מובהקת סטטיסטית משמעותה שקשר זה יכול להתקבל באופן מקרי בעקבות סיבות שונות, כמו למשל מדגם קטן מידי. לעומת זאת במחקר אחר נבדק הקשר בין לחץ דם סיסטולי ורמות סך כולסטרול ונמצא קשר של r=0.10 אך מובהק סטטיסטית. קשר לינארי של 0.10 הינו קשר לינארי חלש מאוד אבל היות והקשר מובהק סטטיסטית ניתן להסיק שקשר חלש זה אכן קיים באוכלוסייה שממנה נלקח המדגם ולא התקבל באופן מקרי.

בדיקת השערות ורווח בר סמך

ההבדל בין בדיקת השערות ורווח בר סמך לא תמיד ברור, למרות שניתן להסיק מתוצאות רווח בר סמך על תוצאות בדיקת ההשערות. חוקרים נוטים להמעיט בשימוש ברווח בר סמך למרות חשיבותו באמידת הפרמטר הרצוי. מטרתו של רווח בר סמך היא לתת טווח ערכים מצומצם ככל האפשר, הכולל את הפרמטר שאותו מחפש החוקר; לעומת זאת בדיקת השערות מטרתה לבדוק קיומו של הבדל בין הפרמטרים בשתי אוכלוסיות או יותר. לדוגמא: נניח שהחוקר רוצה לבדוק את ממוצע לחץ הדם הסיסטולי אצל חולי לב. התקבל ממוצע לחץ דם סיסטולי של 123 מ"מ כספית במדגם של 600 חולי לב. רווח בר סמך לממוצע לחץ דם סיסטולי של חולי לב של (122,124) נותן אינפורמציה די ברורה על גודלו של הממוצע האמיתי באוכלוסיית חולי הלב; לא קטן מ- 122 ולא גדול מ- 124. לעומת זאת רווח של (113,133) למעשה לא נותן כל אינפורמציה חדשה; די ברור שממוצע לחץ דם סיסטולי נע בין ערכים אלו גם ללא תוצאות המחקר. נשאלת השאלה האם ממוצע לחץ דם סיסטולי של חולי לב שונה מממוצע לחץ דם של כלל האוכלוסייה הבריאה (שהוא 120 מ"מ כספית). תשובה לשאלה זו, שבמהותה בודקת את ההשערה שיש הבדל בין אוכלוסיית חולי הלב לאוכלוסייה הבריאה, ניתן למצוא בחישוב של רווח הסמך. ניתן לראות שרווח הסמך הראשון (122,124), ברמת מובהקות של 95%, לא מכיל את הערך 120, כלומר ברמת מובהקות של 5% ניתן לומר שממוצע לחץ הדם של חולי הלב שונה באופן מובהק מממוצע לחץ דם של כלל האוכלוסייה. רווח בר סמך ניתן לעשות לכל פרמטר מוגדר כמו: פרופורצית המעשנים בקרב חולי סרטן, הפרש ממוצע הכולסטרול בין גברים ונשים, הפרש פרופורצית המעשנים בישראל לעומת ארה"ב וכד'. בחירת המבחן הסטטיסטי הנכון בחירת המבחן הסטטיסטי המתאים לנתונים תלוי בסקלה שבה נמדדים משתני המחקר ובהתפלגות שלהם. ניתוח הקשר בין משתנים כמותיים רציפים (כמו גיל, משקל, לחץ דם, כולסטרול ועוד), בינם לבין עצמם, שונה מניתוח הקשר בין משתנים רציפים למשתנים דיכוטומיים (כמו: מין: זכר, נקבה, סוג טיפול: A או B וכו'). מטרתו של מבחן סטטיסטי היא למצוא קשר או תלות בין שני משתנים או יותר במחקר. ניתוח סטטיסטי מתחיל בבדיקת קשרים בין שני משתנים בלבד לצורך קבלת מושג על סוג הקשר ועוצמתו. לדוגמא: האם יש קשר בין יתר לחץ דם להארעות של מחלות לב, בין סוכרת להארעות של מחלות לב, בין רמות כולסטרול להארעות של מחלות לב וכו' (כל אחד בנפרד). לאחר שנמצאו המשתנים שאכן קשורים להארעות מחלות לב, יש לבנות מודל שיכיל בתוכו את כל המשתנים שנמצאו כחשובים בו זמנית, כדי לבדוק את השפעתם "הנקיה" של כל אחד מהמשתנים על הארעות מחלות לב, בנטרול השפעת המשתנים האחרים במודל.

מבחנים א-פרמטרים משתמשים במבחנים א-פרמטרים כאשר התפלגות המשתנה איננה ידועה. נשתמש במבחנים א-פרמטרים בעיקר כאשר גודל המדגם קטן יחסית ולא ניתן להניח שום הנחה על התפלגות המשתנה (לדוגמא שהמשתנה מתפלג התפלגות סימטרית או אפילו נורמלית). כמו כן, מבחנים אלו מתאימים בעיקר למשתנים דרוגיים (כאשר מדידת המשתנה נעשית ע"י דרוג ולא ע"י ערכים כמותיים). העיקרון מאחורי מבחנים אלו הוא השוואת דרוג הערכים (1 – ערך נמוך ביותר עד n – לערך הגבוה ביותר במדגם בגודל n) ולא השוואת ערכי המשתנה עצמם. משווים בין ממוצע הדרוג בקבוצה אחת, לדוגמא, לממוצע הדרוג בקבוצה שניה. או משווים בין ממוצעי הדרוג ביותר משתי קבוצות.

קשר אינו מעיד על סיבתיות

יש לבחון בזהירות את ממצאי המחקר הסטטיסטי המתבסס על ניתוח סטטיסטי שמטרתו לכמת את הקשר בין המשתנים. קשר סטטיסטי מובהק אינו מעיד בהכרח על קשר סיבתי. הגדרה מחמירה של סיבתיות טוענת שעל מנת שיתקיים קשר סיבתי – שינוי במשתנה אחד (X) צריך לגרור שינוי במשתנה אחר (Y). לצורך זה יש צורך בניסוי קליני מבוקר שיאשר את ההשערה ששינוי במשתנה אחד בהכרח גורר שינוי במשתנה אחר. במרבית המקרים לא ניתן לבצע ניסוי כזה, בעיקר כשמדובר בגורמי סיכון. לכן הוצגו קריטריונים שונים לקיומו של קשר סיבתי. Bradford Hill ניסח רשימה של קריטריונים הבודקים האם הקשר שנמצא הוא קשר סיבתי: 1. חוזק הקשר – הקשר חזק במספר מחקרים זהים. 2. אפקט מינון- תגובה – ערכו של המשתנה התלוי משתנה עם שינוי במינון של המשתנה הבלתי תלוי. 3. עקביות הממצאים – רוב המחקרים מגיעים לתוצאות זהות. 4. הסבר תיאורטי וביולוגי – הממצאים מאשרים ידע תיאורטי וביולוגי. 5. בהירות הממצאים – הממצאים אינם סותרים עובדות ידועות אודות המשתנה הנמדד. ברור שלא קל ליישם את כל הקריטריונים הדרושים על מנת להוכיח סיבתיות. יתרה מזאת, גם אם קריטריונים אלו מתקיימים עדיין אין זו הוכחה חד משמעית כמו הוכחה באמצעות ניסוי מבוקר. למרות זאת מרבית החוקרים האפידמיולוגים אימצו קריטריונים אלו.

למרות שלא ניתן להוכיח סיבתיות באמצעות ניתוח סטטיסטיניתן לכמת בצורה טובה את הקשר בין משתנים במונחים סטטיסטים. החוקר יכול למדוד את המידה בה שינוי במשתנה אחד יכול לגרור שינוי במשתנה אחר. מודלים דטרמיניסטים מוחלטים, כמו חוקי הפיסיקה לדוגמא, שונים ממודלים סטטיסטיים רב משתנים בהם קיימת טעות אפשרית בתיאור הקשר בין המשתנים. לדוגמא: בבדיקת הקשר בין גיל ולחץ דם, נמצא כי לחץ הדם הסיסטולי עולה עם עליה בגיל. אבל עדיין יתכן שאנשים באותו גיל יהיו בעלי ערכי לחץ דם סיסטולי שונה או יותר מכך, אדם מבוגר יהיה בעל ערך לחץ דם סיסטולי נמוך יותר מאדם צעיר ממנו. כלומר המודל הסטטיסטי תומך בטענה שבממוצעקיים קשר בין גיל ולחץ דם סיסטולי. הוכחות מ"הרחוב" על אנשים שמנים, מעשנים וללא כל הרגלי בריאות שחיים חיים ארוכים ללא חולי, מחדדות את החשיבות בהבנת המודל הסטטיסטי כמודל לא דטרמיניסטי.