רווח בר-סמך

בתורת האמידה הסטטיסטית, רווח בר-סֶמֶך (או רווח סמך) עבור פרמטר לא ידוע של התפלגות ממשפחה ידועה של התפלגויות, הוא קטע המחושב מתוך תוצאות של מדגם, באופן כזה שהסיכוי הא-פריורי (טרם לקיחת המדגם) שהקטע שנקבל יכלול את הפרמטר הוא קבוע, הקרוי "רמת הסמך" של הרווח. משמעות הדבר היא, שאם נבצע מספר אינסופי של דגימות, אחוז הדגימות שהקטע שיחושב עבורן יכלול את הפרמטר שווה לרמת הסמך. "רמת המובהקות" של הרווח היא המשלים של רמת הסמך (למשל, אם רמת הסמך היא 95%, אז רמת המובהקות היא 5%).

בין הגורמים המשפיעים על אורכו של רווח הסמך: גודל המדגם (מספר התצפיות), השונות של הפרמטר (האמיתית אם ידועה, או אומד לשונות על סמך המדגם אם לא ידועה) ורמת הסמך. ככל שהמדגם גדול יותר, השונות נמוכה יותר ורמת הסמך קטנה יותר, כך רווח הסמך יהיה קצר יותר, ולהפך.

רווחי סמך הוצגו לראשונה על ידי ג'רזי ניימן במאמר שפורסם בשנת 1937.

רקע

הצורך בבניית רווח בר-סמך עולה כאשר ההתפלגות של משתנה מקרי מסוים אינה ידועה באופן מלא; ידוע שההתפלגות שייכת למשפחה מוכרת של התפלגויות, אבל לא ידוע איזו מבין החברות במשפחה היא ההתפלגות הנכונה. למשל, ידוע משיקולים תאורטיים שמספר השקדים המרים בחבילה גדולה הוא בעל התפלגות פואסונית - אבל ללא מדידה מעשית של החבילות, לא ניתן לקבוע באיזו התפלגות מדובר, מבין אינסוף ההתפלגויות השונות הקרויות בשם זה, הנבדלות זו מזו בערכה של התוחלת . (מספר, כגון , המבדיל בין חברות שונות במשפחה של התפלגויות, קרוי פרמטר).

תורת האמידה עוסקת בחילוץ מידע על ערכו של הפרמטר, מתוך נתונים שנאספו במדגם (מתוך ההתפלגות שאינה ידועה). את תורת האמידה אפשר לחלק באופן גס לשני תחומים - אמידה נקודתית, בה מנסים לקלוע לערכו המדויק של הפרמטר, ואמידת רווח, שבה בונים רווח בר-סמך לפרמטר, שגם אם אינו מדויק, יש סיכוי טוב לכך שהוא מכיל את הפרמטר.

תיאור מתמטי

נתון מדגם עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X_1,\dots,X_n} מהתפלגות , הידועה למעט ערכו של הפרמטר . רווח בר-סמך בעל רמת מובהקות עבור הפרמטר הוא קטע , ששני קצותיו הם "סטטיסטים" (כלומר, פונקציות של המדגם, שאינן תלויות בפרמטר), כך שההסתברות למאורע היא עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ 1-\alpha} .

אם כך, הסיכוי לכך שהפרמטר שייך לרווח שווה ל- עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ 1-\alpha} , והסיכוי לכך שהטענה "הפרמטר שייך לרווח זה" תהיה שגויה, הוא . ביישומים שונים מקובל לדרוש שהסיכוי לטעות יהיה עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \alpha = 0.05} או .

לאחר ביצוע הליך הדגימה בפועל, המשתנים המקריים עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X_1,\dots,X_n} מקבלים ערכים מספריים, וכך הופכים גם קצות הקטע עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ V_1,V_2} למספרים, נאמר עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ v_1,v_2} .

מכשלה נפוצה היא לומר שבמקרה זה, "הסיכוי לכך שהפרמטר נמצא בין עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ v_1} ל- הוא עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ 1-\alpha} ". ניסוח זה שגוי בתכלית, משום שלפרמטר אין התפלגות - הוא מספר (וגם אם הוא נקבע על-פי התפלגות כלשהי, התפלגות זו אינה נלקחת בחשבון בחישוב הרווח). אם כך, הסיכוי לכך שהפרמטר יהיה בין שני מספרים הוא אפס, או אחד (גם אם איננו יודעים איזו אפשרות היא הנכונה). מה שכן נכון לומר, הוא שא-פריורית לביצוע הניסוי, הסיכוי לכך שהפרמטר האמיתי יהיה שייך לקטע אותו נקבל כרווח בר-סמך הוא בדיוק עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ 1-\alpha} (וסיכוי של שיהיה מחוץ לו); אבל לאחר שהניסוי כבר בוצע, רווח הסמך כבר נקבע, ולכן המאורע שהפרמטר האמיתי בתוך או לא בתוך הקטע איננו מאורע הסתברותי (כלומר, או שהוא בוודאות בתוך הקטע או בוודאות מחוץ לו).

חישוב רווחים בני-סמך

דוגמה

מבקשים לאמוד את הפרמטר הלא ידוע בהתפלגות אחידה עיבוד הנוסחה נכשל (שגיאת המרה. השרת ("https://en.wikipedia.org/api/rest_") השיב: "Cannot get mml. Server problem."): {\displaystyle \ U(0,\theta )} , באמצעות דגימה בודדת, X. לכל מספר , הסיכוי למאורע עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ t\theta < X < (0.95+t)\theta} שווה ל- ; ואם כך, זהו בדיוק הסיכוי (טרם הדגימה) לכך ש- ייפול בקטע עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (\frac{X}{0.95+t},\frac{X}{t})} (שקצותיו אינם קבועים, כמובן, אלא תלויים במשתנה המקרי X). כל אלו (עבור כל ערך של t) הם רווחי סמך לפרמטר, בעלי אותה רמת מובהקות.

בחירה בין רווחים שונים

בדרך כלל אפשר לבנות רווחים בני-סמך רבים לאותו פרמטר, מאותו מדגם, כבדוגמה לעיל. יש כמה קריטריונים להעדפה (א-פריורי) של רווח מסוים על-פני רווח אחר:

  • אורך הרווח: מעדיפים רווח קצר על-פני רווח ארוך; למשל, נעדיף לדעת שהפרמטר נמצא, בסיכוי 0.95, בקטע עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (X-2,X+2)} , מאשר שהוא נמצא באותו סיכוי בקטע עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (X-1,X+6)} (גם אם שתי הטענות נכונות).
  • סימטריה: מעדיפים רווח שהסיכוי (א-פריורי) ליפול מקצהו האחד שווה לסיכוי ליפול מקצהו האחר.

שיקולים אלה עשויים להיות סותרים (וישנם גם שיקולים אחרים). בדוגמה שניתנה לאמידה של פרמטר בהתפלגות אחידה, השיקול הראשון יציע את הרווח , ואילו השני את הרווח עיבוד הנוסחה נכשל (שגיאת המרה. השרת ("https://en.wikipedia.org/api/rest_") השיב: "Cannot get mml. Server problem."): {\displaystyle \ ({\frac {40}{39}}X,40X)} .

שיטת הכמות הצירית

בחישוב תאורטי של רווחים בני-סמך עושים שימוש בפונקציה הקרויה כמות צירית, שהיא מזיגה של המדגם ושל הפרמטר, שהתפלגותה ידועה ואינה תלויה בפרמטר.

לדוגמה, עבור מדגם של משתנים מהתפלגות אחידה, היחס עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \frac{X_1}{\theta}} הוא כמות צירית, משום שההתפלגות שלו (אחידה בין אפס לאחת) אינה תלויה בפרמטר. עבור מדגם עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X_1,\dots,X_n\sim N(\mu,1)} של משתנים מהתפלגות נורמלית (בעלת תוחלת לא ידועה ושונות 1), ההפרש הוא כמות צירית, משום שההתפלגות שלו נורמלית סטנדרטית.

אם Q היא כמות צירית, והסיכוי לטעות, , נתון, אפשר למצוא קבועים עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \gamma_1,\gamma_2} כך ש- עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ P(\gamma_1<Q<\gamma_2)=1-\alpha} . מכיוון ש- Q תלוי בפרמטר, אפשר (לעיתים קרובות) לחלץ משוויון זה רווח סמך לפרמטר.

רווח בר-סמך לתוחלת של התפלגות נורמלית

להתפלגות הנורמלית חשיבות מיוחדת בסטטיסטיקה, בזכות משפט הגבול המרכזי. בתרחיש הפשוט ביותר בהקשר זה, נתון מדגם עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ X_1,\dots,X_n \sim N(\mu,\sigma)} , ומבקשים לבנות רווח בר-סמך עבור הפרמטר עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \mu} , השווה לתוחלת ההתפלגות. ישנם שני מקרים:

  • אם השונות עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \sigma^2} ידועה, אז הגודל עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ Q=\frac{\bar{X}-\mu}{\sigma/\sqrt{n}}} הוא כמות צירית בעלת התפלגות נורמלית סטנדרטית (כאשר הוא הממוצע), ומכאן אפשר לבנות את הרווח עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (\bar{X}-z_{\alpha/2}\frac{\sigma}{\sqrt{n}}, \bar{X}+z_{\alpha/2}\frac{\sigma}{\sqrt{n}})} . הערך עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ z_{\alpha/2}} הוא מספר המקיים עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ P(Q>z_{\alpha/2})=\alpha/2} כאשר Q משתנה נורמלי סטנדרטי. למשל, עבור עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ \alpha=0.05} , מתקבל .
  • אם השונות אינה ידועה, לא ניתן להיעזר בה בבניית כמות צירית, ויש להחליף אותה באומד לשונות, עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar{X})^2} . במקרה זה לכמות הצירית עיבוד הנוסחה נכשל (שגיאת המרה. השרת ("https://en.wikipedia.org/api/rest_") השיב: "Cannot get mml. Server problem."): {\displaystyle \ Q={\frac {{\bar {X}}-\mu }{S/{\sqrt {n}}}}} יש התפלגות t עם n-1 דרגות חופש, ומכאן אפשר לבנות את הרווח עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ (\bar{X}-t_{n-1,\alpha/2}\frac{s}{\sqrt{n}}, \bar{X}+t_{n-1,\alpha/2}\frac{s}{\sqrt{n}})} , שבו הערך עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ t_{n-1,\alpha/2}} מקיים עיבוד הנוסחה נכשל (MathML עם גיבוי SVG או PNG (מומלץ לדפדפנים מודרניים ולכלי נגישות): תגובה בלתי־תקינה ("Math extension cannot connect to Restbase.") מהשרת "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \ P(Q>t_{n-1,\alpha/2})=\alpha/2} כאשר Q משתנה בעל התפלגות t עם n-1 דרגות חופש.

הקשר לבדיקת השערות

בנייה של רווח בר-סמך שקולה לבעיות רבות בבדיקת השערות סטטיסטית, למרות שהמטרות בשני המקרים שונות בתכלית. בבניית רווח, המטרה היא להציג תחום שבו סביר למצוא את הפרמטר. בבדיקת השערות, מעוניינים לפסול (או שלא לפסול) השערה מסוימת על ערכו המדויק של הפרמטר.

אם למשל משערים שערכו של פרמטר מסוים הוא אפס, וקיים רווח בר-סמך (בעל רמת מובהקות מסוימת) שאינו כולל את הערך הזה, אז אפשר לפסול את ההשערה באותה רמת מובהקות.

ראו גם

This article is issued from Hamichlol. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.