סטטיסטיקה חסינה


כל מה שרצית לדעת על סטטיסטיקה חסינה:
סטטיסטיקה חסינה או "סטטיסטיקה רוֹבּוּסטית" (Robust statistics) היא טכניקה סטטיסטית שביצועיה טובים עבור נתונים מטווח רחב של התפלגויות.
יתרונה בולט במיוחד עבור התפלגויות שאינן נורמליות.
שיטות הסטטיסטיקה החסינות מתבססות יותר על החציון מאשר על הממוצע ומשתמשות יותר בערכים שבמרכז המדגם מאשר בערכים שבקצותיו.
הסטטיסטיקה החסינה מבקשת לספק שיטות המחקות את השיטות המקובלות בסטטיסטיקה, אך פחות מושפעות מנתונים קיצוניים.
שיטות ההערכה הקלאסיות בסטטיסטיקה נשענות בחוזקה על השערות שלעתים קרובות אין להן אחיזה במציאות.
הסטטיסטיקה החסינה מוגדרת להיות עמידה מפני טעויות הנובעות מסטייה מההשערות.
זה אומר שגם אם ההשערות מתקיימות רק בקירוב, המדד הסטטיסטי החסין יספק יעילות והטיה מתקבלות על הדעת, ואסימפטוטית יהיה חסר הטיה.
שימוש נפוץ בסטטיסטיקה חסינה הוא להתמודדות עם תופעת הזנב הארוך.
מדידת חסינות
הכלים העיקריים המשמשים לתיאור ומדידת חסינות הם נקודת השבירה, פונקציית ההשפעה ועקומת הרגישות.
נקודת השבירה של מדד סטטיסטי היא שיעור התצפיות הקטן ביותר ששינוי בלתי מוגבל בהן יגרום לשינוי לא חסום בערך המדד.
לדוגמה, בהינתן אוסף של n מספרים ניתן להשתמש בנוסחה: על מנת לחשב את הממוצע.
הממוצע לכן הוא בעל נקודת שבירה של 0 מכיוון שניתן לשנות אותו באופן בלתי חסום על ידי שינוי של כל אחד מהערכים .
פונקציית ההשפעה בודקת את תלות המדד הסטטיסטי בערך נקודה בודדת במדגם.
עקומת הרגישות בודקת כיצד המדד הסטטיסטי מושפע משינויים קלים בפיזור הערכים במדגם.
דוגמאות:

חציון הוא מדד חסין, בעל נקודת שבירה של 50%, בעוד לממוצע נקודת שבירה של 0% והוא איננו מדד חסין.
טווח בין-רבעוני הוא מדד חסין של סטייה ססטסטית, בעוד שטווח איננו.

מקור: https://he.
wikipedia.
org/w/index.
php?title=סטטיסטיקה_חסינה&oldid=16185109
קטגוריה: סטטיסטיקה

נלקח מויקיפדיה

הגדרות נוספות הקשורות לסטטיסטיקה חסינה:
סטטיסטיקה