סמינר תוארII  בסטטיסטיקה

Bootstrap and Resampling Methods

סמסטר ב תשע"ז

 

מרצה:   סהרון רוסט

            שרייבר 022

            saharon@post.tau.ac.il

            שעות קבלה: ג 14-16, או על פי תאום (נא לתאם בכל מקרה)

 

עמוד הבית:  http://www.tau.ac.il/~saharon//BootstrapSeminar.htm

 

פילוסופיה

מטרות הסמינר הן:

·         לחוות למידה עצמית והתמודדות עם טקסטים של ספרי עיון ושל מאמרים מדעיים

·         לפתח חשיבה ביקורתית בקריאת חומר כזה

·         לרכוש ניסיון בארגון החומר והצגתו מול קהל

·         ללמוד תחום מעניין וחשוב בסטטיסטיקה, שפורמט הסמינר מאפשר לכסות אותו ממגוון זוויות שונות

 

נושא

הסמינר ייסוב סביב נושא Bootstrap and Resampling Methods (מצגת מהשיעור הראשון).

 

חומר להצגה

לצורך כיסוי הנושא נשתמש בשני מקורות עיקריים:

1.      B. Efron, R Tibshirani. (1992). An Introduction to the Bootstrap. ספר זה מהווה הקדמה טובה ומקיפה למדי לנושא כולל:

o       מוטיבציה

o       אלגוריתמים עיקריים

o       שימושים מרכזיים

o       הסקה סטטיסטית אלמנטרית

ניתן יהיה להשתמש גם בחומר מספרים אחרים כמובן

2.      אוסף מאמרים שמכסים אספקטים מתקדמים וממוקדים יותר של הנושא, כולל

o       שימושים בתחומים ספציפיים כגון גנטיקה, פיננסים וכו'

o       העמקה תיאורטית

o       הרחבות אלגוריתמיות ומתודולוגיות

רשימת מאמרים (בהמשך יוצעו אחרים):

 

 

1.      J. Felsenstein. (1985). Confidence limits on phylogenies: an approach using the bootstrap. Evolution 39(4) (מתן+יותם)

2.      B. Efron, B. Halloran, S. Holmes. (1996). Bootstrap confidence levels for phylogenetic trees. Proc Natl Acad Sci U S A. 93: 7085–7090 (מתן+יותם)

3.      B. Efron. (1987). Better Bootstrap Confidence Intervals. JASA 82(397)

4.      TJ DiCiccio, B Efron (1996). Bootstrap confidence intervals. Statistical Science. Vol. 11, No. 3 (Aug., 1996).

5.      H. Li, G. Maddala. (1996). Bootstrapping time series models. Econometric reviews 15(2)  (חיים)

6.      M. Kerr, G. Churchill. (2001). Bootstrapping cluster analysis: Assessing the reliability of conclusions from microarray experiments. Proc Natl Acad Sci U S A. 98(16) (חיים)

7.      L. Breiman. (1996). Bagging predictors. Machine Learning, Volume 24, Number 2   (דנה) 

8.      L. Breiman. (1996). Heuristics of Instability and Stabilization in Model Selection. The Annals of Statistics, Vol. 24, No. 6

9.      M. J. Van Der Laan and J. Bryan (2001). Gene expression analysis with the parametric bootstrap. Biostatistics, 2:445-461 (2001) (רועי)

10.  G. Babu and C. Rao (2004). Goodness-of-Fit Tests When Parameters Are Estimated. Sankhyā 66(1):63-74. (יאיר)

11.  B. Efron, R. Tibshirani. (1997). Improvements on Cross Validation: the 0.632+ Bootstrap. JASA Vol. 92, No. 438  

12.  J. Carpenter, J. Bithell. (2000). Bootstrap confidence intervals: when, which, what? A practical guide for medical statisticians. Statistics in Medicine 19: 1141-1164

13.  A. Kleiner, A. Talwalkar, P. Sarkar, M. I. Jordan. (2014). A scalable bootstrap for massive data. Journal of the Royal Statistical Society,76(4) (נעה)

14.  J. P. Romano, A. M. Shaikh, M. Wolf. (2008). Control of the false discovery rate under dependence using the bootstrap and subsampling. Test, 17: 417–442 (דן)

15.  Michael Kosorok. (2008). Bootstrapping the Grenander estimator. IMS Collections

16.  Peter J. Bickel and Anat Sakov. (2008). On the choice of m in the m out of n bootstrap and confidence bounds for extrema. Statistica Sinica 18(2008), 967-985

17.  Collection of papers on Bayesian Bootstrap (רועי)

18.  Jun S. Liu and Rong Chen. (1996). Sequential Monte Carlo Methods for Dynamic Systems. Journal of the American Statistical Association, Vol. 93, No. 443 (Sep., 1998), pp. 1032-1044 (ניר)

 

מרכיבי הציון

·         1-2 הרצאות בכיתה לכל תלמיד: 90% מהציון

o       כל תלמיד יציג פרק(ים) מהספר, ו/או מאמר מתקדם        

·         השתתפות פעילה בכיתה בהרצאות של תלמידים אחרים: 10% מהציון

·         קריטריונים לאיכות הרצאות:

o       הבנת הנושא

o       הבחנה בין עיקר לטפל

o       קריאה ביקורתית

o       גישור על הפערים בין תיאוריה, מתודולוגיה ויישום

o       הצגה בהירה, מדויקת ומסודרת

·         כל הרצאה תארך לפחות שעה, לחלקן נקצה עד שעתיים (תלוי במספר התלמידים)

 

תוכנית ראשונית:

·         שבוע 2 (22.3) –  פרקים 5-7 (מתן), 8-9 (יותם)

·         שבוע 3 (29.3) – פרקים 10-11 (אביב), 12-13 (יאיר)

·         שבוע 4 (19.4) – פרק 14 (+22, ניר) (קוד R), 15-16 (נעה)

·         שבוע 5 (26.4) – פרקים 17-18 (איתן),

·         שבוע 6 (3.5) –  מאמר מס.7 של בריימן (דנה), מאמר 6 (חיים)

·         שבוע 7 (10.5) – מאמר 14 (דן)

·         שבוע 8 (17.5) – מאמר 9 (רועי), מאמר 13 (נעה)

·         שבוע 9 (24.5) – מאמרים 1+2 (מתן + יותם)

·         שבוע 10 (7.6) – פרקים 21+24 (דנה), פרק 23 (איתן)

·         שבוע 11 (14.6) – מאמר 5 (חיים), מאמר 18 (ניר)

·         שבוע 12 (21.6) – פרקים 20+25 (אביב), מאמרים 17 (רועי)

·         שבוע 13 (28.6) – מאמר 10 (יאיר)