Hypothesis testing in finite mixture of regressions: Sparsity and model selection uncertainty

被引:0
|
作者
Khalili, Abbas [1 ]
Vidyashankar, Anand N. [2 ]
机构
[1] McGill Univ, Dept Math & Stat, 805 Sherbrooke St West, Montreal, PQ H3A 0B9, Canada
[2] George Mason Univ, Volgeneau Sch Engn, Dept Stat, 4400 Univ Dr,MS 4A7, Fairfax, VA 22030 USA
基金
加拿大自然科学与工程研究理事会;
关键词
Adjusted p-value; BIC-enhanced tuning parameter; data splitting; family-wise error rate; model selection consistency; MAXIMUM-LIKELIHOOD-ESTIMATION; CONFIDENCE-REGIONS;
D O I
10.1002/cjs.11467
中图分类号
O21 [概率论与数理统计]; C8 [统计学];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
Sparse finite mixture of regression models arise in several scientific applications and testing hypotheses concerning regression coefficients in such models is fundamental to data analysis. In this article, we describe an approach for hypothesis testing of regression coefficients that take into account model selection uncertainty. The proposed methods involve (i) estimating the active predictor set of the sparse model using a consistent model selector and (ii) testing hypotheses concerning the regression coefficients associated with the estimated active predictor set. The methods asymptotically control the family wise error rate at a pre-specified nominal level, while accounting for variable selection uncertainty. Additionally, we provide examples of consistent model selectors and describe methods for finite sample improvements. Performance of the methods is also illustrated using simulations. A real data analysis is included to illustrate the applicability of the methods. The Canadian Journal of Statistics 46: 429-457; 2018 (c) 2018 Statistical Society of Canada Les melanges epars de modeles de regression surviennent dans plusieurs applications scientifiques, et il est fondamental pour l'analyse des donnees de tester des hypotheses a propos des coefficients de ces modeles. Les auteurs decrivent une approche pour tester les coefficients de regression en tenant compte de l'incertitude liee a la selection de modele. Les methodes proposees comportent (i) l'estimation de l'ensemble des predicteurs actifs d'un modele epars a l'aide d'un selecteur de modele convergent, et (ii) le test d'hypotheses a propos des coefficients de regression associes a l'ensemble de predicteurs actifs. Les methodes controlent asymptotiquement le taux d'erreur par famille a un niveau predefini tout en tenant compte de l'incertitude issue de la selection de variables. Les auteurs fournissent des exemples de selecteurs de modele convergent et decrivent des methodes apportant des ameliorations avec des echantillons finis. Ils illustrent la performance de leurs methodes a l'aide de simulations et procedent a l'analyse de donnees reelles pour montrer son applicabilite. La revue canadienne de statistique 46: 429-457; 2018 (c) 2018 Societestatistique du Canada
引用
收藏
页码:429 / 457
页数:29
相关论文
共 50 条