Two-phase sampling designs are developed and investigated for use in the context of a rheumatology study where interest lies in the association between a biomarker with an expensive assay and disease progression. We derive optimal phase-II stratum-specific sampling probabilities for analyses from parametric maximum likelihood (ML), mean score (MS), inverse probability weighted (IPW) and augmented inverse probability weighted estimating equations (AIPW). The easy-to-implement optimally efficient design for the MS estimator is found to be asymptotically optimal for the IPW and AIPW estimators we consider, and is shown to result in efficiency gains over balanced and simple random sampling even when analyses are likelihood-based. We further demonstrate the robustness of this optimal design and show that it results in very efficient estimation even when the model or parameters used in its derivation are misspecified. The Canadian Journal of Statistics 42: 268-284; 2014 (c) 2014 Statistical Society of Canada Resume Des plans d'echantillonnage a deux phases sont developpes et etudies dans le contexte d'une etude en rhumatologie dont l'interet principal porte sur l'association entre un biomarqueur dont la bioanalyse est dispendieuse et la progression de la maladie. Les auteurs calculent les probabilites d'echantillonnage optimales specifiques a chaque strate en phase II pour les equations d'estimation basees sur le maximum de vraisemblance (MV), le score moyen (SM), la ponderation par l'inverse des probabilites (PIP), et la PIP augmentee (PIPA). Facile a implementer et optimalement efficace, le plan pour l'estimateur SM est aussi asymptotiquement optimal pour les estimateurs PIP et PIPA consideres par les auteurs, en plus de presenter un gain d'efficacite par rapport aux plans bases sur un echantillon aleatoire simple ou balance lorsque l'estimation est effectuee par le MV. Les auteurs demontrent aussi la robustesse de ce plan optimal qui conduit a des estimateurs tres efficaces meme lorsque le modele ou ses parametres sont mal specifies. La revue canadienne de statistique 42: 268-284; 2014 (c) 2014 Societe statistique du Canada
机构:
Mem Univ Newfoundland, Dept Math & Stat, St John, NF, Canada
Univ Michigan, Sch Publ Hlth, Biostat Dept, Ann Arbor, MI USAMem Univ Newfoundland, Dept Math & Stat, St John, NF, Canada
Ryan, Brady
Nirmalkanna, Ananthika
论文数: 0引用数: 0
h-index: 0
机构:
Mem Univ Newfoundland, Dept Math & Stat, St John, NF, CanadaMem Univ Newfoundland, Dept Math & Stat, St John, NF, Canada
Nirmalkanna, Ananthika
Cigsar, Candemir
论文数: 0引用数: 0
h-index: 0
机构:
Mem Univ Newfoundland, Dept Math & Stat, St John, NF, CanadaMem Univ Newfoundland, Dept Math & Stat, St John, NF, Canada
Cigsar, Candemir
Yilmaz, Yildiz E.
论文数: 0引用数: 0
h-index: 0
机构:
Mem Univ Newfoundland, Dept Math & Stat, St John, NF, CanadaMem Univ Newfoundland, Dept Math & Stat, St John, NF, Canada
机构:
Univ Toronto, Dept Stat Sci, Toronto, ON, CanadaUniv Toronto, Dalla Lana Sch Publ Hlth, Div Biostat, Toronto, ON, Canada
Craiu, Radu V.
Bull, Shelley B.
论文数: 0引用数: 0
h-index: 0
机构:
Univ Toronto, Dalla Lana Sch Publ Hlth, Div Biostat, Toronto, ON, Canada
Sinai Hlth Syst, Lunenfeld Tanenbaum Res Inst, Toronto, ON, CanadaUniv Toronto, Dalla Lana Sch Publ Hlth, Div Biostat, Toronto, ON, Canada