We consider data integration problems where correlated data are collected from multiple platforms. Within each platform, there are linear relationships between the responses and a collection of predictors. We extend the linear models to include random errors coming from a much wider family of sub-Gaussian and subexponential distributions. The goal is to select important predictors across multiple platforms, where the number of predictors and the number of observations both increase to infinity. We combine the marginal densities of the responses obtained from different platforms to form a composite likelihood and propose a model selection criterion based on Bayesian composite posterior probabilities. Under some regularity conditions, we prove that the model selection criterion is consistent to recover the union support of the predictors with divergent true model size. Dans cette etude, la problematique de l'integration de donnees correlees collectees a partir de diverses plateformes est minutieusement examinee. Au sein de chaque plateforme, des relations lineaires sont identifiees entre les variables de reponse et un ensemble specifique de predicteurs. Pour enrichir l'analyse, les modeles lineaires sont generalises afin d'inclure des composantes d'erreur aleatoire issues d'une famille elargie de lois, telles que les distributions sous-gaussiennes et sous-exponentielles. L'objectif principal de l'etude est l'identification de predicteurs pertinents a travers plusieurs plateformes, une tache rendue plus complexe par l'augmentation indefinie du nombre de predicteurs et du volume d'observations. A cet effet, les auteurs de ce travail combinent les densites marginales des variables reponses provenant de differentes plateformes pour former une fonction de vraisemblance composite. Sur cette base, ils proposent un critere de selection de modele en s'appuyant sur des probabilites a posteriori composites dans un contexte bayesien. Enfin, sous des conditions de regularite specifiques, les auteurs demontrent que leur critere de selection de modele est convergent et permet de recuperer le support d'union des predicteurs, meme en presence d'une divergence dans la taille du modele veritable.