在实际应用中,真实的模型通常是未知的,人们往往根据自身的经验将各种与反应变量有关的协变量引入回归模型,这样往往会把一些与反应变量关系很小或不相关的变量作为协变量。此时,就需要进行变量选择。无关变量的剔除可以有效的提高估计效率,还有助于更好地找出反应变量和协变量之间的内在联系,提高模型的预测精度。因此,在左截断数据下,部分线性模型的分位数回归的变量选择问题是不可避免的。考虑到一个拟合不足的模型将会产生有偏的估计量和大的残差,而过度拟合的模型可能会降低估计的有效性。在这一节,对模型(4.0.1),借助SCAD惩罚方法,本节提出一个变量选择过程。SCAD惩罚函数在原点附近是对称的,当t>0时,它的一阶导数为
其中a>2和λ>0是扭转参数。正如Fan和Li(2001)一样,本节选择a=3.7。接下来考虑下列的惩罚损失函数
与文献Kai等人(2011)类似,首先计算非惩罚的半参数分位数估计量。设
加权惩罚的分位数回归估计量定义为argminβLn(β)。
为了选择扭转参数λ,借助下列的BIC(Bayesian Information Criterion)标准
其中dfλ表示的非零元素的个数。于是扭转参数λ可被选择为λ=arg minλBIC(λ)。(www.daowen.com)
不失一般性,把真实的参数向量分割为βτ=,其中β1τ∈Rs包含所有非零的部分,β2τ=0包含q-s个噪音变量。类似地,基于βτ的表示法,加权惩罚的分位数回归估计量可表示为。另外,用同样的方式定义X1,X1表示X的前s个元素构成的向量。
定理4.1.4 假设4.4节中条件(C1)—(C6)成立,若λ→0,→∞,nh4→0,nh2/log(1/h)→∞,则
(a)(稀疏性):依概率趋于1有,=0;
(b)(渐近正态性):,
其中Σ1=,Σ0=,=X1-δ(X1,W)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。