不完全数据下半参数回归模型的统计推

经验对数似然比函数在不完全数据下的统计推

针对随机缺失机制模型,已有的完全数据的理论和方法无法直接应用。由于包含一个插入的非参数估计量,由此可见存在偏倚-m。根据Owen,反应变量Y的均值θ的一个纠偏加权的经验似然函数定义为借助Lagrange乘数法,由于pi=pi(θ)=,1≤i≤n时,有最大值,其中λ=λ(θ)是方程=0的解。类似地,忽略常数项-nlogn,我们定义带辅助信息的θ的纠偏加权的经验对数似然比函数如下
理论教育 2023-11-20

基于数据的MelbourneCPI预测误差分析

数据收集了从1972年9月到2016年9月期间共N=176组样本。Bootstrap检验重复次数为500。借助WCQR5估计方法,得到θ的估计量是假设检验的p值是0,故在显著性水平α=0.05下,拒绝模型是线性模型的假设。因此协变量的系数应被假设为变系数的,故使用变系数模型来拟合Melbourne CPI数据。图5-5基于三种估计方法的非参数函数的估计曲线表5-3Melbourne CPI数据的预测误差结果由表格5-3,可以发现:加权复合分位数回归方法的预测误差最小。
理论教育 2023-11-20

截断数据下加权的复合分位数估计

注意到Y的τ条件分位数函数为其中cτ=。令是下列加权分位数损失函数的最小值其中a0=(a0,1,…定理5.1.2假定条件—和成立。另一方面,复合分位数估计量比分位数估计量和最小二乘估计量更有效。这是显然的,因为复合分位数估计量联合不同分位点的信息而最小二乘估计仅使用了均值函数的信息。注5.1.2定理5.1.3表明所得的估计量收敛到α0+。
理论教育 2023-11-20

左截断数据下部分线性模型的估计

令{,1≤i≤N}是来自的一列独立同分布的随机样本,N是潜在的样本容量。由于截断的发生,N是未知的。n是实际观察到的样本容量且n≤N。假定与N样本对应的概率测度和数学期望分别为P和E,与n样本对应的概率测度和数学期望分别为P和E。以下,记带上标*的分布函数代表截断随机变量的分布函数。C的经验估计量定义为Cn=。基于以上结论,F的非参数估计量为
理论教育 2023-11-20

基于Bootstrap的拟合优度检验

在这一节,提出了一个新的检验方法来检验这个假设。然而,Tn的渐近分布很难获得。因此,我们运用Bootstrap方法来逼近检验统计量的分布。具体地,基于Bootstrap检验的步骤如下:步骤1:基于截断样本,计算加权分位数回归估计量WQR0.5或,i=1,…,n的加权复合分位数回归估计量,以及广义似然比统计量Tn。步骤2:产生Bootstrap样本{,Xi,Ui,Ti},其中,i=1,…
理论教育 2023-11-20

加权分位数回归估计量、加权复合分位数回归估计量的模拟研究

在这一节,将通过模拟研究来评价提出的加权分位数回归估计量、加权复合分位数回归估计量以及基于bootstrap的检验方法在有限样本下的表现。故在模拟部分用替代中的Cn。对ε,考虑5种误差分布情形:N(0,1);t;柯西分布;对数正态分布ln N以及混合正态分布0.9N(0,1)+0.1N。在下列模拟中,调整对数正态分布的均值,使其为0。信噪比结果见表5-2。当ε服从Weibull分布时,λ1分别取3.45和1.89,使得数据的截断率大约为10%和30%。
理论教育 2023-11-20

模拟研究结果评价经验似然比检验的性能

在这一节,我们利用模拟研究来评价经验似然比检验统计量在有限样本下的表现。首先,在上面三种情况下,研究检验统计量T01犯第一类错误的概率。约束条件是θ≥2。选择概率函数是p2,n=300,α=0.05,模拟次数为1000次,模拟结果见表2-2。其他的变量和模型中的一样。图2-1、图2-2分别是T01和T12在缺失机制p1和p3下的功效曲线,样本容量分别是n=100和200,α=0.05,模拟次数为500次。图2-3表示当τ远离边界时,检验统计量倾向于拒绝原假设。
理论教育 2023-11-20

不完全数据下半参数回归模型的分位数估计

模型中Y的条件分位数回归模型为假定{Ui,Xi,Yi,i=1,…在左截断情况下,我们用Fn替代中的,得于是,通过使下列加权的分位数损失函数取最小值,我们获得模型在左截断数据下α0τ(·),ατ(·)的加权分位数估计量注意到包含了未知的非参数部分α0τ(·)和ατ(·),这可由局部线性方法估计。具体地,条件和确保B是可逆的且要求密度函数光滑。定理5.1.1假定条件—成立。
理论教育 2023-11-20

缺失机制对参数回归模型的影响及检验统计量Vn和Ln性能分析

选择的三种缺失机制如下和上述三种缺失机制对应的平均缺失率分别近似为0.10,0.27和0.40。从表3-1—表3-3,有如下发现:在以下模拟中,本章提出的检验统计量Vn和Ln几乎比naive检验统计量的表现好,因为提出的检验方法更接近预先指定的显著性水平0.05。对模型,Vn和Ln有类似的结果。在模型中,取a=0∶0.3∶3。给定水平a=0.05,n=100,模拟次数1000次,先计算检验统计量经验的检验水平和检验功效。进一步,检验统计量的功效对不同的窗宽不敏感。
理论教育 2023-11-20

变量选择过程及参数回归模型

在这一节,对模型,借助SCAD惩罚方法,本节提出一个变量选择过程。为了选择扭转参数λ,借助下列的BIC标准其中dfλ表示的非零元素的个数。另外,用同样的方式定义X1,X1表示X的前s个元素构成的向量。定理4.1.4假设4.4节中条件—成立,若λ→0,→∞,nh4→0,nh2/log(1/h)→∞,则(稀疏性):依概率趋于1有,=0;:,其中Σ1=,Σ0=,=X1-δ。
理论教育 2023-11-20

不完全数据下半参数回归模型的统计推论

在左截断情形下,用中的Fn替换中的,得于是,通过使下列加权的分位数损失函数取最小值可得中βτ在左截断数据下的分位数估计量。注意到包含未知的非参数部分gτ(·),它可由局部线性方法估计。于是可表示为接下来借助Kai等人中的三阶段估计方法。定理4.1.2给出了的一个相合估计量。注4.1.2定理4.1.3表明和一样,有相同的条件渐近偏差,但比的条件渐近方差小。
理论教育 2023-11-20

主要结果的证明-不完全数据下半参数回归模型的统计推

引理4.4.1由Mack和Silverman的结果可得。记,由Cramér-Wald定理和中心极限定理,有定义,有因此由Slutsky定理,在给定X,W的条件下,有注意到类似于的证明,有Q1n,1-=op。结合和,定理4.1.2得证。定理4.1.3的证明的渐近正态性的证明与定理4.1.1的证明思路类似,这里省略。定理4.1.4的证明记,ri=-gτ,则是下列惩罚函数的最小值使取最小值等于使下式取最小值上面的第二项可表达为因此,可得。为了证明稀疏性,我们仅需要证明=0依概率趋于1。
理论教育 2023-11-20

不完全数据下的参数回归模型实现

假定截断变量T与独立。由于截断的发生,N是未知的,实际观察的样本量n是随机的且n≤N。令P是与N样本相关的概率测度,而P是与n样本相关的概率测度。E和E分别是对应于P和P的期望。在这一节,记带上标*的分布函数表示与截断随机变量相关的分布函数。利用Lynden-Bell的结论,F和G的非参数极大似然估计量是下列的乘积限估计量基于上述结论,F的非参数估计量为:
理论教育 2023-11-20

不完全数据下半参数回归模型的统计推

左截断数据就是一类特殊的寿命数据类型。此外,他们还对条件分位数进行了检验,获得了检验统计量的渐近功效。分位数回归的统计推断已激发了许多学者的研究兴趣。然而,以上提到的这些文章都是在完全数据的框架下得到的。左截断数据分析已经引起许多研究学者和专家的注意。在左截断右删失数据中,当截断变量服从均匀分布时,左截断右删失数据变成长度偏差右删失数据。
理论教育 2023-11-20

不完全数据下半参数回归模型的统计推断

H3:θ=θ1或θ=θ2 vs H4-H3:θ1<θ<θ2是用来检验真实的反应变量均值是否在参数空间的边界上,而H4:θ1≤θ≤θ2 vs H2-H4:θ<θ1或θ>θ2是双边假设检验问题。对任意固定的真实均值θ*∈Ω4,有定理2.2.5表明θ1和θ2是假设H4中的临界点。对检验统计量T34和T24,类似于推论2.2.1,可得如下的渐近功效。推论2.2.2假设条件—成立。
理论教育 2023-11-20

反应变量均值的单边假设检验及半参数回归模型的统计推

实际上,由定理2.2.2的证明,可得这表明带辅助信息的检验统计量比没有辅助信息的检验统计量更有效。因此,定理2.2.1和定理2.2.2把Chen和Shi中的定理2.1和定理2.2从完全数据推广到带辅助信息且反应变量数据缺失的情况。对任意固定的真实均值θ*∈Ω1,我们有注2.2.2定理2.2.3表明θ0是H1的临界点。类似定理2.2.2的证明,我们可获得检验统计量T12的局部功效如下。推论2.2.1假设条件—成立。
理论教育 2023-11-20
-已经加载完成-