理论教育 描述性统计:优化方法与应用

描述性统计:优化方法与应用

时间:2023-07-06 理论教育 版权反馈
【摘要】:4.3.3.1数据来源与样本期选择按照前文所述样本选择原则,确定本部分实证研究的数据来源与样本区间,共获得有效样本557 416个。4.3.3.2描述性统计关键变量描述性统计如表4-8所示。表4-8关键变量描述性统计表4-9列示了主要变量的相关系数关系。回归结果中主要变量的VIF均小于10,模型不存在严重的多重共线性问题。

描述性统计:优化方法与应用

4.3.3.1 数据来源与样本期选择

按照前文所述样本选择原则,确定本部分实证研究的数据来源(Wind数据库与CSMAR数据库)与样本区间(2010—2016年),共获得有效样本557 416个。为了消除异常值对实证研究结果的影响,对主要连续变量进行了1%的Winsorize缩尾处理。多点接触程度的计算采用SAS 9.4进行处理,其余数据处理与计量检验借助Stata 13.1完成。

4.3.3.2 描述性统计

关键变量描述性统计如表4-8所示。从分析师的分布来看,样本中的分析师大部分在出具研究报告时并未上榜“新财富”,上一年度也并非为明星分析师,也没有获评明星分析师的历史,说明明星分析师评选具有一定的淘汰率。从平均信息领导地位来看,样本中分析师的信息领导地位分布集中于较低的水平,说明中国证券分析师发布研究报告频率较为集中,且中国证券分析师存在大量跟进股票的交叉重叠行为。此外,中国证券公司每年活跃的分析师人数中位数为26人左右,意味着每个分析师需要跟进多只股票,而在中国分析师平均需要跟进29只股票,显示了中国证券分析师需要较多的精力投入且需要面临巨大的竞争压力。

表4-8 关键变量描述性统计(www.daowen.com)

表4-9列示了主要变量的相关系数关系。从各变量的相关系数来看,上期盈余预测准确度(MAPEt-1)、信息领导地位(LFR)、竞争激烈程度(MPC)、相对竞争优势地位(PORT、log STKEXP)、分析师上一年度是否为明星分析师(STARt-1)间的相关系数均低于0.8,不存在明显的多重共线性问题,且上述变量与分析师当年是否当选明星分析师间显著相关,说明分析师当期声誉地位可能受到上述因素的显著影响。回归结果中主要变量的VIF均小于10,模型不存在严重的多重共线性问题。

表4-9 主要变量相关系数

注:对角线上(下)方为Pearson(Spearman)相关系数。***、**和*分别表示在1%、5%和10%的水平上显著。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈