理论教育 散布图法:人体数据的可视化分析工具

散布图法:人体数据的可视化分析工具

时间:2023-06-11 理论教育 版权反馈
【摘要】:如人体的体重与身高、数学成绩与物理成绩之间的关系都可以通过散布图来研究。划分坐标间距时应使x 最小值至x 最大值的距离,大致等于y 最小值至y 最大值的距离,可以避免因散布图图形有异而导致错误的判断。图4-10可能负相关图4-11曲线相关收集数据,用散布图分析人的身高与体重间的关联性。

散布图法:人体数据的可视化分析工具

1.散布图的定义

散布图是表达两个相关变量之间关系的图表(参见图4-4)。把每一对(x,y)看成是直角坐标系中的一个点,在图中标出n 个点,所得到的图形称为散布图 (又称散点图、相关图)。在散布图中,成对的数据形成点子云,通过对其观察分析,研究点子云的分布状态便可推断出成对数据之间的相关程度,它是一种解决现实中具有相关性问题的方法。如人体的体重与身高、数学成绩与物理成绩之间的关系都可以通过散布图来研究。

当不知道两个因素之间的关系或两个因素之间关系在认识上比较模糊而需要对这两个因素之间的关系进行调查和确认时,可以通过散布图来确认二者之间的关系。这实际上是一种实验的方法。例如小孩的年龄和体重有一定的关系,只能一般地说年龄越大,体重越大。但我们可以通过绘散布表、进行统计分析,得出一个小孩年龄与体重之间的大致关系为:小孩体重=2 ×年龄+7 (千克)。

如果两个数据之间的相关度很大,那么可以通过对一个变量的控制来间接控制另外一个变量,如圆周长L =2πR,通过控制R 的变化可控制L 的变化。

2.散布图的绘制

(1)确定研究对象,提出可能相关的事物。研究对象的选定,可以是原因与结果之间的关系,也可以是结果与结果之间的关系,或原因与原因之间的关系。

(2)收集数据。一般需要收集成对的数据30 组以上。

(3)画出横坐标x 与纵坐标y,添上特性值标度。一般横坐标表示原因,纵坐标表示结果。划分坐标间距时应使x 最小值至x 最大值的距离,大致等于y 最小值至y 最大值的距离,可以避免因散布图图形有异而导致错误的判断。

(4)根据数据画出坐标点。按x 与y 的数据分别在横、纵坐标上取对应值。二点数据在同一点时,点上二重圈记号,三点数据在同一点时,点上三重圈记号,其他同理可得。

(5)记入必要的事项。

案例 科目关联问题

有些同学认为:英语语文一样以背诵为主,语文成绩好的同学,他的英语成绩也应该不错。现以某班学生语文成绩和英语成绩为采集数据(见表4-6),用散布图来分析语文与英语学习之间的关联情况。

表4-6 语文与英语学习成绩数据表

(1)绘制散布图:

图4-4 语文与英语相关联示意图

(2)分析判断:由图表分析可知,语文与英语成绩的排列为散乱型,两者间无直接关联,故英语的学习成绩与语文学习成绩间无关系。

3.散布图的类型(www.daowen.com)

(1)正相关(见图4-5)。当x 增大时,y 也随之增大,称为正相关,此时,只要控制住x,y 也随之被控制住了。

图4-5 正相关

案例 某材料的硬度与脆性相关图(见图4-6)

图4-6 硬度与脆性相关图

图4-7 可能正相关

(2)可能正相关(见图4-7)。当x 增大时,y 也随之增大,但增大的幅度不明显,称为可能正相关,此时虽然点分布在一条直线附近,但y 的变化除了因素x 外可能还有其他因素影响。

(3)无相关(见图4-8)。当x 与y 之间看不出有任何相关关系的,称为无相关,说明两因素互不相关。

(4)负相关(见图4-9)。当x 增大时,y 反而减少,称为负相关。此时,可以通过控制x 而控制y 的变化。

图4-8 无相关

图4-9 负相关

(5)可能负相关(见图4-10)。当x 增大时,y 反而减少,但幅度不明显,称为可能负相关。

(6)曲线相关(见图4-11)。x、y 之间可用曲线方程进行拟合,根据两变量之间的曲线关系,可以利用调整x 实现对y 的控制。

图4-10 可能负相关

图4-11 曲线相关

【自检】

收集数据,用散布图分析人的身高与体重间的关联性

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈