数据挖掘技术与应用

深度探析睡眠分期的背景与应用场景

从图中我们可以看到,无控制的情况下,测量点的波高响应的瞬态振幅和残余振幅分别是40.3 mm 和38.7 mm。经过复合光滑器后,液体晃动的瞬态振幅和残余振幅大小分别为7.4 mm 和0.2 mm。对于残余振幅,复合光滑器能抑制较宽频率范围内的晃动模态的振动。为了验证复合光滑器的有效性和鲁棒性,下面将进行两组实验,分别在不同驱动距离和不同液深下,测量液体晃动的波高瞬态振幅和残余振幅的变化情况。
理论教育 2023-06-21

数据描述与测量标度:处理真实数据中的问题

真实数据是不完美的,噪声、离群点、默认值、数据偏差、标签错误、数据量不足等问题广泛存在。通常,数据集可看作是数据对象的集合。定义2.1属性是对象的性质或特性,它因对象而异或随时间变化。定义2.2测量标度是将数值或符号值与对象属性相关联的规则(函数)。一个对象属性的“具有物理意义的值”可以被映射到数值或符号值,例如,可以用“220 V”这一数值描述实际的电压大小。
理论教育 2023-06-21

常用睡眠分期数据库整理

间隔约1 h;记录slp02a和slp02b是另一受试者多导睡眠图的片段,间隔为10 min;其余14项记录均来自不同受试者。表1-2编码方案2.Sleep-EDF数据库Sleep-EDF数据库包含197个整夜多导睡眠记录,包括EEG、EOG、EMG和事件标记。受试者36和52的第一个晚上以及受试者13的第二个晚上的数据由于卡带或激光磁盘的故障而丢失。
理论教育 2023-06-21

集成学习:结合不同的个体学习器以提高泛化能力

图4-6显示出集成学习的一般结构:首先产生一组“个体学习器”;然后用某种策略将它们结合起来。同质集成中的个体学习器亦称“基学习器”,相应的学习算法称为“基学习算法”。图4-6集成学习示意图集成学习通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。事实上,如何产生并结合“好而不同”的个体学习器,恰是集成学习研究的核心。
理论教育 2023-06-21

睡眠分期中的数据挖掘技术

目前,世界卫生组织已经将睡眠质量作为评价人类健康的标准之一。根据世界卫生组织调查,全世界约1/3的人有睡眠问题,睡眠质量的好坏直接影响着人类的身体及心理健康。睡眠分期是研究睡眠质量、诊断睡眠疾病的基础,对相关睡眠疾病的预防、诊断和治疗有着重要的临床意义。
理论教育 2023-06-21

数据质量问题及其影响分析

由于缺少具有针对性的调查设计或检验实验,数据质量的问题难以避免。下面介绍数据测量和收集过程中的数据质量问题。其意味着在某种程度上,数据与真实情况不符。数据集本身可能并不提供关于精度、偏倚等质量方面的描述,但在数据挖掘中,若对此忽视,可能会在分析中得到与现实相悖的结论。在排除质量不佳的数据的同时,随着要求的提升,分析者可能发现存在数据量不足的情况,此时需要扩展数据集,或者容忍一部分低质量的数据。
理论教育 2023-06-21
-已经加载完成-