在人类世界和赛博空间、思维空间等环境下,交互如同交流一般,可以通过各种承载信息的载体、媒介或界面,来处理信息的交流、能量的交换和物质流动的过程。尤其在大数据时代,交互式分析有着更加复杂的要求和实现。
(一)交互式分析特点
与非交互式数据处理相比,交互式数据处理更显得灵活、直观和便于控制。系统与操作人员间以人机对话的方式一问一答,即操作人员提出请求,将数据以对话的方式输入,系统便提供相应的数据或提示信息,引导操作人员逐步完成所需的操作,直至获得最后的处理结果。交互式分析的目标或者说要求可以归结为以下几个方面。
第一,帮助数据分析人员以一种快捷和循环的方式来对假设或问题进行探索,使数据探索过程可以按照人类思考的速率来完成。
第二,既要满足专业人员更高效的数据分析要求,也要使缺少编程经验的人更好地完成数据分析任务,因为很多领域的专业人员并不一定熟悉计算机的相关技术。
第三,要注意交互式分析的延迟时间和接口的复杂程度,因为显著的延迟或过于复杂的接口不仅会阻碍分析的过程,也会严重影响分析的广度和深度。Google工程师们经过长时间研究发现,即使只增加200 ms的计算延迟也会导致用户搜索次数的明显下降。
第四,在现阶段大数据环境下,由于数据的海量性和多样性,传统的交互式分析方法和工具无法满足人机交互的直观性,因此如何完成可视化的交互成了新的研究热点。一张图片的信息量往往胜过千言万语,而且其直观性和显著性都十分明显。图5-19展示了ScholarExplorer中对一位学者的相关研究信息展示,包括了合作学者、合作单位或机构、相关期刊、发文量变换、研究领域、研究兴趣变化及师生关系等,而且可以根据个人的需求进行更小范围或领域的查询交互。由此可以看到可视化技术很自然地被用来完成交互式分析,尤其是大数据的交互式分析更需要可视化技术。
(www.daowen.com)
图5-19 Scholar Explorer中的学者信息展示
(二)大数据交互式分析技术
大数据交互式分析的本质是从数据中获取信息并形成知识的认知过程,既然是认知过程就需要对其进行模型化:一种观点从信息论出发,认为认知主体会根据需求来构建有意义的信息,在数据内在意义与需求这个外部环境间不断交互来产生认知描述;另一种观点从认知理论出发,认为认知主体会将外部的信息刺激融入本身已具有的知识体系内,或者丰富自身体系,或者根据已有的知识利用新的信息构建新的知识。但无论哪种理论,其技术基础都依赖信息的查询和检索,因此交互式系统的设计一般是从数据的存储开始。存储决定了查询的设计和效率,常用的存储方式包括行存储、列存储和混合存储,由此可以设计相应的查询语言和查询模型,交互式分析中查询语言要简单易行,因为有很多非专业人员也需要使用查询语言,查询模型可以有树形或者图形等,根据数据实际的特点来决定,最主要的影响因素应该是响应时间或查询延迟,这直接影响用户的交互体验。最后是查询结果的展示,此时不仅需要把当前结果有效地展示给用户,还要能够与用户完成交互,通过结果信息来刺激用户的认知过程。为了实现上述任务,交互界面首先应该能为用户提供检索和查询功能,其次还要能够提供对前步结果的反馈方式来为下一步的分析提供必要的指导,最后要以贴合人类认知接受的速率来设计接口的复杂程度。
以往常见的交互接口往往是查询语言的编辑界面,这样对于非专业人员来说还是有一定的障碍,因此信息的可视化与人机交互的结合成了交互式分析新的研究方向。信息可视化技术利用计算机作为手段来增强人们对信息的认知能力,人机交互则提供界面来完成信息的交换与认知分析,如图5-20所示,可视化交互技术就是一个“数据→知识→数据”的循环过程,它依赖于可视化技术和自动化分析技术两个部分,二者的互动与协作可以完成从数据中获取知识的功能。在此特别指出的是,分析结果的展示部分很重要,它决定了能否更有效地呈现出其内在的知识并启发认知主体的进一步指示来完成下一步的分析任务。如图5-21所示,图5-21(a)中的美国城市分布是以点的方式来描述的,图5-21(b)中的美国城市分布是以密度的方式来描述的,其中包含的认知导向是完全不同的,而且知识的精确性也不同。由此可见,结果展示出的知识是由任务环境来决定的,同时也受认知主体的影响,应该对它有效地控制。
图5-20 可视化交互分析的运行机制
图5-21 美国城市分布的不同展示效果
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。