14.2.4.1 数据预处理
在空间可视化工作流程中,“Extract ZIP Code”算法[9]常用于数据预处理。该算法以美国地址信息作为输入数据,然后从地址中提取邮编,邮编以标准5位数字的短格式(xxxxx)或者标准9位数字的长格式(xxxxx-xxxx)表示。“Extract ZIP Code”算法的这一特点有助于快速的空间分析并简化地理编码。然而,该算法仅限于美国以及基于美国邮编的系统。地理空间及其他工作流程数据预处理的另一个步骤是数据聚合。在地理空间分析中,冗余地理标识符很常见,因此需要在做可视化工作之前进行数据聚合。Sci2工具使用“Aggregate Data”算法[10]做基本的聚合运算,该算法把用户指定列的数据进行合并。记录中的其他值按用户要求做聚合运算。目前,该算法可对数值数据做求和、差异、均值、最大值以及最小值运算。已知文本分隔符后,所有的文本数据可被聚合。
14.2.4.2 数据分析
Sci2提供多种地理编码选择。其中,最基本的方法是“Generic Geocoder”[11]。它能把美国的地址、州以及邮编转换成经度值和纬度值。该算法的输入文件是一个表格,该表格中的每条数据拥有地理标识符,输出是在输入表格的基础上附加上每条记录的经度和纬度。“Generic Geocoder”对编码的记录条数不作限制。
“Bing Geocoder”[12]在“Generic Geocoder”的基础上增加了功能,允许Sci2把国际地址转换成经度值和纬度值。所有的地理坐标均通过Bing地理编码服务查询,Bing地理编码法必须在联网的前提下进行。用户在使用Bing地理编码法之前需要从Bing地图获取API钥匙,且在24小时内最多可编码50000条记录。最后,Sci2的“Congressional District Geocoder”[13]能将9位邮编(5位邮编可包含多个地区)转换成国会地区及地理坐标。此算法可通过外部插件实现,并可从Sci2维基百科里下载[14]。本算法所使用的数据库是基于第113次美国国会通过的2012年版邮编数据库,后来重新划分的地区不在此之列。(www.daowen.com)
14.2.4.3 数据可视化
Sci2工具提供3种地理空间可视化算法:Proportional Symbol Map,Choropleth Map或Region-shaded Map及Network Geomap Overlay。“Proportional Symbol Map”算法[15]需要坐标列表和最多3个数值型属性作为输入文件,并将这些数据在世界地图或美国地图上进行可视化展示。符号大小与颜色与数值成比例。“Choropleth Map”算法[16]允许用户按照某个数值型属性给各国家和美国各州着色。最后,Sci2允许将其他网络叠加在地理空间图上。“Geospacial Network Layout With Base Map”算法[17]以包含每个节点的经度和纬度值的网络文件作为输入文件。该算法可生成网络文件及PostScript基准地图。网络文件可使用GUESS和Gephi软件进行可视化,并以PDF文件输出,叠加到包含基准地图的PDF上。图14.4列举了Propotional Symbol Map(左图)、Choropleth Map(中图)、Geospacial Network Layout With Base Map(右图).
图14.4 Propotional Symbol Map(左)、Choropleth Map(中)、Geospacial Network Layout Overlaid on World Map(右)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。