【历史论文】中国历史地理数据在图书馆数字人文项目中的开放应用的现状调研
论文作者:同为论文网 论文来源:caogentz.com 发布时间:2017年03月23日

1.1现代历史地理学在人文社会学中的研究和应用现状

现代历史地理学是融合了历史学、地理学和现代信息技术的交叉学科,并随着(GIS技术的快速发展催生了新的研究前沿。王晓光认为:目前国际数字人文研究的前沿和典型应用包括“历史学方面的基于(GIS的历史地理可视化”。实际上,基于(GIS的历史地理可视化在数字人文中的应用远不止历史学。自2009年至2016年,汇聚了海内外地理学、历史学、语言学、人类学、社会学、信息技术等领域专家学者的“空间综合人文学与社会科学论坛”连续举办,反映了“空间综合人文学与社会科学(SpatiallyIntegrated Humanities and Social Science)”逐步成为人文学、社会科学研究的热点和前沿。

GIS技术为现代历史地理学注人了新的活力,表现为一系列大型历史地理信息系统的建设。2001年,复旦大学历史地理研究中心启动了中国历史地理信息系统项目,建立了中国历史地理信息系统(CHGIS),台湾地区“中研院”发布了“中华文明之时空基础架构(CCTS)"和“台湾历史文化地图(THCTS)”两个平台成为备受瞩目的中国现代历史地理学与人文学结合的成果。它们的共同特点是在整合数字化地图影像资料的基础上,同时进行历史地理数据的标注、提取和结构化组织,形成集原始地图影像资料和历史地理数据于一体的信息化支撑平台,为特定主题的人文研究项目和学者提供数字化地图影像资料、结构化的历史地理数据、GIS工具软件支持。这两个系统的建设代表了中国历史地理信息系统从地图影像资料库到数据支撑平台的发展趋势。

上述支撑平台除了具有浏览、查询和下载功能外,主要是面向历史地理学的专业人员、有一定计算机技术素养的人文社会科学研究人员和为应用系统的开发人员提供专业的历史地理数据下载和应用程序接口。如学者徐永明利用CHGIS和“中国历代人物传记资料库”( CBDB )的历史地理数据、人物社会关系数据和(GIS工具软件,可视化地呈现汤显祖的社会关系在地理空间的分布情况,使大量分布在文献资料中的数据得到了直观、有序的呈现,这是有技术素养的人文研究人员利用CHGIS等历史地理信息化支撑平台的一个典型案例。又如“中国历代人物传记资料库(CBDB)”利用CHGIS的历史地理数据,在人物传记资料的组织和展示上融人“空间分析法”,将历史上人物的出生、生活、任职、游历、田产、死亡、安葬等活动置于多维时空架构之中,为研究者发现问题、解决问题提供了全新的方法和手段,这是一个为其他专题资料库提供历史地理数据支撑的成功案例。同样,台湾地区“中研院”在COTS的支撑下,开发了大量专门领域的应用系统,为特定专题研究提供数据和平台支撑,如黄河泛滥分析、明清江南市镇研究、傅斯年图书馆人名权威资料库(人名规范档)、苏轼文学地图等,是现代历史地理学应用于人文学、社会科学的典型范例。

1.2中国历史地理信息系统建设及应用现状

历史地理信息系统的建设无论在国际还是国内,已上升到了国家的高度。如国际上美国地质调查局下属地名委员会的地名数据库、加拿大地名数据库、澳大利亚国家地名委员会的澳洲地名库,新西兰国家地理理事会的地名数据库等。国内如我国民政部敦促各省市建立了本地地名数据库;国家测绘局也相继建成了各种比例尺的全国地名数据库;中国社会科学院于2009年9月发布了“中国社会科学综合地理信息服务平台系统”,借助(GIS技术展示河流的变迁、历次人口的迁徙、经济地带的发达及没落、各民族融合和分离的过程;一些高校的专业院系和研究机构也在历史地理数据库的建设上取得了成就,上文提到的CHGIS和CCTS,TH-CTS是其中的主要代表,南京师范大学的“华夏民族家谱地理信息系统”—简称“华夏家谱GIS",则是为家谱文献在统一时空模型下的组织和呈现而开发,与图书馆利用历史地理信息系统的考虑有着相似之处。

随着互联网时代的到来,历史地理信息系统也遇到了瓶颈与困难,学者陈刚对此做了总结,其中重要的一条是历史地理学界对新技术的理解、掌握和运用缺乏足够的认识。在国内,历史地理信息系统建设起步于2000年前后,在不到二十年的时间内,信息技术的发展日新月异,数据成为第一生产力和第四研究范式,互联网思维席卷全球,系统中的数据能否在互联网上方便获取和易于利用,变得尤为重要。互联网意味着协同、共享和开放,而越是专业的就越有开放共享的价值。现有的历史地理信息系统能否满足万维网环境下的开放应用需求?针对这一问题,笔者对基于关系数据库构建的CHGIS和COTS、整合了CHGIS历史地理数据的CBDB、用于特定文献资源组织和呈现的“华夏家谱(GIS",以及基于关联数据技术发布的Getty地理名词表、GeoName、数据集进行调研,主要从数据建模、数据库的利用方式、历史地理数据在互联网环境下的开放应用等几个方面来考察。

在数据建模方面,南京师范大学在构建“华夏家谱(GIS”的过程中,陈是研究了家谱(GIS的时空支撑架构,将地名作为实体对象来研究,深人细致地分析了古今地名实体的空间特征、空间归属关系、行政隶属关系等;胡颖在其硕士毕业论文中将具有空间特征的地理实体从地名中剥离开来,详细深人地分析了地理实体和地名的时间特征和空间特征,以及各自在生命周期中的变化情况[iz7;温永宁等提出家谱(GIS需要构建一个为所有家谱中记录的时间和空间信息提供支持的时空描述框架,使得家谱中的所有事件和人的活动能够在统一的空间和时间模型下展开,该模型强调的是家谱文献中时间与空间的统一表达。CHGIS数据模型的基本功能是描述各政区之间的隶属关系和政区界线,并表达出名称的变化以及行政区域合并、分置、新建、撤销等形成的界线变化,允许用户按他们需要的时间和地区重新组合数据库中的数据。此外,数据也需要反映一个行政单位地理形态的前后变化过程和其本身变化对其他部分的影响,能按时间检索行政区域的变化是CHGIS空间一时间模型设计的基本概念。CBDB沿用了CHGIS的做法,依靠两类空间实体:“地址”和“地点”(经纬度)。“地址”这一实体作为有地名的历史“场合”—即空间中有特定名称的行政辖区,可作为其他行政辖区的一部分,其位置由x,y坐标(即经纬度)的交汇点来确定,如果边界或者名称中任何一个改变,就要建立一个新的地址。但由于历史地理数据的时空关系错综复杂,CHGIS和COTS虽然对地名的各种时空属性和历史变迁进行了丰富的描述,但对同一地理空间的、在不同历史时期的、各种不同地名之间的关系没有建立清晰的数据模型,缺乏地名的规范控制。Getty地理名词表和GeoName、注重的是地名的行政归属关系和地理空间属性的描述,但缺少与地名相对应的时间序列数据,因而缺乏不同时代各种地名间相关关系的建模和形式化表达。

在历史地理数据的利用方式方面,华夏家谱(GIS在网站上提供古今地名和历史纪年数据查询,在功能上主要是为用户提供参考,历史地理数据建设的目的是为本系统中家谱文献的查询和展示服务。CHGIS的数据在网站上可下载,但其数据格式为专业的,nap格式,或关系数据库,udb格式,结构复杂,需掌握一定的专业知识和计算机技术才可对数据进行挖掘和操控,而这点给大部分人文学者造成了一定的障碍。CHGIS,CCTS作为专业的历史地理信息化支撑平台,与人文学者和普通大众之间还存在着一定的距离。首都师范大学的周丙锋、周文业基于CHGIS开发的中国历史地理数字化应用平台,就试图拉近这一距离,该应用平台提供易于操作的用户界面、自动生成专题历史地图等功能,可根据用户需求建立专题历史地理信息系统,将分析软件提供的功能嵌人平台之中,一定程度上降低了人文学者利用(GIS技术的门槛。

在互联网环境下历史地理数据的开放应用方面,COTS和CBDB的做法值得推荐,虽然在数据建模方面,C HGIS , COTS等现有历史地理信息系统采用的是以关系数据库为主的技术,这意味着其底层数据存储在封闭的关系数据库中,但提供大量应用程序接口(API)供开发人员调用。这些应用程序接口是建立在互联网的HTTP协议上的RestfulAPI,在数据调用层面符合互联网环境下数据开放应用的需要。而(Getty研究中心的地理名词表(Getty Thesaurus of Geo-graphic; Names)和(}eoName、则是遵循关联数据技术标准来进行数据编码和在Web上发布的,每一个地理名词都被赋予一个HTTP URI,实现了地名在全网域范围内的唯一标识和定位,关于一个地名的更多信息如所属行政区域、经纬度等以W3C的推荐标准—RDF(资源描述框架)格式编码,具有跨平台跨系统的特性,便于机器读取和处理,这种基于关联数据的技术框架为地名在互联网环境下的规范控制奠定了基础。HTTP URI使得地名数据在标识和访问时即与互联网紧密融合,而RDF在数据格式上具备了通用性和开放性,能很好地满足互联网环境下的数据开放共享需求。由于关联数据技术的采用,GeoName、加人了“关联开放数据项目( Linked Open Data Project) ",已成为在Web上应用最为广泛的数据集之一。


相关推荐
联系我们

代写咨询
 362716231

发表咨询
 958663267


咨询电话

18030199209

查稿电话

18060958908


扫码加微信

1495607219137675.png


支付宝交易

ali.jpg