数据库论文【最新5篇】

企业管理软件应用最广泛的就是数据库应用,数据库简单地说,就是数据存放的地方。数据信息管理就是通过数据库管理数据,实现其基本功能。下面是小编辛苦为大家带来的数据库论文【最新5篇】,希望大家可以喜欢并分享出去。

数据库论文范文 篇1

农村集体土地确权数据库入库前的准备工作直接关系到外业调绘数据能否被有效、完整地录入。准备工作主要是对地籍编号、空间数据、非空间数据及扫描文档的编辑。建库的数据主要分空间数据、非空间数据和扫描文档三类,空间数据包括矢量数据和栅格数据。

1.1地籍编号

宗地代码的编码是按照最新的规则,采用五层19位层次码结构,分别是:第一层次为县级行政区划,代码为6位。第二层次为地籍区,代码为3位,用阿拉伯数字表示。第三层次为地籍子区,代码为3位,用阿拉伯数字表示。第四层次为土地权属类型,代码为2位,其中,第一位表示土地所有权类型,用G、J、Z表示;第二位表示宗地特征码,用A、B、S、X、C、W、Y表示。第五层次为宗地顺序号,代码为5位,用00001~99999表示,在相应的宗地特征码后编码[2]。由于完整的地籍号有19位数字,若对每类需要入库的要素逐一设定完整的地籍号,初期工作会很繁琐,不利于提高工作效率。在实际工作中为了提高效率,先将前14位编号一样的地区的宗地用五位及以下宗地号命名,外业调查成果均使用此方法命名地籍号。而在后期整理入库过程中必须将此类简易宗地号规范化,为此需要根据各类数据类型采用编写程序重命名、Excel批量处理等方式规范地籍号,为数据入库打好基础。

1.2空间数据

此部分主要是对CASS中的图形作进一步处理,以达到入库的需要,包括对dwg格式的数据进行检查整理,并对其格式进行转换。CASS数据编辑是数据建库的第一步。本文所讨论的基础数据是通过CASS软件处理后的dwg格式数据,进行数据转换前需要对dwg数据进行整理,内容如下:(1)房屋被界址线切割的修改。对于分户未分房,造成权属线把房屋切割开来,这样在入库时就会出现该房屋的户主不唯一的情况,为此要把此类房屋分割开来(房屋绘制顺序要为顺时针)。(2)清除废块,减少数据量。用“文件”——“清理图层”或“PURGE”命令对图层进行清理,不仅可以清除多余图块,加快处理速度,而且能通过编码正确性检查。(3)删除重复要素。用“检查入库”——“删除重复实体”来解决,保证同一个位置上只有一个实体[3]。(4)图形实体检查。利用“检查入库”——“图形实体检查”的方法进行检查,包括编码正确性检查、图层正确性检查、线自交检查、建筑物注记检查、复合线重复点检查(此处检查要确保JZD层是关闭的)。(5)检查未闭合的房屋线和权属线[3]。CASS中未闭合的多边形将无法导出成面,因此对于未闭合的房屋线和权属线要将其闭合。(6)过滤无属性实体。在CASS中很容易把实体的属性漏掉,这样会给后续的工作带来很多麻烦,因此要通过“检查入库”——“过滤无属性实体”的方法进行检查,然后再根据实际情况把无属性的实体赋以属性。本文主要针对CASS成图数据进行阐述,将其导入MapGIS6.7之前需进行对照表和文件转换[1]。(1)对照表。对系统库目录\slib下4个对照表文件进行编辑,可直接用Windows写字板或记事本方式打开。需要注意的是,对照表中CASS编码是在“数字测图”系统中查到的,并且要区分对照表的大小写[1]。符号对照表——“arc—map.pnt”。线型对照表——“arc—map.lin”。颜色对照表——“cad—map.clr”。层对照表——“cad—map.tab”。(2)文件转换。CASS成图数据即dwg格式的数据无法在MapGIS中打开,需要将dwg格式转换为AutoCAD的数据交换格式DXF[4],最好是2000或者R12的DXF格式。把各个图层通过“文件——图形改名存盘”命令保存成AutoCAD2000/LT2000DXF格式,选择“文件转换”模块,“输入——装入DXF”,将AutoCAD文件装入[5],并将所有DXF转换为点线文件,最后存点存线即可。在MapGIS6.7平台中,点击“图形处理”——“输入编辑”,添加文件即可对其进行属性编辑。

1.3非空间数据

非空间数据包括空间对象的补充属性数据,是以mdb表的形式存在的。对于其他的各种证件照片、大门照片、调查表、审批表等都是要按照标准形式命名的,命名格式为a1#a2$1.jpg,其中a1为土地证号,a2为地籍号,中间要用#和$隔开。2.4扫描文档这一部分主要是各种扫描的文件,如村民小组村民代表会决议、集体土地使用权确权登记颁证申请书、农村土地权属调查法人身份证明书、农村土地权属调查指界人身份证明书等,命名格式同上。

2建库基本流程

为规范农村集体土地确权数据库的内容、数据库结构、数据交换格式,该部分应严格按照要求,统一在MapGIS四川农村集体土地确权登记发证系统下完成。

2.1新建数据库

主库MPDBASTER主要是建立SQL2005与GDB之间的连接,打开MAPGISK9平台,通过“工具箱——GDB安装器”创建。当打开SQLSERVER,点击数据看到里面有个MPDBASTER,说明SQL和GDB连接成功。主库建好后,现在还需添加数据库,根据需要可以添加多个库。同样用创建主库的方法来创建数据库。

2.2配置MapGIS数据源

打开GDB企业管理器,设置连接数据库的数据源即可。

2.3初始化数据库

MapGIS四川农村集体土地确权登记发证系统的配置主要是通过“开始”“程序”“MapGIS四川农村集体土地确权登记发证系统”“管理员配置工具”来实现的。如果测试成功,就会在数据库中创建多张表,以用于上传属性数据、图形数据和扫描材料,否则要重新配置。由于某些原因,系统还是会缺少上传扫描材料的两张表UPFILESLIST和CASEMATERIALLIST,就需要借助语句手动创建。初始化完成以后,把JHTB(接合图表)、CODE(数据字典)、DLTB(地类图斑)、FW(房屋)、FWZJ(房屋注记)、QSDW(权属地物)、QSDWZJ(权属地物注记)、DDXYS(点地形要素)、XDXYS(线地形要素)、ZJD(宅基地)、ZJDZJ(宅基地注记)、JZD(界址点)、GCDZJ(高程点注记)、GCZJD(高程注记点)等文件导入并去后缀即可。

2.4新建工程

打开MapGIS四川农村集体土地确权登记发证系统,如果数据是通过xyz工程管理的点线区数据,工程升级即可;如果是零散的点线区文件,则通过“新建工程”导入。由于在MapGIS6.7中编辑的点线区文件只有少许基本的属性字段,需要对照标准库通过“建库工具箱——数据结构升级”,使其具备该图层应有的属性字段,在系统弹出数据结构升级详细设置对话框,点击升级按钮即可。升级完成后,如果还需添加字段,可通过点击图层右键进行添加。

2.5导入mdb表,挂接属性

在图形的拓扑检查完成的前提下,为了补充图层缺少的属性数据,其最有效快速的方法是把空间对象的补充属性数据mdb表导入到库里。对业务建库的数据库文件mdb字段分析即可得出各项属性数据所对应的字段,再利用Access的导出功能将数据库中各表分别导出,然后提取Excel属性汇总表中对应列的数据填充。全部填充完毕之后再使用Access软件的导入功能将数据导回业务建库数据库,然后再通过SQL语句挂接属性。通过AccessDataConvert文件夹中的工具AccessDataConvert.exe导入mdb表,选择Initialstddb.mdb表,点击“导入数据——下一步——转入业务表”即可。此时出现如图4中所示的消息时,点开消息,查看具体是哪里出现了问题,根据指出的问题所在,逐个修改之后重新导入。如此循环,直至成功导入。需要补充的是在挂接属性时若以宗地号为链接对象,在MapGIS6.7中编辑时必须要有宗地号这一字段。挂接完以后,可通过“农村集体土地确权登记发证系统——查询分析”功能查询宗地属性信息。对于有些属性,可通过集体土地使用权调查数据库建库系统里工具箱下的图层内属性赋值和图层间属性赋值来完成。

2.6上传档案扫描件

为了方便工作人员查询、管理,实现高效的无纸化办公,需将档案扫描入库并与宗地图相挂接,因此档案扫描件的规模化管理也是调查的一项重要工作。扫描文件的类型一般有申请书、户口簿、宗地图、外业公示照片、大门照片、法人身份证明书等,如果还有其他文件,放到其他里。为了提高工作效率,可以先简易命名扫描档案文件并按宗地号存放,再利用后期自动化处理的方法,可以快速地将扫描档案归档并方便后期快速整理。整理好扫描文件后通过ImgUpLoadTool中的ImgUpLoadTool.exe来上传到库里。将档案扫描件按文件类型分门别类存放在不同的文件夹里,并根据行政归属划分多级目录存储。如图5中所示,选择形式6编辑完成以上工作,即可通过如图6中所示打印相关证书。

3建库时应注意的问题

(1)把CASS图转到MapGIS中时的注意事项包括:确保每一户的宗地号、户主等信息都在对应的权属线内;房屋注记要正确,包括房屋结构和房屋层数注记。(2)格式转化完成后,在MapGIS中打开,进行“检查——工作区属性检查”主要查看的内容有:对已造面的如房屋、宗地、土地类型等,查看面积是否有空的,再者就是不合理面域,要将其删除;对于宗地层,要查看宗地号、户主等是否有空的;对于房屋层,要看房屋结构和房屋层数是否正确,是否有遗漏,房屋层数和房屋结构是否要分开等。对以上检查出的有问题的要逐一修改,直至无误。(3)在进行结构升级时,为了把之前已加载的属性保留,要把多余字段追加、维护默认属性以及维护面积周长前打钩。(4)挂接属性要在图形关系正确的前提下完成,挂接完以后若要再改会很麻烦。

4结束语

数据库论文范文 篇2

摘要:文章论述了建立地方文献数据库在西部经济开发中的作用、途径及问题等,说明了数据库的信息源、类型。

中图分类号G255文献标识码:A

文章编号:1671一697(2004) 01一0192--02

二十一世纪是我国进行西部经济大开发的世纪。在这场伟大的世纪大开发中,不仅需要人才、物质、财力方面的支撑,更需要准确、畅通的信息障碍。近年来,我国针对各行业的数据库层出不穷,对数据库建设的各个方面的论述屡见报刊,但对地方文献专题数据库的建立却重视不够,鲜有涉及。然而,地区经济的研究、开发、发展却离不开地方文献的支持,建立具有地方特色文献数据库已是图书馆、情报所等文献信息机构不可忽视的问题,需要共同研究并付诸行动。

一、地方文献在地区经济发展中的作用

地方文献是以一个地区为论述对象且反映该地区特色的文献资源,是了解和研究该地区的政治经济、科教文化、历史地理等方方面面的主要情报源,它对于发挥该地区传统优势、促进该地区经济发展和文化教育事业的繁荣具有重要作用。

l为该地区经济发展规划的制定提供历史借鉴和决策依据。地方文献是对一地的综合反映,其内容包容了该地区在各个时代各方面的情况。地方各级政府和有关经济部门只有以此为基础,全面了解、掌握本地区的自然、历史、经济、文化等方面的状况,并进行认真仔细地分析,结合对当前现实情况的调查研究,才能减少失误,制订出符合本地实情、发挥本地优势的科学的规划与措施,加快地区开发的步伐。

2直接服务于本地经济建设。地方文献记载了丰富的关于本地的地理、矿藏、物产、名胜古迹、民族民俗方面的文献资料,为本地的经济开发提供了重要的信息源。该地区内各不同区域的开拓者、创业者可据此寻找、开发适合本区域的经济增长点,创建区域经济优势,进而推动该地区经济建设。如地方文献中记载的山野特产、种植养殖、矿产挖掘、自然风景、人文景观、民俗风情等等,都是拉动、繁荣本地经济的重要途径。

3为本地文化繁荣服务。文化与经济,历来是矛盾的统一体,它们相伴相生,既互相对立,又相辅相成。西部开发,不仅仅是经济的大开发,同时也是科学文化的大开发。地方文献与地方文化具有天然的密切联系,地方文献的内容反映着地方文化,其本身也是地方文化的一个重要组成部分,具有深厚的文化内涵。因此,建立地方文献数据库,首先有利于保存地方文献资料,有利于保存、弘扬地区民族优秀的传统文化;其次,为进行爱国主义、革命传统教育提供生动的教材,促进地方精神文明建设;第三,为具有地方特色的文化艺术创作提供丰富的素材,为文艺创新服务。

二、地方文献数据库的信息源

由于高新技术的不断发展,文献信息的载体日益丰富,除了注重收集传统的纸质文献以外,应加强对以下载体形式的信息源的采集:

l缩微文献。如缩微胶卷、缩微胶片等。自1986年以来,国家对历史文献抢救、保护而进行的历史文献缩微工作,取得了丰硕的成果,为补充采集地方文献提供了充分的条件。

2视听文献。如电影拷贝、录像带、录音带、电视节目等等。其中,电视将书籍、报刊等文字传媒的记载功能、广播的言说功能及电影的影像直观功能汇于一身,其关于区域性新闻时事、经济发展、文化教育等的节目具有典型的地方特色,是反映本地情况及本地与外界关系的重要信息源。

3电子文献。这是指信息存储在磁带、磁盘和光盘等载体上,须借助于计算机才能浏览阅读的文献信息源。如电子图书、电子报刊、软件读物等等。一张5寸光盘可存放20多卷本百科全书,一张1.2兆软盘存储量相当于一本60万字的书的内容,它们巨大的存储量是纸质图书无法比拟的。

4网络信息源。近些年来,因特网迅猛普及,数字化技术飞速发展,使得网络信息资源异常丰富,网络化文献资源层出不穷,主要有各种网络数据库、数字图书馆,以及各专业网站上的信息源等。

三、地方文献数据库的类型

地方文献数据库的建立,就是利用多媒体技术、数据库技术、数字压缩技术、光盘存储技术、网络技术等手段,将传统图书馆、情报所等单位收藏的上述各种文献信息资源,转化为自成一体的数字化文献的过程。数据库的建设尤其是全文数据库的建设,需要一定的人力、物力、财力的支撑。因此应根据文献所涉及的内容、质量以及用户的需求程度,建成不同类型的数据库。

l全文数据库。全文数据库包括文献的书名(篇名)、作者、正文、图像、参考文献及摘要、关键词等数据,用户可通过多种途径检索到一份文献的全文内容。我们应选择那些学术价值、史料价值、使用价值高的,内容丰富、富有代表性的文献资料,编制成全文数据库。它揭示的内容深,可满足用户多层次检索的需求。

2文摘数据库。随着科学技术的发展,文献的载体不断发生变化。地方文献在以传统的印刷书籍占据主角时,更多的非书资料正逐年增加。这部分非书资料虽然内容繁多,但其本身的检索使用都较方便,故不必要建成全文数据。然而非书资料仅从外表又看不出其具体收藏内容,故需要对原始文献进行深层次的挖掘,加工成文摘或提要式录入,以向用户简要介绍文献的主要收藏内容,建成摘要数据库供用户选择使用。当然摘要式文献部分还应向用户提供原文献出处及其收藏地,以便用户及时找到原文,获取更详细信息。

3题录数据库。地方文献是有关某一个地方的一切资料,除我们常看到的白色文献外,一些单位的半机密资料数据或机密文件等灰色文献或黑色文献亦是地方文献的收藏对象。这部分资料不便于广大用户公开查阅,需要使用的用户可以同有关单位联系,根据具体的使用办法及注意事项查阅,所以只提供题录比较合适。为便于用户查找获取原始资料,题录式数据须注明具体的收藏地或收藏单位。再者,地方文献中除图书、杂志、报纸、手稿等常见资料外,还有图片、画片、表格、票据等资料,这部分文献一般从其名称即可知其内容,没有必要建成全文或摘要。建成全文型也困难,故也可建成题录式数据,并准确注明其收藏地。

四、建设地方文献数据库的途径

l自建。就是根据本地实际情况,以突出本地特色为宗旨,以自主知识产权为主体,集中本地一定的人力、物力、财力,以本地某一图书馆或情报所为龙头,其它各馆、所等机构配合,分工协作,将地区内各单位所收藏的地方文献,以及从各种途径所获得的文献资源数字化,建成数据库

2购买。主要是指购进光盘数据库。对于作为对自建数据库的补充,以及限于自身力量而无法建立的数据库,直接购买是最佳选择,也是很有必要的。近年来,我国光盘数据库发展迅速,为我们建设特色数据库提供了丰富的来源。但我们选择这些数据库时,要从多方面加以考虑,必须对其将产生的社会效益、经济效益有所预见。首先,要选择那些与本地状况最为相似的数据库入藏。既然是各具地方特色的文献,就绝无完全相同的面貌,只能从中选择相似点最多、相似面最广的数据,以最小的付出获取最大的效益。其次,注意所选光盘数据库的检索功能、标引深度、标引质量、标准化程度等方面,以检索点多、标引深且质量高为优先。这样购进的光盘数据库,既有很强的针对性,又节省了有限的经费,可最大程度地充实地方文献数据库。

3网络利用。在因特网迅猛发展的今天,网络信息资源丰富异常,应予以充分的开发利用。这其中既有集中有序且稳定的信息资源,也有分散无序且多变的各种信息。对于前者(诸如各种远程网络数据库),可根据需要购买其全部或某一部分库的网络使用权,这样既无需过多的硬件投资、维护,又不需进行数据库的管理、维护,可避免时间、人力的不必要的浪费;对于后者,收集时注意筛选、甄别,仍以相似相关性、参考价值大小为主要标准。这些下载下来后的信息,必须对之进行综合处理、深度加工和重新组合,使之转化为有序的、方便利用的数据库资源。

五、应注意的问题

作为网络资源的数据库建设,是一项持续性的工作。数据质量的控制体现在生产的每一个过程。从数据的采集、著录、标引、加工、录入等每个程序着手,制定出一系列的规章制度和业务工作细则,并配以科学的工作流程来层层把好质量关,是建立一个高质量数据库所必须面对的问题。因此,这一工作既需要投入大量财力、物力,又需要拥有既懂手工编目又懂机读目录和计算机操作的专门人才和信息开发人员,以便组织一支有较高综合素质的业务骨干队伍,以全面高效率地承担起各种文献的采集、整理、编目、著录、输入等工作。同时,还必须制定出以数据统一化、标准化为前提的质量控制措施,设定专门人员定期进行数据库建设的标引、著录工作的检查,确保数据质量。

参考文献:

[l]谢永顺。论地方文献资源体系建设  高校图书馆工作与研究,2002(3)

[2]李华。高校图书馆数据库建设中的问题与对策。  .成都大学学报,2002(l)

[3]侯集体。关于高校图书馆数据库建设的几点思考  烟台师范学院学报,2000(9)

数据库论文 篇3

关键词:地理信息系统;空间数据仓库;数据仓库;认知过程

0引言

进入21世纪后,对空间数据仓库的研究方兴未艾,在许多次的国际学术会议上都有相关[1~3]。例如在泰国召开的ISPRS第三届动态与多维GIS会议暨CPGIS第十届地理信息年会、北京召开的第20届国际制图协会国际学术会议、南非召开的第21届国际制图协会国际学术会议等。还有一些ESRI公司的白皮书、全球性用户大会、SSD国际会议、数字地球国际会议、GIS国际会议等也开始讨论空间数据仓库问题[4~8]。将空间数据仓库技术引入到我国大概是20世纪90年代末,文献[9~14]的发表开创了我国空间数据仓库理论与技术研究的新局面,此后又陆续出现了一些这方面的论文。

总体说来,上述工作对空间数据仓库的理论和方法进行了初步研究,在概念、原理、结构、操作与算法等方面进行了初步论述,已取得了卓有成效的成绩。但是到目前为止,空间数据仓库的概念框架和认知过程等方面还是缺乏系统的论述,没有形成一套比较完整的空间数据仓库概念框架体系和认知过程体系。

1概念框架

空间数据仓库是GIS技术和数据仓库技术相结合的产物,其定义很多,但中心思想包含三方面内容:①空间数据仓库是在网络环境下,实现对异地、异质、异构不同源数据库中地理空间数据、专题数据及时间数据的统一、整合、集成处理,形成用户获取数据的共享操作模式;②空间数据仓库可根据需求对这些数据再进行测绘专业处理,提供多种空间数据产品,满足用户更高层次——对数据产品的需求;③基于空间数据产品,空间数据仓库可从多维的角度进行空间数据立方体分析和空间数据挖掘分析,提供综合的、多维的、面向分析的空间辅助决策支持信息,满足用户空间决策分析的需求。

空间数据仓库的概念框架分为外部结构、内部结构。外部结构主要描述空间数据仓库与外部系统的关系;内部结构主要描述空间数据仓库的内部功能模块组成。

1.1外部结构

数据库系统处于空间数据仓库系统的最底层,管理着若干种不同的地理空间数据库和专题数据库,它们各自独立,形成了各式各样的异地异质异构的数据库系统,它们主要为空间数据仓库提供数据源。应用系统处于空间数据仓库系统的最上层,它通过一个标准的接口从空间数据仓库中提取地理空间数据、空间数据产品和空间辅助决策分析信息,为应用系统服务。其具体外部结构如图1所示。

1.2内部结构

空间数据仓库的内部组成应由八个独立功能模块构成,分层次实现空间数据仓库系统。其中,第一层次的功能模块是空间数据仓库的基础处理模块,由多源空间数据抽取、多源空间数据整合、多源空间数据统一、空间数据仓库元数据组成;第二层次的功能模块是空间数据仓库的服务模块,由空间数据产品服务、空间数据立方体分析、空间数据挖掘分析组成;第三层次的功能模块是空间数据仓库的对外数据接口模块,由对外数据交换格式组成。第一层次的功能模块为第二层次的功能模块服务,第二层次的功能模块为第三层次的功能模块服务。其具体内部结构图如图2所示。

当应用系统提出需求时:①多源空间数据抽取功能模块从各源数据库系统中抽取出相应地理范围(矩形、多边形、椭圆)的不同种类的地理空间数据、专题数据;②多源空间数据整合功能模块对这些由图幅范围组织的地理空间数据进行相应地理范围的裁剪、拼接、接边、图形编辑、拓扑重组等整合处理,形成裁剪拼接和接边好的、具有完整拓扑关系的、物理上无缝的、按区域范围组织的地理空间数据;③多源空间数据统一功能模块对这些整合处理好的地理空间数据进行数学基础、数据编码、数据格式、数据精度等方面的统一处理,形成能相互叠加的地理空间数据;④将经抽取、整合、统一处理好的地理空间数据提交给空间数据产品服务功能模块,经过集成、融合、派生和关联等测绘专业算法处理,生成应用系统所需的各种空间数据产品;⑤基于已生成的空间数据产品,进行空间数据立方体分析和空间数据挖掘分析,得到面向空间辅助决策分析的结果;⑥将这些空间数据产品和空间辅助决策分析结果,以对外数据交换格式的形式提交给应用系统使用。

2认知过程

2.1认知过程概念图

空间数据仓库是描述地理现象的一个重要分支,其认知过程应与地理空间信息的认知过程基本一致,不同之处在于其描述的内容和范围大小的区别。因此,建立空间数据仓库的认知过程,实际上是要经过一个地理现象认识、抽象、组织、分析和应用的过程。其具体的认知过程概念框图如图3所示。

2.2认知过程描述

这14个世界模型和13个转换算子的组合构成了三个层次世界,即实体世界、目标世界和产品世界。其中,现实世界、地理现实世界、地理工程现实世界和地理工程概念世界这四个世界模型,以及命名、选择、抽象这三个转换算子,共同构成实体世界;地理工程尺度世界、地理要素分类世界、地理要素编码世界、地理要素几何世界和地理要素集合世界这五个世界模型,以及度量、分层、编码、测量和聚集这五个转换算子,共同构成目标世界;地理空间抽取世界、地理空间整合世界、地理空间统一世界、地理空间产品世界、地理空间决策世界这五个世界模型,以及提取、处理、变换、计算、分析这五个转换算子,共同构成产品世界。

数据库概念设计阶段、地理空间数据库实现阶段和空间数据仓库实现阶段构成了空间数据仓库系统实现过程的三个阶段,这三个阶段分别对应着三个层次世界,即实体世界、目标世界和产品世界。其中,前两个阶段是为地理空间数据库的建立服务的,由它们实现实体世界向目标世界的转换;后一个阶段是为空间数据仓库的建立服务的,由它们实现目标世界向产品世界的转换。

由此可见,空间数据仓库的认知过程主要就是这14个世界模型通过这13个转换算子的转换实现三个层次世界的过程。这个认知过程指导了空间数据仓库的实现。

3认知的概念定义

3.1世界模型

实际上,这些世界模型主要是依靠具体的实体模型或数据模型描述来实现的。每个世界模型均有其描述的地理空间对象,因此这些世界模型描述的内容大不相同,必须定义出这些世界模型。

3.1.1现实世界模型

现实世界中,人们能看到一系列物质和现象,对于这些物质和现象,不管是否能叫上名字,它们都是客观存在的,并且相互之间通过它们的关系组成了自然界的千差万别。由此可见,能将现实世界中所有物质和现象集合以及它们之间的相互关系用一定的形式进行描述就是现实世界模型。

现实世界的物质和现象集合中,隐含着许多不同的地理现象类,如地质、矿产、石油、自然地理等地理现象类。地理现象类是现实世界的一个子集。由此可见,能将现实世界中所有地理现象类集合以及它们之间的相互关系用一定的形式进行描述就是地理现实世界模型。

本文原文

3.1.3地理工程现实世界模型

地理现实世界的地理现象类集合中,特指一个或若干个地理现象就是地理工程现实世界,如自然地理等。地理工程现实世界是地理现实世界的一个子集。由此可见,能将地理现实世界指的地理现象以及它们之间的相互关系用一定的形式进行描述就是地理工程现实世界模型。

3.1.4地理工程概念世界模型

要用计算机来描述地理工程现实世界中的地理现象,就必须对它们进行抽象描述,形成地理现象在人们头脑中的反映,生成概念模型。由此可见,能将地理工程现实世界指的地理现象以及它们的内部关系用一定的形式进行抽象的概念描述就是地理工程概念世界模型。

3.1.5地理工程尺度世界模型

将地理现象抽象成概念模型,仅有这些还远远不够,因为现实世界中的所有地理现象均是有度量的,所以用计算机描述这些地理现象时,也必须是可度量的。度量主要包括描述地理现象的欧几里德几何坐标系和数学单位尺度。由此可见,对地理工程概念世界中的抽象地理现象进行欧几里德几何坐标系和数学单位尺度描述就是地理工程尺度世界模型。3.1.6地理要素分类世界模型

按照GIS理论,概念中的地理现象最终都是通过多种地理要素来表达的,因此如何对地理要素进行合理的设计和划分就显得十分重要。根据ARC/INFO的分层理论,只有将这些地理要素进行分类分级,才能高效地处理它们。由此可见,对地理工程尺度世界中具有尺度度量的地理现象进行地理要素的分类分级描述就是地理要素分类世界模型。

3.1.7地理要素编码世界模型

要使计算机能识别和处理地理要素,就必须给这些地理要素进行分类分级编码,即用一串数字来表示它们,该分类分级编码就成为该地理要素在计算机中的唯一标志符,以便计算机能识别和处理。由此可见,对地理要素分类世界中具有明确分类分级定义的地理要素进行分类分级编码描述就是地理要素编码世界模型。

3.1.8地理要素几何世界模型

为了便于计算机的存储和管理,必须将地理要素细分为几何目标。地理要素几何目标包括基本目标和复合目标。基本目标按地理要素的空间特征划分为点状目标、线状目标、面状目标、体状目标和表面状目标等五种;复合目标由基本目标集合嵌套构成。由此可见,对地理要素编码世界中具有明确分类分级编码的地理要素进行几何目标的划分和描述就是地理要素几何世界模型。

3.1.9地理要素集合世界模型

因为地理要素在一定的条件下由相同或不同的点、线、面、表面和体等五类空间目标组合而成,所以在实际使用中,必须通过计算机系统把数据库中存储的基本目标、复合目标还原成地理要素。由此可见,对地理要素几何世界中具有基本目标、复合目标描述的地理要素进行数据库的几何目标集合操作就是地理要素集合世界模型。

定义9地理要素集合世界模型。设Con中地理要素点状目标、线状目标、面状目标、体状目标、表面目标集合分别表示为Po、Lo、Ao、To、So,Atr为地理要素的某一地理特征集合,则地理要素集合世界模型为Ent={e|(Po,Lo,Ao,To,So)∈Atr}。

3.1.10地理空间抽取世界模型

地理空间抽取的主要功能就是从源数据库中按地理区域范围(矩形、椭圆、多边形等)抽取出满足一定条件的不同种类的地理空间数据。由此可见,对地理要素集合世界中的地理空间数据按一定地理区域范围和地理特征进行抽取的操作描述就是地理空间抽取世界模型。

3.1.11地理空间整合世界模型

数据库中存储的地理空间数据是以图幅为单位组织的,但应用系统使用数据是无图幅概念的,是以地理区域范围为组织的。由此可见,对地理空间抽取世界中抽取出的地理空间数据进行图形裁剪、图形拼接、图形接边、图形编辑和拓扑重组等整合处理,形成以地理区域范围为组织的无缝数据集合操作就是地理空间整合世界模型。定义11地理空间整合世界模型。设Con中图形裁剪、图形拼接、图形编辑、图形接边、拓扑重组功能分别表示为Cut、Stitch、Meet、Edit和Topology,整合功能集合表示为Fun={Cut,Stitch,Meet,Edit,Topology},则地理空间整合世界模型Pro={e|(e∈Ext,e∈Fun)}。

3.1.12地理空间统一世界模型

实现地理空间数据整合后,必须对来自不同源数据库中的地理空间数据进行统一,因为地理空间数据存在着差异。这些差异表现在如下方面,即数学基础差异、数据编码差异和数据格式差异、数据精度差异。由此可见,对地理空间整合世界中的地理空间数据进行数学基础、数据编码、数据格式、数据精度的统一操作和描述就是地理空间统一世界模型。

3.1.13地理空间产品世界模型

随着应用的深入,单纯的地理空间数据已越来越不能满足用户的需求,用户更加希望使用的是经过测绘专业处理的、经过二次加工处理的地理空间数据产品,后者在实际中具有更大的应用价值。由此可见,对地理空间统一世界中的地理空间数据进行测绘专业处理生成空间数据产品的操作就是地理空间产品世界模型。

定义13地理空间产品世界模型。设Con中单一、集成、融合、派生和关联的功能分别表示为Single、Integrate、Fuse、Derive和Relate,测绘专业处理算法集合为Fru={Single,Integrate,Fuse,Derive,Relate},则地理空间产品世界模型Pdu={e|(e∈Uni,e∈Fru}。

3.1.14地理空间决策世界模型

建立空间数据仓库的最终目的是为空间决策支持服务,为用户提供大量的具有空间决策支持的信息,这可通过空间数据仓库中的空间数据立方体分析和空间数据挖掘分析来实现。由此可见,对地理空间产品世界中的空间数据产品进行空间数据立方体分析和空间数据挖掘分析,生成空间决策支持信息的操作和描述就是地理空间决策世界模型。

定义14地理空间决策世界模型。设Con中的空间数据立方体分析和空间数据挖掘分析分别表示为Scube、Smine,空间决策分析算法集合为Sdss={Scube,Smine},则地理空间决策世界模型Dss={e|(e∈Pdu,e∈Sdss)}。

3.2转换算子

在空间数据仓库的认知过程中,14个世界模型的变换离不开13个转换算子,即命名、选择、抽象、度量、分层、编码、测量、聚集、提取、处理、变换、计算和分析,由它们实现每两个世界模型的转换。这些转换算子主要是依靠元数据来实现的,因为每个世界模型均有描述它的元数据,要实现两个世界模型的转换,通晓这两个世界的元数据是转换的前提。虽然这些转换算子的具体定义不同,但它们都是实现每两个世界模型的转换,从数学的定义上说就是由某个世界模型通过函数转换到另一个世界模型上,因此这些转换算子的宏观数学定义是一致的。

4结束语

目前,空间数据仓库理论和技术研究才刚刚起步,其目标是支持数字地球发展、空间数据集成、空间决策支持发展的需求。因此应该抓住这个千载难逢的好机会,将我国的空间数据仓库研究与建立迈上一个新台阶,以支持我国的空间数据基础设施建设。本文对空间数据仓库的概念框架和认知过程体系进行了一定程度的技术探讨,希望能起到抛砖引玉的作用。

参考文献:

[1]ZOUYijiang.Theconceptualframeworkonthemulti-scaleandspatio-temporaldatawarehouse[C].Beijing:20thICCAcademicPress,2001:2823-2831.

[2]ZOUYijiang.Thedesignofspatlatldatawarehouse[C].Bangkok:GeoInformatics&DMGIS’2001AcademicPress,2001:421-426.

[3]ZOUYijiang.Theresearchofmetadataonspatialdatawarehouse[C].Durban:21thICCAcademicPress,2003:225-226.

[4]ESRI.ESRIopenstrategywhitepapersonSDE/CADclient&spatialdatawarehousing[EB/OL].(1998).Esri/com/base/compay/opengis.

[5]ESRI.AnESRIwhitepapers,mappingforthedatawarehouse[EB∕OL].(2002).Esri/com/base/compay/opengis.

[6]TOMB,GRAYJ,SLUTZD.Microsoftterraserver:aspatialdatawarehouse.microsoftresearchadvancedtechnologydivision[EB/OL].(2004)./.

[7]SHEKHARS,LUCT,TANX,etal.Avisualizationtoolforspatialdatawarehouses[EB/OL].(2003).cs.umn.edu/Research/Shashi-group.[8]DIMITRISP.EfficientOLAPoperationsinspatialdatawarehouses,HKUST-CS01-01[R].HongKong:[s.n.],2001:65-69.

[9]赵霈生,杨崇俊。空间数据仓库的技术与实践[J].遥感学报,2000,4(2):157-160.

[10]李琦,杨超伟。空间数据仓库及其构建策略[J].中国图像图形学报,1999,4(11):984-990.

[11]杨群,闾国年,陈钟明。地理信息数据仓库的技术研究[J].中国图像图形学报,1999,4(8):621-626.

[12]周炎坤,李满春。大型空间数据仓库初探[J].测绘通报,2000,22(8):22-23.

数据库论文 篇4

关键词:云南;少数民族;文字文献;数据库;建设

中图分类号 G250 74

文献标识码 A

文章编号 1672-867X(2005)01-0148-04

一、引 言

云南是我国少数民族种类最多的省份,人口超过5000人的民族有26个,其中15个是云南独有的民族。除回族、水族、满族3个民族通用汉语外,其余的民族都有自己古老的文字或语言:23个民族使用着27种语言;15个民族使用着24种文字(或拼音方案)。

本文旨在通过论述云南地方少数民族文字文献的宏富,全面探讨云南少数民族文字文献的构成、价值以及对其开发利用的重要性,寻求采用先进科技手段将其数字化的方法,以便更好地传承这一颇具特色的文化奇葩,以造福于子孙后代。

二、丰富的地方民族文字文献是数据库的资源保障

云南地方少数民族文字文献以彝文、东巴象形文、傣文和藏文的文献最为丰富,也是少数民族文字文献中最为悠久、珍贵的文献。

(一)彝文文献。彝族在历史上产生了本民族古文字,明清文献将其称作“爨文”、“韪书”,近人称它为“倮文”、“毕摩文”、“贝玛文”或“罗罗文”等。自彝文产生的时候起,便有了彝文古籍。彝文古籍种类繁多,从学科和内容上分为宗教类、历史类、训劝类、政治军事类、科学技术类、天文地理类、彝文字词典类等。彝文古籍博大精深,任何一部都有丰富的内涵,都有不可替代的作用和地位,它数量庞大,计有数万册、数千种。其中影响较大、被翻译介绍得颇有特色、具有代表性的重要典籍有:《查姆》、《梅葛》、《玄理大书》、《指路经》、《尼租谱系》、《礼法经》、《十月兽历》等。《昆明西乡彝文单字注释》是迄今为止收集到的年代最久远的一部字书,书中收录了206部彝文古籍近7000个彝文字,是研究彝文难得的资料,对编写彝文古籍词典,对彝汉双语教育历史的研究,都有着极高的借鉴和参考价值;彝文医书《彝族医药志》记述了彝医的起源、彝族先民的针灸疗法、常见病防治法,被医药界誉为“哀牢明珠”,据说还早于《本草纲目》12年。国外对彝文的研究始于1852年:法国人把《宇宙源流》译成法文,并在1898年用法文、彝文对照出版;1905年出版了法文与彝文对照的《法罗字典》;英国鲁豪尔的《坚固的堡垒》(1947年)、美国弗兰克的《华南漫游记》(1964年)、法国享利·科尔迪埃的《罗罗的现实形态问题》(1907年)、日本西田龙雄的《中国西南部的罗罗文字》(1980年)等论著也在20世纪上半叶相继出版。

(二)纳西族东巴象形文。纳西族古老的原始象形文计有1400余字。纳西族信奉的东巴教是一种原始的多神教,东巴教的经师称为“东巴”,他们掌握象形文,在进行祭祀、除病禳灭等法事活动中形成了众多的东巴经,用于记载古代纳西社会的历史、宗教、文学、艺术、地理、医学等方方面面。流传至今的东巴文古籍约有2 3万册,不同内容的约有1500册(种),分为祭天仪式经书、占卜经书、舞谱及杂类书等共28类,是研究纳西社会的百科全书。东巴文经典《创世纪》是纳西创世史诗,它所反映的社会内容是十分丰富的,如抹去神话色彩,完全可以看作是纳西族先民从群婚向一夫一妻制婚姻形式过渡的真实写照;《哥巴文字典》是用东巴象形文字为哥巴文注音的字典,从纳西象形文到哥巴文的发展,体现了文字进化的过程,对文字学的研究有着重要的价值;《崇仁潘迪找药》是研究纳西族医药学的珍贵材料;东巴舞谱是迄今世界上唯一的最古老的象形文字舞谱;东巴文是研究人类文字起源的第一手活资料。国外研究纳西文文献的有:法国巴克(J.Bocot)的《么些研究》(1913年);美国洛克(J.E.Rock)的《纳西百科辞典》两卷(1962年);西德雅纳特(Janert)教授来我国研究纳西族语言文字,已出版东巴经目录5册,东巴经“祭风经”5卷;日本白鸟芳郎教授主持的“中国大陆古文化研究会”于1978年出版纳西族的特集(共8集)。

(三)傣文文献。张公瑾先生在其著作《民族古文献概览》中说“文字跟着宗教走”。傣文文献的产生发展情况同这一说法很相符。傣文产生的年代在13世纪左右,傣文的文献古籍也在同期产生。从那时起,就有数量众多的佛经和各种典籍源源不断地被记录下来。其中佛经号称“别闷西版康”(八万四千部),叙事长诗有550部,另外还有各种各样的民间传说、故事,由此构成了内容博大精深、时间跨度数百年的傣族文字古籍文献宝库。傣文古籍内容涉及历史、宗教、经济、语言、文化、民俗、医学、天文历法等,因主要载体是贝叶,故又称之为“贝叶经”,其中佼佼者有:《银云瑞雾的勐果占壁简史》;为历史研究提供了重要的年代依据的《囊丝车勐》(《车里宣尉世系简史》)是一部统治阶级的兴衰史,是不可多得的史料;《苏定》是一部有关傣族天文历法的重要文献;《档哈雅》是西双版纳的傣族药书,是傣族医药宝库中的瑰宝,有些内容已被记入《中国药典》和《云南省药品标准》等医药书内。

(四)藏文文献。藏文古籍内容广泛、卷帙浩繁,其数量仅次于汉文古籍。藏文古籍以《大藏经》分法为准,分为《甘珠尔》(佛说部1108种)和《丹珠尔》(论疏部3461种)。藏文古籍的载体历经了羊皮———木简———白桦树皮———纸几个阶段。重要的藏文典籍有:《历代噶玛举黑帽系活佛教·如意藤》是研究云南藏传佛教和民族关系不可缺少的重要资料;《加岭传奇》是一部研究云南藏族历史、民俗等方面的要籍,也是一部优美的文学作品;《四部医典》则为一部藏医临床百科全书;《恰最松饶历史》是各大寺院、历算机构和个人编制日历的主要工具书之一。

其他少数民族的文字文献,如回族的《赛典赤家谱》等,壮族的《摩则社》等,瑶族的《盘王券牒》等,白族的《古通》、《山花碑》等,都是这些民族灿烂的文化瑰宝,是研究这些民族历史弥足珍贵的第一手资料。

三、信息处理技术日臻成熟为数据库构建提供了技术支持

我国民族文字信息处理的研究始于20世纪70年代后期,到90年代初,已同步实现了汉字的电脑化处理。1991年,由中央民族大学语言研究和计算机系联合研究编著的《中国各民族文字与电脑信息处理》一书,从理论上对我国少数民族文字微机处理的种种问题作了研究,并将所取得的成果作了详尽介绍。在国家的扶持下,许多科研机构开发了多种民族文字的字处

理技术及应用系统,完成了包括蒙古文、维吾尔文、哈萨克文、柯尔克孜文、彝文、藏文等在内的编码字符集标准、键盘标准、字模标准,标志着少数民族编码字符向国际标准化的迈进。[5]现已开发的少数民族文字操作系统和出版系统有:蒙文《蒙古文、汉文、西文操作系统》、《华光V型蒙古文书刊、图表、报纸激光照排系统》、《蒙文书目机读数据库》等;藏文《兰海藏文系统》、《北大方正藏文书版系统》、《WIN95藏文文字平台》、《藏文字处理软件》等;朝鲜文《方正朝鲜文书版系统》;彝文《彝文字符国际标准》、UCDOS汉彝双语平台》、《SPDOS汉彝文版汉字操作系统》、《WIN彝文文字平台》等;傣文《傣文电子出版系统》以及《计算机锡伯文、满文文字处理系统》和《壮语词库》等。1991年4月,内蒙古电子计算中心课题组完成了蒙古、藏、维吾尔、哈萨克、朝鲜、满、汉文操作系统4 0版的设计,是国家重点科技攻关项目“少数民族文字处理技术开发”的子课题,这个操作系统可同在一个微机上处理民族文字和汉、英等文。

我们看到,与云南少数民族彝、傣、藏为主体的文字文献已有密切相关的处理系统作为良好基础,将云南的彝、傣、藏文数字化已是指日可待了。民族文字信息技术的成功开发研制,为民族文字文献数据库的建设创造了必要的条件,为民族文字文献的深层次开发利用提供了技术标准和强有力的信息处理保障。但就云南省拥有自己语言或文字的23个少数民族来说,要将其所有民族文字文献数字化,任务还十分艰巨。如东巴象形文至今还未见到一个成熟的软件,但可喜的是有更多的学者都在积极努力寻求将其数字化的途径。华东师范大学中文系郑飞洲就撰文《关于纳西东巴文字信息处理的设想》,专门讨论将现有东巴文字及其研究资料科学合理地整合成数据库,并将文字的检索分为形、音、义检索,从东巴文字字形的描写项、语音的描写项和字形表义情况的描写项三个方面进行检索研究,又根据东巴文的特质提出用字素检索来解决东巴象形文的数字化问题。

三、构建地方少数民族文字文献数据库的现实意义

构建地方少数民族文字文献数据库的现实意义有:

(一)有利于保护和保存优秀的民族文化遗产少数民族文字文献载体除彝族的比较多样化外,其余均主要为纸质。彝文古籍除有竹木质载体外,还有骨质、皮书、布帛书、金石质、石质及纸质。骨质一般用之即弃,很少有保留和流传;皮书易腐布帛书价值昂贵;金石质的在云南仅发现一枚“昭通蛙钮铜印”;石质彝文古籍较著名的有《罗婺贤代铭》(公元1533年)、《普沙摩崖碑》(清咸丰年间)。纸质彝文仍是彝文古籍的主体,大量的彝文古籍主要是靠纸质传承下来的。傣文古籍主要记录在贝叶、绵纸和皮纸上;东巴文古籍书写的纸张是东巴们用当地生长的构树或兰毒草等植物制作的厚硬绵纸;藏文古籍的载体也是纸质;回族古籍多为绵纸、麻纸、草纸和石质的碑刻铭题……。显而易见,纸作为一种文献的重要载体,有它一定的局限性:易腐,不易携带,不易保存,这些制约了它的传世不朽。在科技迅猛发展的信息时代,用机器存贮的方法将民族文化这块瑰宝存贮于易传输、易检索、易复制、保存永久,一次输入、多次输出的现代化管理系统中,是有利于民族文字文献的传承与保护的。

(二)有利于开发和利用民族文化资源,形成特色服务,为研究者提供文献资源保障。地方民族文字文献数据库建设的目的,是为了适应中国地方民族学、民族文化等学科研究之需要,利用现代化手段为教学科研人员提供研究动态、最新成果,把握研究方向,引导这些学科研究走上为民族现代化建设服务的正确轨道。云南璀璨的民族文化资源,是民族学等学科研究的丰厚沃土。在云南,民族学研究源远流长,民族学的研究机构已有30多个,且人才辈出,硕果累累:1986年,云南大学民族学学科中的民族史专业被批准为云南省高等学校重点学科,1997年被正式列为“211工程”部级重点学科;“中国民族史”和“云南地方民族文化”两学科也被列为省级重点学科。作为云南地方的优势、优长学科就应在多方面给予重视和支持。建立云南地方少数民族文字文献数据库,就是为了更好地支持优长学科研究以提供文献保障。

目前,为适应不同层次用户的需要,全国民族高校都设立了民族文献资料室,建立了一批民族文献信息中心,如民院的藏学研究中心、贵州民院的全国傩文化研究资源中心、新疆大学的维吾尔及哈萨克学文献信息中心,等等。云南民族大学民族文化学院筹建了“云南少数民族语言数据库”,软件建设已全部完成,现已投入正常使用[6];云南大学宋光淑老师1999-2002年主持完成了提要型《纳西东巴文化研究数据库》后又主持建设了《西南少数民族数据库》;云南省科研图书馆自1995年以来已建有《馆藏少数民族专题书目数据库》及还将拟建成《云南少数民族画库》。这些成果,把作为云南民族文化载体的云南民族文字文献,经过规范化、数字化处理,使之变成易检索、易复制、不受时空限制的机读式文献,并使之更好的开发和利用。

四、云南少数民族文字文献数据库构建方略

(一)全局规划,整体建设,统一实施。云南是民族大省,各民族大聚集、小杂居的局面随处可见,何况又是跨地区、跨系统的民族资源整合,所以,避免各地区的书目数据库过频、过滥、低质量、低水平重复建库,出现“小而全”的局面,有必要由地方民委推荐拥有较强文献实力、自动化水平较高的大中型地方图书馆组成统筹规划机构,负责数据的标准制定方案设计、技术实施、全面协调等工作,使各承建少数民族文字文献的单位根据自身的文献特色,有目的、有方向、依标准地将民族文字文献数字化。

(二)需要突出民族特性,设计不同的库型深层次加工的文献更能引起用户对信息资源的依赖,所以要有重点地进行全文、数值、事实、多媒体数据库的建设,数据库检索结果要直接、客观详尽、快捷,要能达到即检即得的实用目的,以适合最终用户使用,从而更有效地支持学术研究,这一点对民族地方文献的利用尤为重要。为此,选择建立全文型数据库,就是选择了真正意义上的数字化建设。

选择建立全文型数据库的同时,也要突出民族文字文献的特性,做一些专题型数据库是必要的或依民族文字种类建库,如彝文数据库、傣文数据库、东巴象形文数据库等;或根据学科主题做专题数据库,如《政治与法律数据库》、《自然科学数据库》、《哲学与宗教数据库》等若干个子数据库。也可建立以研究云南地方少数民族文字文献为主的专题数据库。目的都不外乎是多角度、多渠道建库方便用户利用,使少数民族文字文献得到更深层次的开发,以服务于社会。

(一)正确的文献标引和规范的著录是数据质量的可靠保障。高质量

的数据库必须做到科学规范化的文献标引,必须依据国家标准进行标引:一是依《中国图书分类法》进行分类标引;二是依《汉语主题词表演》进行主题标引,并规定数据库的标引深度、主题词与关键词的选取范围等。著录是对文献外部特征的描述,著录的完备、准确程度与文字录入的正确率等直接关乎到检索的结果,因此,著录也应选择《中国文献著录总则》、《普通图书著录规则》等作为标准。再者,采用comMARC格式或DC格式(元数据)作为数字化建库的标准,以确保数据的正确性,使云南地方少数民族文字文献数据库从一建库开始就走标准化、规范化的道路,保证文献资源达到充分的开发利用。

云南少数民族文字文献数据库的构建,是随着计算机、通讯、多媒体、高密度存储等信息技术的发展和应用,尤其是网络技术的迅速普及、文献资源的数字化水平成为各国、各地区信息水平的标志为发展机遇的。云南少数民族文字文献是云南各少数民族智慧的结晶,是中华民族文化宝库中的一块瑰宝,从一个地区拥有如此丰富的语言文字资源来说,也是世界上举世无双,将其数字化必将促进地方民族文化大省建设的步伐,在促进民族地区的经济文化建设与发展中将起到不可低估的作用。

参考文献:

[1]华林。论云南少数民族文字古籍的开发利用[J].民族研究,1997,(1).

[2]宋绮。关于构建云南少数民族文献资源数据库的思考[J].云南社会科学,2002,(2).

[3]包和平。王学艳。国外对中国少数民族文献的收藏与研究概述[J].情报杂志,2002,(6).

[4]包和平。我国民族文字文献工作的现代化[J].图书与情报,2000,(3).

[5]江嘎。民族文字迎接信息时代的到来[J].中国民族,2001,(5).

[6]陈锡周。云南少数民族语言数据库[J].云南民族学院学报,2003,(1).

(陈雁婕 云南大学图书馆)

(闵红云 云南大学研究生部)

数据库论文 篇5

论文摘要:网络数据库安全性问题是一直是围绕着数据库管理的重要问题,数据库数据的丢失以及数据库被非法用户的侵入使得网络数据库安全性的研究尤为重要。本文以比较常用的Access、数据库为例围绕数据库的安全性技术作了分析。

随着网络技术在社会各个行业尤其是电子商务领域的广泛应用,其安全性和可管理性具有十分重要的意义。数据库是网络信息系统的重要组成部分,涉及来自网络环境下的多方面安全威胁,譬如面对数据库中信息的窃取、篡改、破坏、计算机病毒等的渗透和攻击行为。

1网络数据库安全性策略分析

1.1系统安全性策略

1.1.1管理数据库用户

按照数据库系统的大小和管理数据库用户所需的工作量,数据库安全性管理者可能只是拥有create,alter、或delete权限的数据库的一个特殊用户,或者是拥有这此权限的一组用户。应注意的是,只有那些值得信任的用户才应该具有管理数据库用户的权限。

1.1.2用户身份确认

数据库用户可以通过操作系统、网络服务以及数据库系统进行身份确认,通过主机操作系统进行用户身份认证。

1.1.3操作系统安全性

数据库管理员必须有create和delete文件的操作系统权限;一般数据库用户不应该有create或delete与数据库相关文件的操作系统权限;如果操作系统能为数据库用户分配角色,那么必须具有修改操作系统账户安全性区域的权限。

1.2用户安全性策略

一般用户通过密码和权限管理实现系统的安全性保障;必须针对终端用户制定安全性策略。例如,对于一个有很多用户的人规模数据库,管理员可以决定用户组分类,您可以使用“角色”对终端用户进行权限管理。

1.3管理员安全性策略

保护作为服务器和用户的连接;保护管理者与数据库的连接;使用角色对管理者权限进行管理。

1.4应用程序开发者的安全性策略

明确应用程序开发者和他们的权限;指定应用程序开发者的环境;授权free和controlled应用程序开发。

2网络数据库安全技术分析

本文以比较常用的Access、数据库为例进行分析,其他数据库可以作为参考。

2.1Access数据库地址、路径过于简单

Access数据库被下载,主要是存放数据库的路径和数据库名称,容易被获知,例如:用户建立的xuesheng.mdb(学生信息库)放在虚拟目录/student下,如果没有事先对xuesheng.mdb进行安全加密处理,那么在浏览器的地址栏键入“http//用户网站主IP地址/student/xuesheng.mdb”,xuesheng.mdb整个文件就会被轻易下载,文件中所有的重要数据信息就会被别人轻易窃取。操作流程如图1所示。即使对Access.mdb的文件夹作了变动,文件路径也会暴露无疑。

获知源代码获得路径窃取文件名下载文件

图1网络环境下数据库下载流程

2.2使用下载ASP文件所导致的数据安全问题

各单位的网络服务器一般都存有大量的应用系统账号及密码,如电子邮件、聊天室、BBS、留言簿、新闻系统等。由于网络管理员没有足够的时间与精力开发这些应用程序,所以多是采用直接从网上下载的方法来满足急用。这此程序的源代码是公开的,所使用的数据库名,存放路径没有任何秘密,如果安全措施不力,会给AccessDB的安全带来非常大的危险。如从网上下载了一个ASP应用程序,且Access.mdb的连接文件是conn.inc,在ASP程序中,Access.mdb连接的代码是:2.3服务器操作系统的安全隐患

现在使用WindowsNT/2000Sever作为服务器操作系统的用户非常主流,由于Win2000Sever目录权限的默认设置安全性较差,很多网管只知适让Web服务器运行起来,很少对NTFS进行权限设置。有的服务器甚至未禁止对文件目录的访问控制。因此,必然会带来很大的安全漏洞。

3安全对策及其实现

一键复制全文保存为WORD
相关文章