GML数据的整体同构压缩算法研究

0 downloads 0 Views 390KB Size Report

Pij iſ 1: 1 000 fill BSEE 1 if X A bit Ef. SEGFKyi'.5L 7. A y Dell4550 E 52. 4 GHz y fif. 25 000. 20 000 a gift . 15 000 in Eisai SE;. -k is 10 000 is: 5000. O . B -- a-- SS.

第 25卷 第 2期  2009年 3月 

地 理 与 地 理 信 息 科 学 

Vo1 .25   N O.2  

Geogr aphy and Geo— I nf ormat i on Sc i ence  

M arch 2009 

GML数 据 的整体 同构 压缩 算 法研 究  张海 涛  , 阊 国年 , 张 书亮 , 原 立 峰 , 姜 杰  (1 .南 京 邮 电 大学 通 信 与 信 息工 程 学 院 , 江 苏 南 京 21 0003; 2.南 京 师 范大 学 地 理 信 息 科 学 江苏 省 重 点 实 验 室 ,江苏 南 京 210097)  

摘要 : 在 分 析 传统 的 GML数 据压 缩 技 术 特 点 的 基 础 上 , 提 出 GML数 据 整 体 同 构 压 缩 方 法 :以 GML文 档 中的 Fea—   t ur e元 素 为 基 元 , 利 用 标 签 索 引 编 码 实 现语 义 的 同构 压 缩 ;以 GML空 间 数据 的 聚类 分 区结 果 建 立 分 组 局 部 坐 标参 

考 系 ,利 用 坐标 参 考 系 转 换 实 现 空 间 内 容 的 同构 压 缩 。实 验 证 明 : 该 压 缩 算 法 的 存 储 空 间 消 耗 、查 询 处 理 速度 等性  能 均优 于传 统 方 法 , 对 研 究 GMI  数 据 的存 储 、 查 询 与传 输 等 技 术 具 有 一定 的参 考 价 值 。   关键 词 :地理 标 记 语 言 ; 整 体 同构 ;空 问 聚类 ;局部 坐标 系  中 图分 类 号 : P208  

文 献标 识码 : A 

文章 编 号 :1672—0504(2009)02—0019—04  

随着 GMI  在 异构 GI S数据 共享 集成 、 互 操 作领  GML数据 压缩技 术 的研究 ,国内外学 者 基本 仍沿 用  域的广泛应用 ,GML自我描述 、 结构嵌 套 以及 文本表  XML的 同构压缩 思路 , 但 数据 压缩 的粒 度不再 是 传  达等特性 引起 的数据冗 余 问题 成 为 国 内外学 者 关注  统 的 字 符 或 任 意 标 签 ,而 是 GML 中 的 地 理 要 素  的 热 点 ~  】 。研 究 高 效 的 GMI  数 据 压 缩 技 术 是 解 决  (Feature)[1-4] 同时 , 在 压缩 比率 、 处 理 时 间和 网络  。

问题 的关键 。传 统 的沿用 XMI  压缩 技术 的 GML数  传输性 能等 方面也 进行 了优 化 ( 采 用 数据 分 片 、 切 割  据 压 缩 方 法 只能 实 现 GMI  文 档 要 素 隶 属 语 义 关 系 的  重组 、 增 量传 输 的策略 )。   同构 压 缩 , 而 不 能 对 GMI  空 间 数 据 内 容 进 行 同 构 压 

目前 GML压缩方 法存 在共性 问题 : 直接读 取特 

缩 。分布式计算环境 中的客户端在使 用 GML压缩数  性 只能 在 压缩 文 档结 构 级 别 实现 ,压缩 数据 内容 必  据 时 ,必 须 先 对 空 间 数 据 内 容 解 压 缩 ,才 能 进 行  须在解 压状 态下才 能进行 操 作 。压 缩 数 据与 本 源格  GML数据 空 间拓 扑 关 系 的运 算 。但 解 压 缩 不 仅 大  式 同构 的特性 是实 现直接 读 取 的基 础 。传统 的 压缩  大 降低 了 GMI  数据查 询的效 率 , 还会 占用 客户 端大  方法利 用编码 /精 简标签替 代 原始 标 签 的压缩 方 式 ,   量 的存 储资源 。因此 , 研究 GMI  数据 的语 义结 构与  保 持 了 压 缩 后 的 文 档 结 构 与 原 始 文 档 的 同 构 。但 对  空 间数 据 内容 整体 同构 的压缩技术 具有 重要 意义 。  

于 GMI  表 达 的空间数 据 内容 的压 缩 , 则 通常采 用算 

笔者在研究 传统的 GMI  数据压缩技 术特点 的基  术编码 或 者 字 典压 缩 的方 法 I l   ],使 得 压 缩 后 的数  础上 , 提 出 基 于 索 引 编 码 与 局 部 坐 标 系 的 整 体 同 构 压  据 内容 成 为 1维 的二 进 制 流 或字 符 流 , 不 再保 持 本 

缩方法 。实 验证 明 : 该 压缩 算 法 的存 储 空间 消耗 、 查  源 GML 数 据 的 多 维 结 构 特 性 。 这 样 在 进 行 GM L  询 处 理 速 度 等 性 能 均 优 于 传 统 方 法 ,对 研 究 GML数  数 据查 询时 , 空间拓 扑运算 不能 直接读 取 GML空间 

据的存储 、 查询与传输等技术具有一定的参考价值。  

1   传统 的 XMI   /GML 同构 压 缩 技 术  2000年 美 国 学 者 在 XM I I  I  系 统 中 提 出 XMI  

数据压 缩方 法  ,压缩 数 据 直 接 读 取 与 提 高 压缩 比 

数据 内容 , 而 必须对 压缩后 的空 问信 息进 行解 压 缩 。  

但 解压缩 会 重 新 引 起 存 储 空 间 与 运 算 处 理 时 间 消  耗, 从 而大大 降低 了 GMI  压缩 数据操 作 的效 率 。  

2   GML数 据 的整 体 同构 压 缩 算 法 

率 成 为 XMI  压 缩 技 术 的 主 要 研 究 方 向 。 同 构 是 实  2.1   结 构 语 义 的 同构 压 缩 

现 压缩 数据 直接 读 取 的 主要方 法 , 典 型 同构 压 缩技 

GMI  数 据 模 型 是 完 整 意 义 (包 括 逻 辑 表 达 与 物 

术方 法 主 要 有 :XGr i nd   、XPre s s[  、基 于 XMI  模  理存 储 )的 面 向对 象 数 据 模 型 ,它 以地 理 要 素 (Fea—   式文档 DTD的数 据 流压缩 方法  、基 于结构上 下 文  t ur e)为 基 本 数 据 组 织 单 元 ,采 用 XMI  的 嵌 套 表 达  的 压 缩 方 法 ]以 及 XSC[   、QueXComp   L “ 等 。 对 于  方 法表达 具 有 任 意 复杂 度 的地 理 实 体 。GML数 据  收 稿 日期 : 2OO 8— _o9—29;   修 订 日期 : 2 OO8一n—07  

基 金项 目 : 南 京 邮 电 大学 攀 登 计 划项 目“基 于 OpenLS的 移 动 位 置数 据 共 享 机 制 研 究 ”(NY20 6074);虚 拟 地 理 环 境 教 育 部 重 点 实 验 室  开 放 基金 项 目“基 于 c GML移 动 GI S数 据 索 引 机 制 研究 ”( NS206001); 江 苏 省 测绘 科 研 项 目“GMI  空 间数 据无 线 传 输 在 城  市 应 急 系统 中的 应 用研 究 ”(J SCHKY2OO7O7)  

作 者简 介 : 张 海 涛(1 978-), 男, 博 士研 究 生 , 讲师. 从事 移 动 GI S及 基 于 GML的 G1 S数 据 集成 研究 。E— mai l : 007 hai l ong l ong   @s i na . c om 

第 2O页 

地 理 与 地 理 信 息 科 学 

第 25卷 

文档 中不但 存储 地理 对象 的空 间 、属 性信 息 , 还 记 录  2.2 空 间 内容 的 同 构 压 缩 

着地 理对 象之 间的逻 辑关 联 信 息—— 地 理对 象 的语 

GML空 间数 据 内容是 高精 度 、大尺 度 范 围地 理 

义隶属 关 系 。因此 , 语 义 同构压缩 是 GML数 据 同构  信 息 ,为保 障数 据 的无缝 集 成 与 多 级 数 据 的有 效 融  压缩 的重 要组 成 部 分 。算 法 1是 笔者 设 计 的 GMI  

合 ,通 常 采用 统 一 坐 标 参 考 系定 位 并 度 量 地理 要 素 

语 义 同 构 压 缩 算 法 (GSI C: GMI  Semant i c  I s omor —  

的空间几 何 信 息 。但 该 方 法 在 存储 、表 达 空 间几 何 

phi c  Com pressor)。  

信 息 时存 在 一 定 的冗 余 ,即所 有 几 何 信 息 必须 采 用 

算法 1: GMLDoc ument  GSI C (GMLDocument   高精 度 的 浮 点 数 据 类 型 或 占用 较 长 的字 符 数 据 类  gm l Doc)  

型 。GML数据 全部采 用 文本方 式 表 达 , 数 据 冗余 问 

输人 参数 : gml Doc代 表原 始 GML数 据文 档 ;   输 出结果 : 采 用索 引编码 替代 Fe at ur e元素 标签  方 法 语 义 同 构 压 缩 后 的 GM L文 档 。  

题 尤为 突 出 。  

笔 者通 过 以下 步 骤 实 现 空 间 内容 同 构 压 缩 : 1)   遍 历 GML 数 据 文 档 , 对 GM L空 间 数 据 内 容 进 行 聚 

方法 : 首 先对 GML文档 中的所 有 Fea t ur e元 素  类 分 析 ; 2) 基 于空 间聚 类分 析结 果 , 建 立一 组 或 多组  标 签 进行 索 引编 码 ,同时 建立 索 引编 码 与 标签 的字  局 部空 间 坐 标 参 考 系 ;3)把 统 一 坐 标 参 考 系 下 的  典 对照 表 。为尽 可 能 提 高 数 据 的 压 缩 比 , 应 依 据 元  GML空 间数 据 分 别转 换 到 各 个 局 部 空 间坐 标 参 考  素标 签 在文 档 中 出现 的 频率 构 造 索 引 编码 ,频率 越  系 下 进 行 存 储 表 达 。 由 于 转 换 后 的 GML 空 间 数 据  高其对 应 索 引 编码 值 越 小 (占位 越 少 )。然 后 , 遍 历  的坐 标值是 相对 于局 部 空间 坐标 参 考 系 中心 点 的分  GML文 档 ,替 换 文档 中的 Feat ure元 素 标签 为 对 应  量 , 其 占用 的存储 字 节 数 大 大缩 减 ,可 实现 GML文  的索 引编码 , 输 出结 构语 义压缩 后 的 GML文档 。  

档数 据量 的压 缩 ; 转换 后 的 GML空 问信息 仍采 用文 

步 骤 1: 初 始 化 索 引 编 码 

本方 式 表 达 且 保 持 了原 有 的嵌 套 、多 维 结 构 表达 特 

DI CT — I ni t FI Code( gm l Doc):  

性, 从而 实现 了 同构 压 缩 。笔 者 重 点 对 空 间 聚类 分 

//构 建 Feat ur e元 素 的索 引 编 码 字 典 DI CT 

析 与坐标 参考 系转 换算 法进行 讨论 。  

步 骤 2: 语 义 压 缩  GM I  ConstructIterator i terat or— gm l Doc. getG M LCon—   structIterator();  

G M LConst ruct  f i rs tGM LCons tr uc t— i te rat or.next G M L.  

2.2.1   空间聚 类分析  空 间聚类 分析方法 主要 有分  区 (pa r t i t i oni ng)、 层 次 (hi er ar c hi c a1 )和 基 于 密 度 (de ns i —  

t y - bas ed)3类 。 分 区 聚 类 方 法 的 基 本 准 则 : 空 间 分 布 

Construct():  

邻 近 的地理要 素划分 到 1个 局部 空间 坐标参考 系 中 ,  

//首先 对 GML文 档 的根 Fe at ure元 素 进 行 编 码 替 代 

而把空 间分 布 离散 的地 理 要 素划 分 到 不 同坐 标 参考 

i f( const ruct  i nst anc eof   Feat ur e)   t  

L1:Feature feature ̄

(Feature) construct;  

间坐标参 考系 的最优分 组 , 算法设计 如下 :   算 法 2: Ve ct or []KMS- Cl us t e r(Vec t or   Coor di —  

feature.Tagnam e  —

系 。笔 者采 用 K-Me a ns分 区 聚类 方 法  计 算局 部 空 

Fi ndI ndexCode(f eat ur e.Tagnam e。DI CT);  

}  

natesLi st)  

输 入参 数 : Coor di na t esLi s t代表 GML数 据 文档 

G M LConstructIterat or gm l ConstructIterator= 

const r uct .get GM LConst r uc tI t er at or();  

//X,  ̄根 Feat ur e元 素 的多 个 子 Fe at ure元 素 循 环 操 作  w hi le (gm l ConstructIterator.hasN ext())  

中所有 进 行聚类 分组 的坐 标链表 ;   输 出结果 : 输 出最佳 的聚类分 组结 果 。   方法 : 把 Coor di na t esLi st中所 有 Coor di na t es分  别 聚 类 成 2~ (Coor di nat es Li s t .c ount 一 1)组 。 首 先 求 

GM LConst r uct  ne xt G M LConst r uct— gm l Cons tr uc t It  

得 每 种 指 定 分 组数 的最 优 聚 类 划分 方 法 , 然 后 进 一 

erator.nextG M LConstruct();  

i f (next GM LConst r uct  i ns tanceof   Fe ature)  

最 优 聚类 划分方 法 。  

  {

//对子 Feat ur e元 素 的 子 Feat ur e元 素 进 行 递 归操 作  construct—

步 比较 所 有 分 组 数 的最 优 解 ,以求 得 所 有 分组 数 的 

nextGM I  Construct;  

步 骤 1: 初 始 化 聚 类 

//设 定 k一 2,应 用 k_ me ans算 法 把 Coor di —  

goto L1;   f   ,  

步 骤 3: 返 回 压 缩 文 档  Return gm lDoc.SaveA s()。  

na t e s I   i s t坐标放 到 k个 聚类 分 区 中 , 计算 聚 类方 式 中  最优代 价 ( 此处 笔者 以具有 最 大压缩 比为单一 指标 ),   并保存 代价值 mi n与聚类 k值 作为 以下 运算的基础 。   I nt  k一 2;Vec t or[ ̄kgr oup;  

第 2期 

张海 涛 等 : GMI  数 据 的 整体 同构 压 缩 算 法 研 究 

算 法 3: f l oat  GSDI C( Vec t or[ ]kgr oup)  

fl oat  cp rati o—   —

k- me ans(Coordi nat esLi st, k, kgroup);   fl oat  max— cp —

第 21页 

输 入参数 : kgr oup代表 指 定 分组 数 的 聚类 划 分 

r at i o; Vect or[]mi nkgroup—kgr oup;  

步 骤 2: 循 环 计 算 指 定 分 区 数 分 组  For (k一 3;k< 一 Coordi natesList.count一1;k+ + )  

{c p—r at i o  k- means(Coor di nat es I   i st, k,kgr oup);   i f (cp r at i o> max)  

的某个 序列结 果 ;  

输 出结 果 : 输 出空 间数据 内容 同构 压缩 的 比值 。   表 1   转 换 前 后 空 间数 据 坐 标 值 以 及 占用 字符 数 的 对 比  Tabl e 1   Com pari s on of  the coordi nates as wel l  as  characters  occupi ed 

坐标 线 段 



原 始 坐标 

转换 坐 标 

{max— s(k); mi nkgr oup= kgr oup;}   }  

10 000.95 

0.95  

0.29 

10 000.29 

步 骤 3: 返 回 结 果 

9 999.62 

Re tur n m i nkgr oup。  

T1  

9 999.16 



9 999.49 

该 函 数 实 现 流 程 为 :1)遍 历 把 Coor di nat esI   i s t .  

0.84 



9 999.51 

算 法 2调 用 了指 定 分 组 数 的 聚 类 函数 k-me ans,  

0.38 

一一





0.49  

0.51   O.36 

10 000.36 

c ount个坐标 数据 分成 k组 的所有序 列 ; 2)为 每个 序  列 的 k个 分组 建 立 局部 坐标 系 ,执 行 坐 标 系转 换 的  T2  

数据压 缩 ,并计算 压缩 比 ; 3) 选 取最 小 压缩 比的分 组  序列 , 赋值给 kgr oup, 并返 回其压缩 比值 。笔者 重点  对 坐标系转 换的数 据压缩 过程进 行分 析 。   2.2.2   局 部 坐 标 系 转 换  统 一 坐 标 参 考 系 下 的  }



 

T3  

9   9   O   O   O   O  

GML空 间数据转 换 到各 个 局部 坐标 系下 表达 ,实际  9   9   O   O   O  O  

9   9  9   O   O   0   O  9   8   9   0   l   2   2   :

 

● 

● 

● 

● 

● 

上 是 对 GM L空 间数 据 坐 标 执 行 坐 标 参 考 系 中 心 点  )

 

5  l   4   6   0   2  

o0 



,‘

3  

1  

平 移的运算 。局部 坐标 系 中心 点坐 标 可 以选 择 聚类 

0 ∞ ∞ 1 ∞ 0 O ∞ 1 ∞  字 符数  他 丛  盯  Y 

分 区的空 间范 围的 中心点 、聚类分 区 的边 界点 、聚类  分 区的 中心 区域 的某个空 间数 据 坐标 以 及聚 类 分 区 

O   0   9   9  O   O   9   9   9   O   O   9   9   9  O   0   9   8   9  . 

. 

. 



9  

的边 界 地 某 个 空 间 数 据 坐 标 。 笔 者 以 坐 标 系 转 换 后 

r0  2   8   8   3   1   5   5  

数据 压缩 比的大小 作为选 取局 部坐 标 系 中心 点 的指  标 。以单一 聚类 分区范 围的 中心点 作 为局 部 坐标 参  考 系的 中心参考 点 , 建立 局部 坐标参 考系 (图 1)。   ^ 

Y 

图 2   多组 局 部 空 间 坐 标 参 考 系 

L  y 

Fi g.2  The  sketch m ap of  the  est abl i shm ents  of  m ore l ocal   r  

coordi nate s yst ems 

。 

方法 : 基于空 间 聚类 分 析 结 果建 立 1个 或 多个 

●   ●0 一 

|  

●卜 _●  一.  

局部 坐标 系 , 对 GML空 间数 据坐标 执行 坐标参 考 系  中心 点 平 移 的运 算 ,计 算转 换 前 后 坐标 数 据存 储 空  间 的 比值 。   步 骤 1: 计算 原始 坐标 占用存储 空 间 

图 1   单 一 局 部 空 间 坐 标 参 考 系  Fi g.1  The sketch m ap of  t he establi shment   of  one l oc al  coordi nate syst em 

坐标参 考系 转换 前 后 , 空 间 数 据 坐 标 值 以 及 占 

用字符 数 的对 比如表 1。从表 1可知 , 数据压 缩 比可 

达 172V0。当然 , 充分 挖掘空 间数据 分布 特性 的聚类  分 区结 果通常 为多组 ,因此 , 局 部坐 标 系转 换 的压 缩 

Long f i rs t st or age — cal s t or age(kgr oup);   —

f or(i nt  i 一 0; i % kgroup.1 engt h; i + + )  

{   M ul t i Poi nt  m ul poi nt = nul l;  

步 骤 2:计算 聚 类分 区坐标 中心 点 , 构 建 局部 坐  标 系  whi l e(kgr oup[i ].el ement s().hasMor eEl eme nt s());  

也 分多组进行 (图 2)。   Poi nt  poi nt一 (Poi nt)kgr oup[i ].el ement s() .nex—  

算法 3是基 于空 间 聚类 分 析 结 果 、 利 用 局 部 坐  标 系转换 的 空 间 数 据 内 容 同 构 压 缩算 法 (GSDI C:   GM L Spati al  Data Isomorphi c Compressor)  

t El em ent ():   .

 

m ul poi nt .add(poi nt );  

}  

第 22页 

地 理 与 地 理 信 息 科 学 

Poi nt   Cente rPoi nt — M ul poi nt .Ext ent .Cent er Poi nt ():  

步骤 3: 转换 坐 标系 , 计 算 压缩 坐标 

第 25卷 

512  M 、硬 盘 4O  G, 系 统 集 成 开 发 平 台 Net beans6.1,  

操作 系统 为 Mi cr os of t  Wi ndows  XP Pr of ess i onal 。  

kgr oup[i  ̄一rec al cul at e(kgr oup[i ], Center Poi nt );  

(2)性 能 分 析 。 为 检 验 压 缩 算 法 的 综 合 性 能 ,笔 

}  

者利 用 转 换 合 成 的 1 3类 基 础地 理 数 据 设 计 两组 实 

Long com pr ess st or age — cal st or age(kgr oup);   —

验: 数 据 压 缩前 后 占用 存 储 空 间 的对 比实 验 结果 如 

步 骤 4: 返 回压 缩 比 率 

图 3所 示 ,13类 基 础 地 理 数 据 均 具 有 较 好 的 压 缩 比 

Ret ur n f i rs t st or age /compr esss t or age;  

性能, 平 均压 缩 比 为 407% ; 原 始 GML数 据 与 压 缩 

3   实 验 分 析 

GM L数 据 可 视 化 时 间 的 对 比 实 验 结 果 如 图 4所 示 ,  

(1)实 验 环 境 。 笔 者 利 用 Sa f e   FM E2006软 件 对  基 于 压 缩 数 据 直 接 读 取 的 可 视 化 时 间 远 小 于 原 始 

南京 市 1:1  000基 础 地 理 数 据 进行 语 义合 成 转 换 。   GM L数 据 的可 视 化 时 间 , 前 者 的 时 间 消 耗 平 均 只 有  实 验 的计 算机 平 台为 De1 1 4550、主频 2.4  GHz、内存  后 者 的 69.84   。  

盈 

堇  翠 

一  一 亘  尉  舳 加 ∞ 如  如 加 m 

咖  

0   数 据 类 型 名 称 

数 据类 型名 称  

图 3 压缩 GML数 据 的存 储 空 间对 比 

图 4 压 缩 GML数 据 的 可 视 化 时 间对 比 

Fig.3  Com pari son of st orage space occupi ed by the  G M L data 

Fi g.4  Com pari son of vi sual i zati on  processi ng  ti m e 

me nt s   c ompr e ss i on[A].I nt e r na t i onal   Conf er e nc e   on  Dat a   Engi  

理 论 成 因 分 析 :压 缩 后 的 GML 数 据 与 原 始 

ne er i ng[C ̄.2007.1473~1474.  

GML数 据 整体 同构 , 两 者 对数 据 的处 理方 式 完 全相  同, 可视 化处 理 时 间 只取 决 于 数 据 量 的大 小 。压 缩 

E2] LU Q  F, HANCOCK  K.GMLi nAi r: Ena bl i ng   ef f i c i e nt  a nd  po wer   conservi ng of  wi reless  GM L communicati on and vi sual i zat ion 

算 法 具有 高压 缩 比 , 必 然 也 具有 良好 的压 缩 数 据 可 

[A].2nd  I nt er na t i onal  Conf e r enc e  o n Ge ose nsor  Net wor ks  

视 化 性 能 。 由 此 可 见 ,实 验 结 果 与 理 论 分 析 完 全 一 

( GSN ’ 06)rC].Bos t on, USA , 2 006 .  

致, 证 明 了算 法 的正确性 。总之 , 本 压 缩算 法 具 有 较 

[3] 於 荔 .GM L空 间数 据 压 缩 机 制 研 究 [D].南 京 师范 大 学 , 2006.  

好 的综 合 性 能 。  

[43 杜 成 龙 , 关佶 红 ,王 治 .GM L空 间 数 据 流 压 缩 算 法 研 究 [J].计 

4   结 语 

[5] HARTMUT I  , DAN S.XMi l l :An  ef f i c i e nt  c omp r es s or   f o r   XML 

算机工程 , 2007, 33(1): 98一i00.  

da t a[A].W EI DONG C,JEFFREY F.Pr oc .of  t he  SI GMOD 

GML数据压缩是 实现多 源异 构 GI S空 间数据 资  源整合 、 高效管 理 的重 要技 术 支撑 。传 统 的沿用 结构 

2 ooo[ c].Texa s: ACM Pr es s, 2 00 0.15 3— 16 4.   [6]

PANKAJ  M T,JAYANT R H.XGRI ND:A quer y  f r i e ndl y 

与 内容 分 离 准 则 的 GML数 据 压 缩 方 法 不 能 实 现 

XML  compr e ss or [A].Pr oc .of  t he  I CDE 2002[c].Sa n  Jos e:  

GMI  空 间数 据 内 容 的 同构 压缩 , 必 须 进行 解 压 缩 运 

IEEE Com puterSoci ety,2002.225— 234.  

算才能 对 GML数 据 进行 空 间 拓扑 分析 ,占用 大量 系 

[7 ] J UN  K M , MYUNG  j  P, CHI N  W  C.XPRESS;A  que r i a bl e   c or n—  

统 资源 、 查 询效率很低 。为此 , 笔者设计 GML数据 整 

pr e s s i on   f o r   XML  da t a[A].AI   ON Y,ZACHARY  G.Pr oc .of   t he  

体 同构 的压 缩 方 法 ,实 验 证 明 该方 法 具 有 较 好 的性  能 。但 在实验 中也 发现 , 当 GMI  数 据文档较 大 时( 超  过5 0   MB), 直接读取压缩 GML数据进行空间拓扑分析 

SI GMOD  2o o3[c].Sa n  Di e g o: ACM  Pr es s , 2003 .122— 1 33.   Es] BOTTCHER S. STEI NMETZ  R.DT  dr i ven  s t r uc t ur e  pr e se r —   v i ng  XML compr e ss i on[A].BNCOD 23,Pr oce edi ngs[C].   2006.266~ 269.  

时, 仍 然会 消 耗 较 多 的 系 统 资 源 。因 此 , 需 要 引 入 GML 

[9]   ADI EGO  J,NAVARRO G,DE LA  FUENTE P.Us i ng  s t ru ct ur a l  

压 缩 数 据 的索 引管 理 技 术 , 进 一 步 提 高 压 缩 GMI  数 据 

c ont ex t s   t o  c ompr e s s  s e mi s t r u c t ur e d  t e xt  c ol l e c t i ons[J].I nf or ma —  

查询的效率 , 这是需深入研究的一个主要方 向。  

ti on Processi ng and M anagement,2007,43(3):769~ 790.  

[10] 王 腾 蛟 , 高军 , 杨冬青 , 等 .面 向 XPa t h执 行 的 XM L数 据 流 压 

参 考 文献 :   r1]   GUAN l  H. ZHOU S  G.GPr e s s:Towar d s  e f f e c t i v e  GML  docu  

缩方法[ J].软 件 学 报 ,2 005, 16(5): 869— 877.  

(下转 第 26页 )  

第 26页 

地 理 与 地 理 信 息 科 学 

第 25卷 

burg,Spr inger—Verl ag,1994.  

张渭军 , 王 文 科 .基 于 钻 孔 数 据 的地 层 三 维 建 模 与 可 视 化 研 究  EJ ].大地 构 造 与 成 矿 学 , 2006, 30(1): 1 08~ 11 3.   贺怀建 , 白 世 伟 ,赵 新 华 ,等 .三 维 地 层 模 型 中 地 层 划 分 的探 讨  EJ].岩 土 力 学 ,2 002, 23( 5): 637—639.   朱 良峰 , 吴 信 才 ,刘 修 国 ,等 .基 于钻 孔 数 据 的 三 维 地 层 模 型 的  构 建 EJ ].地 理 与地 理 信 息 科 学 , 2004, 20(3): 26— 30.   屈红刚 , 王勇 , 潘懋 , 等 .基 于 含 拓 扑 剖 面 的 三 维 地 质 建 模 [J ].   北 京 大学 学报 (自然 科 学 版 ), 2006, 42(6): 717— 723.   I  EM 0NAM ,JONESNL.Buil di ng sol i d model s fr om boreholes 

a nd  us er — de f i ne d  c r os s — s e ct i ons  ̄J].Comput e r s& Ge os ci e nce s,   2003,29(3):547— 555.  

( c)三 维地 层 模 型 

( d) 模 型 的栅 栏 图 与水 平 切 图 

白世 伟 , 贺怀建 , 王 纯 祥 .三 维 地 层 信 息 系 统 和 岩 土 工 程 信 息 化 

图 4 基 于 钻 孔 和 交 叉 折 剖 面 约 束 的 三 维 地 层 建 模 成 果 

口]. 华 中科 技 大学 学 报 ( 城 市 科 学版 ), 2 002, 1 9(1): 23   26.  

Fi g.4 Resul ts  of  three-di m ensi onal  geol ogi cal  modeli ng based on 

屈红刚 , 潘懋 , 明镜 , 等 .基 于 交 叉 折 剖 面 的 高 精 度 三 维 地 质 模 

dri ll i ng dat a  and const rai nts  of  int ers ected fol ded cross- sect i ons 

型快速构建方法研究[ J].北京 大学 学报 (自然科学 版)网络版  参考 文献 :  

( 预 印本 ), 2008(1): 84— 89.  

[1 ] HO[UL I NG S   W.3 D  Ge os c i e n e   Mo de l i ng   Comp t er   Te c h ni que s     D [    [   [  c [   [u   [  

刘修国 , 谢 忠 .MAPGI S中 扫 描 矢 量 化 及 其 相 关 技 术 [J].中 国  [

 

f or   Geo l o gi ca l  Cha 妇  r a ct er i z at i o n[M].New Yor k  and  Hei de l —   叼 

地质大学学报 , l998, 23( 4): 341—343.  

Research on Three -D i mensi onal  Geol ogi cal  M odel i ng M ethod Based on Dri l l i ng Dat a  and Const rai nt s 

of Intersect ed Fol ded CrOss— Secti 0ns 

GU0  Yan— j un , PAN M ao , W ANG  Zhe  , W ANG  Yi ng ,w U Zi — xi ng , QU Hong- gang  ,M I NG  Ji ng 

(1.The   Key  Labor at or y  of  Orogeni c   Be l t s  and  Crus t al  Ev ol ut i on, Mi ni s t ry  of  Educ at i on,Col l ege   of  Eart h and  Spac e  Sci enc es,   Pe ki ng  Uni v er si t y, Bei ji ng  100871; 2.Col l e ge   o f Soft  ̄ J ar e   and Mi cr o el e c t roni c, Pe ki ng  Uni ve rs i t y, Be i ji ng  102600, Chi na)   Abst r act: I n t hi s  paper,t he  three —di m ensi onal  ge ol ogi cal  m odel i ng m et hod based on dri l l i ng dat a  and const r ai nts  of  i nt er sect e d  f ol de d cr oss - sect i ons  was  put  f or w ar d.Som e  pr obl em s  were   sol ved such as   t he  cont r ol   of  c om pl ex i nt er — geol ogi cal  phenom enon  i n  dr i l l i ng  dat a. w hi ch  i s   out   of  c ontr ol  based  on  t he  si m pl ex dri l l i ng  dat a.I n  t hi s  m et hod,Dougl as— Poi ker   di l ut i on al gor i t hm  f or   vect or   cur ve  i s  used  f or   deal i ng wi t h  vec t or   st r at um   cur ve  i n i nt er sect ed f ol de d cr oss — sect i ons  and el i mi nat i ng poi nt s  whi ch ar e  no ef fe ct  on  t he  qual i t y  of   m odel i ng.Thi s   al gori t hm avoi ded  non— r egul ar   t ri angl e   i n  Del aunay  t ri angul ati on  and i m prove d t he  ac—   cur acv  of   t he   m odel   as  a   w hol e.Thi s   m et hod s how ed  i t s   ef f ec ti venes s  by  t he  us e  i n  H angz hou  ur ban  ge ol ogi cal  i nf or ma ti on  m an—   agem ent  and servi ces system .  

Key  wor ds:t hr ee —di m ensi onal  geol ogi cal  m odel l i ng;dr i l l i ng;i nt erse ct ed f ol de d cr oss— sec ti ons;Dougl as —Poi ker  al gori t hm ;Del au—   nay t r i angul at i on 

(上 接 第 22页 )   El1 ] 包 小源 , 宋再生, 唐 世渭 , 等.   e Ⅺ m 

一 种支 持查 询 的 XMI  

压缩 方法[A] . 第 二十二届 中 国数据 库学术 会议 , 20 0 5 .1 95 -1 97 .  

[12 ]   王 家耀 , 张雪萍 , 周 海 燕 .一 个 用 于 空 间 聚 类 分 析 的 遗 传 K  均 值算 法 [ J ].计 算 机 工 程 , 2006, 32( 3)。 188-190.  

Research on GM L D ata Compres si on A l gori t hm wi th Hol is ti c Isom orphi c Charact eri st i c  ZH ANG Hai - ta o “。 LV Gu0一 ni an ,ZHANG Shu— l i ang , YUAN I   i — fe ng , JI ANG  Ji e  

(1.Col l ege   of Te£  c o7  , MM  cⅡf  0n  and Engi neer i ng,Nanji ng  Uni vers i t y of  Po st s  and Communi c at i ons, Nanji ng  210003;   2.Ji angsu  Provi nci al  Key Lab  o/ GISC , Nanji ng  Normal  Uni ver si t y, Nanji ng  210097,Chi na)   Abs t ract:Based  on t he  ana1 ysi s  of   the  t ra di t i onal  char act eri st i cs  of   GM L  dat a  c ompr essi on t echnol ogy, t he  GM L dat a  c ompres —   si on  m et hod of   hol i st i c   i s om or phi c   char act er i s ti cs  i s  propos ed i n  t hi s  paper,w hi c h uses  t he  i ndex l abel  encodi ng t o achi eve  t he   se m ant i c  i s omorphi c  com pr essi on  and  achi eve  spat i al   cont ent s  i som or phi c   com pres si on  by  cl ust eri ng G M L  spat i al   dat a,es t abl i s—   hi ng l oc al  coor di nate  r ef er ence  syst e ms  and  conver r i ng G M L spati al  dat a  i nt o  l ocal  coor di nat e  ref er enc e s yst em s.Exper i m ent al   r esuI t s  shov e  t hat  t he  com pr ess i on al gori t hm i s  m or e  e ff ecti ve  t han t r adi t i ona1  m et hods.The  GM L c ompr e ss i on t e chnol ogy pr o—   posed i n t he paper  has a certai n val ue f or  the t heoreti cal  and t echnol ogi cal  researches of  GM L data storage,query and transmission.  

Key  wor ds:GM L;hol i s ti c  i som or phi c; spat i al   dat a  cl ust er i ng; l ocal  c oordi nat e  ref er enc e  syst em s