CRM系統(tǒng):基于C IDOC CRM的虛擬博物館語義網(wǎng)絡(luò)架構(gòu)
物館之間相同的數(shù)據(jù),也可以容納不同的數(shù)據(jù)。CIDOC CRM模
型可以方便地使文化遺產(chǎn)領(lǐng)域的各種數(shù)據(jù)得到映射,從而使得
集成并且解釋領(lǐng)域內(nèi)各種異構(gòu)數(shù)據(jù)成為可能。
基于以上考慮,我們設(shè)計了語義層包括:用OWL 表示的
CIDOC CRM文物數(shù)據(jù)模型,數(shù)據(jù)模型到各個博物館后臺數(shù)據(jù)
庫的映射以及請求重新形成(Query Reformulation)機制。當用
戶根據(jù)CIDOC CRM數(shù)據(jù)模型發(fā)出請求時,系統(tǒng)自動根據(jù)模型
與相關(guān)博物館間的映射機制對請求進行重新形成,轉(zhuǎn)換成對應(yīng)
博物館能夠執(zhí)行的請求。
(2)數(shù)據(jù)映射機制和查詢轉(zhuǎn)換機制
本系統(tǒng)的數(shù)據(jù)映射機制和查詢轉(zhuǎn)換機制的設(shè)計具有以下
特點:
①目標數(shù)據(jù)源,即系統(tǒng)中基于本體的語義模型是根據(jù)CI2
DOC CRM獨立于各個博物館源數(shù)據(jù)預定義的,而源數(shù)據(jù)模型
又是各自獨立并且獨立于目標數(shù)據(jù)模型的。
②目標數(shù)據(jù)和源數(shù)據(jù)模型具有不同的結(jié)構(gòu),系統(tǒng)需要在設(shè)
計階段定義從各個源模式到目標模式的映射規(guī)則,在指令執(zhí)行
階段由查詢轉(zhuǎn)換機制自動完成映射。
③當新的數(shù)據(jù)源加入時,相應(yīng)的映射規(guī)則也要隨之創(chuàng)建。
④如果目標數(shù)據(jù)模式發(fā)生改變,映射規(guī)則也應(yīng)隨之改變。
假設(shè)本系統(tǒng)命名為I,則I可以表示為一個三元組( T,
{ Si } , {Mi } ) , 其中T是基于本體概念語義模型的目標模式
(以下簡稱目標模式) , { Si } 是多個分布式博物館數(shù)據(jù)庫源模
式(以下簡稱為源模式)集合, {Mi } 就是從源模式到目標模式
轉(zhuǎn)換關(guān)系集合。也就是對于任意一個數(shù)據(jù)庫源模式Si ,就有一
個映射關(guān)系Mi 與之對應(yīng),完成從Si 到T的映射, 1≤i≤n, n是
分布式博物館源數(shù)據(jù)模式的個數(shù)。
無論是源模式還是目標模式,對于一個命名為H的模式,
它的組成元素由對象集合O和關(guān)系集合R構(gòu)成,記作ΣH。由
于請求是針對目標模式發(fā)出的,所涉及到的目標模式元素在源
模式中有些是不存在的,這部分模式元素稱為源的虛擬模式元
素,記作VS。因而對應(yīng)于從源模式S到目標模式T的映射分
為兩種情況: ①直接匹配,從一個或多個源數(shù)據(jù)模式元素( ∈
ΣS )直接映射到目標數(shù)據(jù)模式元素( ∈ΣT ) ; ②間接匹配,源
與目標模式元素之間并不存在直接對應(yīng)關(guān)系,只能由一個源模
式中虛擬的模式元素( ∈VS )映射到目標模式元素( ∈ΣT ) 。
源模式中,VS 經(jīng)過一系列由源到目標的映射規(guī)則ms
A {Mi }重
新解釋為由源模式元素( ∈ΣS )組成的表示。
映射規(guī)則是指如何將源模式中的VS 部分通過操作運算
轉(zhuǎn)換為由ΣS 組成的表達式表示。其中操作運算包括標準運
算符Selection σ, Union ∪, Natural Join þ ü | , Projection π, and
Renameρ以及根據(jù)系統(tǒng)數(shù)據(jù)需要自定義的一些其他操作運算,
如組合關(guān)系Composition,郵編、街道組合(Composition)成地址;
與之相反的分解關(guān)系Decomposition等。這些關(guān)系的設(shè)計都是
在系統(tǒng)設(shè)計階段完成的。
如上所述,系統(tǒng)在設(shè)計時收集所有映射規(guī)則信息,在處理
請求時,由查詢轉(zhuǎn)換機制進行請求指令重新翻譯。原理如下:
假如用戶的請求指令是建立在關(guān)系代數(shù)的基礎(chǔ)上的,那么將遵
循Select2Project2Join模式。如果q代表一個用戶請求,當q被
發(fā)出時,系統(tǒng)自動將q解釋成qRe , qRe就是一個在系統(tǒng)I中數(shù)
據(jù)源能夠執(zhí)行的用戶指令。對于請求q具有形式:π(X)σP ( r1
þ ü |
r2
þ ü | ⋯rN ) , 1≤i≤N , attr ( q) = X, 其中, P是選擇謂詞; q是針
對ΣT 中的對象和關(guān)系發(fā)出的,目標模式中的每一個關(guān)系ri 都
與{Mi }中的一系列映射規(guī)則相聯(lián)系,表示為Sj ×m s
A ri ,代表
將映射規(guī)則序列m s 作用于某數(shù)據(jù)源Sj 可以得到目標關(guān)系ri。
其中m s ∈{Mj } , 1≤j≤n, n指數(shù)據(jù)源的個數(shù)。將q中的ri 用
∪ ( Sj ×mS )替代從而獲得qRe ,這樣當向數(shù)據(jù)源Sj 發(fā)送由qRe
分解的請求時,系統(tǒng)同時將相應(yīng)的映射規(guī)則mS 也發(fā)送給Sj ,
數(shù)據(jù)源Sj通過Σsj就能夠正確地獲取目標系統(tǒng)中的關(guān)系ri。
例如,用戶可針對圖3中基于本體語義模型的瀏覽器向?qū)?
發(fā)出以下查詢請求:“西周材質(zhì)為銅的禮器有哪些?”。這個請
求是建立在CIDOC CRM模型的目標模式基礎(chǔ)上的,涉及到了
E22, E41, E57, P1, P4, P45, P108模式元素,與源數(shù)據(jù)模式中的
元素不吻合,這就需要根據(jù)表1與圖3之間的映射規(guī)則由系統(tǒng)
的查詢轉(zhuǎn)換模塊將指令翻譯成表1所在系統(tǒng)能夠執(zhí)行的請求:
ΠAntique_name (σDATE_FROM > 1134BC∧DATE_TO < 781BC∧
MATER IAL = bronze∧USUAGE = gift Antique_table)
其中σ表示Selection,π表示Projection; Antique_table為表名。
31112 其他模塊
UDD I是分布式Web服務(wù)的信息注冊規(guī)范,它主要實現(xiàn)注
冊和發(fā)現(xiàn)功能。服務(wù)發(fā)布者可以根據(jù)這一規(guī)范進行注冊,以便
被需要該服務(wù)的用戶發(fā)現(xiàn)。當用戶通過瀏覽器發(fā)出請求后,命
令被轉(zhuǎn)換為UDD I查找命令,UDD I提供給用戶Web服務(wù)的名
稱和地址,命令分發(fā)模塊負責綁定和調(diào)用目標服務(wù)。分散在各
個地方數(shù)字博物館的服務(wù)執(zhí)行完后,將各自的返回結(jié)果發(fā)送給
信息重組模塊進行信息的整合重組,最后返回給用戶。
312 Web服務(wù)層
Web Services在系統(tǒng)集成方面是非常適用的技術(shù)。全國乃
至世界各地的文物博物館都可以提供基于Web Services的服務(wù)
接口,供其他的應(yīng)用程序調(diào)用,達到共享服務(wù)的目的。在Web
Services的模型下,任意的服務(wù)消費者(即接口使用者)只需理解
一種通用的組件接口(即Web Services) ,就可以利用現(xiàn)有的In2
ternet上的Web服務(wù),而無須考慮Web服務(wù)的內(nèi)部實現(xiàn)機制、操
作平臺、開發(fā)語言等。此外對服務(wù)的調(diào)用是SOAP ( Simp le Ob2
jectAccess Protocol) [17 ]消息機制下的遠程調(diào)用,因此兩者實現(xiàn)
的是松散耦合機制。即使在日后的運作過程中,當Web服務(wù)產(chǎn)
生了接口上或功能上的更改,服務(wù)的消費者可以通過Web Ser2
vices的描述性文檔發(fā)現(xiàn)這樣的更改,自動適應(yīng)這種更改。
針對目前數(shù)字博物館系統(tǒng)的分散和異構(gòu)特性,我們選用
Web Services技術(shù)進行集成。一般各個分散的數(shù)字博物館系
統(tǒng)都提供基于關(guān)鍵字的查找以及基于圖片內(nèi)容檢索的功能,對
這些功能函數(shù)進行改造以Web服務(wù)的形式發(fā)布并在文物私有
UDD I注冊中心注冊以便服務(wù)的發(fā)現(xiàn)。圖4所示的系統(tǒng)中的分
布式博物館、中間層和瀏覽器用Web Services技術(shù)連接起來。
下面結(jié)合圖4說明虛擬文物博物館參觀者在瀏覽器發(fā)出
請求后的處理流程:
(1)虛擬博物館瀏覽者通過瀏覽器提交文物的查詢請求,
UDD I接收查詢要求,確定目標Web服務(wù)名稱和綁定地址。
(2)如果查找請求是基于關(guān)鍵字或基于內(nèi)容的查找,那么
由系統(tǒng)的命令分發(fā)模塊直接將請求定向到相應(yīng)的博物館,調(diào)用
相應(yīng)的Web服務(wù)。
(3)如果查找請求是基于語義的,那么命令定向到語義層
處理,語義層接到請求后,根據(jù)CIDOC CRM模型與后臺博物
館數(shù)據(jù)庫數(shù)據(jù)結(jié)構(gòu)的映射關(guān)系,將查找請求重新翻譯成當?shù)財?shù)
據(jù)庫格式能夠理解的請求,再調(diào)用后臺博物館的Web服務(wù)。
(4)從各個博物館返回的調(diào)用結(jié)果經(jīng)系統(tǒng)信息重組機制
匯總轉(zhuǎn)換返回到服務(wù)調(diào)用者。
313 用戶接口設(shè)計
瀏覽器是將博物館大量信息對外展示的窗口,所以瀏覽器
設(shè)計也相當重要。本系統(tǒng)瀏覽器的檢索入口部分主要包含基
于關(guān)鍵詞、圖像內(nèi)容以及基于語義的檢索?;陉P(guān)鍵字和圖像
內(nèi)容的檢索服務(wù)主要是通過Web服務(wù)從博物館舊系統(tǒng)中集成
過來的。用戶輸入查詢關(guān)鍵字或者是上傳需要匹配的圖片,分
布在各地博物館的Web服務(wù)在當?shù)貓?zhí)行任務(wù),將結(jié)果各自傳
給信息重組機制最后通過瀏覽器呈現(xiàn)給用戶。
基于語義的查找部分是建立在基于本體語義搜索引擎基
礎(chǔ)上的。為了幫助用戶較好地形成查找問題,我們設(shè)計了基于
視角(View2based)的瀏覽器[ 18, 19 ]。所謂視角就是將描述文物
信息的術(shù)語歸類,每一類稱為一個視角。例如,我們把描述文
物的信息分為四個視角類型共九個視角,每個視角下又包含若
干個術(shù)語,具體如表2所示。
表2 文物視角信息
視角類型視 角
文物特征文物類型、文物材質(zhì)
文物創(chuàng)作創(chuàng)作者、創(chuàng)作時間、創(chuàng)作地點
文物用途使用人、使用地點、使用場合
文物展覽博物館
用戶可以根據(jù)視角中術(shù)語來形成查找問題,如在圖6所示
的現(xiàn)實界面右側(cè),用戶通過選擇文物類型中的“銅器”,文物材
質(zhì)中的“黃銅”,創(chuàng)作時間中的“周”,使用場合中的“禮物”,就
形成了以下查找:周朝用作禮物的、材質(zhì)為黃銅的銅器是什么?
通過以上選擇,查找命令在圖6的右下角形成,點擊“提交”按
鈕就啟動查詢。查找到的文物可能是一個集合,用戶可以根據(jù)
以上查找機制繼續(xù)提煉查找結(jié)果。當用戶點擊某一個文物的
小圖標時,此文物相關(guān)的信息將展示在圖6所示頁面的左側(cè)。
展示界面中間部分提供了本文物相關(guān)查找的查找入口,如查找
與本文物相同創(chuàng)作時間、相似使用場合的作品等。
4 結(jié)論
本系統(tǒng)利用CIDOC CRM概念模型及Web Services技術(shù),
構(gòu)建了領(lǐng)域內(nèi)智能型知識搜尋及信息查找的分布式架構(gòu)。使
得數(shù)字博物館在查詢使用上不再局限于關(guān)鍵詞或是圖片基于
內(nèi)容的查找,而且在不改變原有系統(tǒng)數(shù)據(jù)的基礎(chǔ)上,最大程度
地實現(xiàn)了數(shù)據(jù)共享與交換。另外還為數(shù)據(jù)進一步推論、驗證提
供了基礎(chǔ)。實踐證明文化遺產(chǎn)領(lǐng)域的概念參考模型CIDOC
CRM更適合用于數(shù)字博物館數(shù)據(jù)的描述。本系統(tǒng)的一系列架
構(gòu),配合不同領(lǐng)域的Ontology,可應(yīng)用在電子、電機、醫(yī)藥、航天
等Ontology定義的各個領(lǐng)域。由于CIDOC CRM模型是從認識
論的角度對文物描述而制定的,而對于文物的多媒體信息描述
不是很全面,另外為保護文物的屬地特性,對于某些文物信息
的版權(quán)控制也顯得相當重要。為滿足以上要求,國際上已有相
關(guān)組織分別使用MPEG27 和MPEG221[ 20 ]標準對CIDOC CRM
進行擴展融合[ 21, 22 ] ,以使數(shù)字博物館數(shù)據(jù)得到更加全面的基
于語義的描述。
參考文獻:
[ 1 ] Time Berners Lee, James Hendler, Ora Lassila. The Semantic Web
[ J ]. Scientific American, 2001, (5) .
[ 2 ] Vernadat F B. Enterp rise Modelling and Integration: Princip les and
App lications[M ]. France: Chapman & Hall, 1996.
[ 3 ] ICOM /CIDOC CRM Special Interest Group. CIDOC CRM version
31419 [ EB /OL ]. http: / / cidoc. ics. forth. gr/docs/ cidoc_cr m _ver2
s