RDF

資工二乙 495512434 張哲于 standoffish

資工二乙 495512393 蕭丞淵 comeon112233

資工二乙 495512599 李章聖 lijasonforxml

資工二乙 495512082 鄭禮衛 zxlt3722

資工二乙 495512563 王璿堯 LOWSYVE

資工二乙 495512044 李岡霖 jackieleejj

RDF

What the hell is RDF?

資源描述架構(Resource Description Framework,RDF)是由--RDF模式與語法及RDF基模(RDF Schema)--二種新興標準所組成,為網路的編碼、資料交換、可供閱讀再使用、機器可了解的元資料(metadata),提供基礎的架構。 RDF是一個用來攜帶多種不同的元資料來往於網路上的工具。 RDF主要用於製作交換以及自動處理網際網路資源之描述(物件可利用URIs來定址)。RDF用以載明“資源描述”之語法和模式。它可利用XML來描述之,但它在XML上加上了直接標籤模式。RDF並載明了特定應用領域的Schema,以宣告該領域自己的資源描述語彙,利用該Schema,該領域的應用 將可由語法的層級提昇至語意層面。

RDF 的由來?

由於www上的資料主要是供人們使用, 大部份的資料是機器無法理解的, 且www上提供了眾多的資訊, 如何管理‘描述‘搜尋這些資訊, 成為系統管理者與資料提供者所面臨的難題。雖然描述文件的資訊在HTML中已有meta 這個TAG , 但目前並沒有設定標準去定義什麼meta標籤可以使用、什麼屬性(attribute)可行、什麼屬性(property)術語有意義,以及資訊應如何使用。你可以建立任何想要的meta標籤,撰寫屬於自己的指令序列去利用資訊。由於meta data的現狀十分混亂,有鑒於此, W3C的資料轉換工作團隊修訂完成二個RDF相關標準(RDF Model and Syntax ‘RDF SchemaSpecific-ation)的公開草稿, 並將完成整個標準的制定

RDF的年代表

Timeline: Historical Events and Publications

Events and publications in the history of RDF include...

May 2001: WWW10 W3C's Semantic Web Track and the Semantic Web Developers Day. Hong Kong

Feb 2001: RDF Interest Group meeting (26-27 Feb 2001)

Feb 2001: Semantic Web Activity launched Oct 1999: "Cambridge Communiqué" W3C NOTE issued on application schema layering

Mar 2000: RDF Schema Specification 1.0 published as a W3C Candidate Recommendation ( call for implementation)

Aug 1999: RDF Interest Group created

Feb 1999: RDF Model and Syntax Specification released as a W3C Recommendation

May 1998 RDF - Using XML to describe Data, Swick, WWW8 presentation

April 1998 WWW7 Tutorial, Using Web Metadata: Dublin Core and the Resource Description Framework, Lagoze, Miller, Lassila, Swick, Iannella, Schloss, Weibel  

Dec 1997 W3C Metadata Activity Statement presented to the W3C Membership

Nov 1997 Introduction to RDF Metadata, W3C NOTE 1997-11-13, Ora Lassila

Oct 1997 first RDF working draft released

資源描述主要是一屬性以及與相關屬性值的集合。每個屬性皆由一個屬性型別來定義,也就是一個名稱。至於屬性值則可能是字串或數字。從屬性的角度來看,一個 模式包括來源、屬性型別以及屬性值三個成分。RDF較以往的標示更為詳實,因為描述和屬性皆可被視作來源的一種。所以來源皆有其各自的屬性。 RDF的 Schema可宣告特定描述字彙的來源,以用於特定的應用領域。RDF在全球資訊網資源描述上的應用相當廣範。RDF工作小組指出RDF的應用範圍包括網站地圖、資訊內容分級、頻道定義、搜尋引擎資料收集、數位儲存庫彙整、分散式文件製作等。

 RDF的應用

 描述網站、文獻等網路資源為元資料描述資源提供框架,可綜合多種元資料標準利用元資料描述物件資料,可以減少實際應用中網路的傳輸量,節省頻寬用戶使用經過規範過的元資料內容就可以決定物件資料的取捨 RDF以XML為其主機語言,摒棄了SGMI的缺點,顯得簡略、清晰且應用方便,是目前最具發展前景的標記語言。

Metadata(元資料)

 Metadata:元資料(Metadata)最常見的英文定義是 “data about data”,可直譯為描述資料的資料,主要是描述資料屬性的資訊,用來支持如指示儲存位置、資源尋找、文件紀錄、評價、過濾等的功能。傳統使用metadata的例子就是圖書館搜尋系統--亦即舊有目錄卡系統的電子版本。您可以使用此系統尋找想要的書,透過資料轉換搜尋,諸如:書名、作者或主題,協助你更快的找到你想要的書。 就其本義和功能而言,元資料可說是電子式目錄,因為編製目錄的目的,即在描述收藏資料的內容或特色,進而達成協助資料檢索的目的。因此元資料是用來揭示各類型電子文件或檔案的內容和其他特性,其典型的作業環境是電腦網路作業環境。換言之,元資料是因應現代資料處理上的二大挑戰而興起 的:一是電子檔案成為資料的主流,另外一個是網路上大量文件的管理和檢索需求。

國際圖書館協會聯盟(International Federation of Library Association and Institutions,簡稱 IFLA)列舉了以下的元資料種類:

1. Dublin Core

2. EAD(Encoded Archival Description)

3. FGDC's Content Standard for Digital Geospatial Metadata

 4. DIF (Directory Interchange Format)

5. GILS (Government Information Locator Service)

 6. IAFA/whois++ templates

 7. MARC

 8. PICS (Platform for Internet Content Selection)

 9. RDM(Resource Description Messages)

10. SOIF(Summary Object Interchange Format)

11. SHOE(Simple HTML Ontology Extensions)

12. TEI

13. URC(Uniform Resource Characteristics)

14. X3L8 Proposed ANSI standard for data representation

在『Judy And Magda's List of Metadata Initiatives』的網頁中,按類別提出一些經常被廣泛使用或具有潛力的元資料如下︰

1. 通用描述型 -- MARC、Dublin Core、Edinburgh Engineering Virtual Library (EEVL)、Semantic Header for Internet Documents、GILS、URC、X3L8 Proposed ANSI standard for data representation、IAFA Templates、NetFirst、Header for HTML documents、SOIF、MCF(Meta content Format)、PICS。

2. 文字檔描述型 -- TEI、BibTex、Gruber Ontology for Bibliographic Data、RFC 1807。

3. 數據資料類-- ICPSR Data Documentation Initiative、SDSM(Standard for Survey Design and Statistical Methodology Metadata)。

4. 音樂類 -- SMDL(Standard Music Description Language)、

5. 圖像與物件類 -- CDWA(Categories for the Description of Works of Art)、CIMI(Consortium for the Computer Interchange of Museum Information)、VRA Core Categories、MESL Data Dictionary。

6. 地理資料類 -- FGDC's Content Standards for Digital Geospatial Metadata。

7. 檔案保存類 -- EAD、Z39.50 Profile for Access to Digital Collections、Fattahi Prototype Catalogue of Super Records。

RDF 的基本模型 

 RDF 提供基本模型(basic model)來表示來源(resources)的屬性(Properties)與屬性值(Property values),其中包括了4種類型的物件(objects) :

來源(resources)  Subjects

屬性(Properties)  Predicts

屬性值(Properties values)  Objects

來源+屬性+屬性值→  Statements

以一個statement的例子來說

J.K. is the Creator of the Web Page http://www.X.com/JK

  ↓       ↓                   ↓  

Object  Predict            Subject 

    

RDF的表示方法 

RDF MODEL

共有三種方式來表示RDF MODEL(如何來表示meta data)

3-triples

Graph

XML

 3-triples 

3-tuples的表示方法(predict , subject , object)

以剛剛的模型為例

J.K. is the Creator of the Web Page http://www.xx.com/JK

3-triples的表示方法就為:

(Creator , “http:// www.myweb.com/JK”, “J.K. ”)

 Graph 

 XML 

如果一個statementJ.K. is the Creator of the Web Page http://www.myweb.com/JKXML 的表示方法:

<rdf:RDF>

  <rdf:Description about=“http://www.myweb.com/JK”>

  <s:Creator> Seki </s:Creator>

  </rdf:Description>

</rdf:RDF>

RDF 都柏林核心元數據

 都柏林核心是一套供描述文字檔的預定屬性。第一份都柏林核心屬性是於1995年 在俄亥俄州的都柏林的元數據工作组被定義的,目前由都柏林元數據倡議来維護。通过瀏覽下面這個表格,我們可以發現 RDF 是非常適合表示都柏林核心信息的。