語意網簡介2 - 語意網及本體

電腦如何閱讀語意?

第一個要利用資源描述架構( RDF, Resource Description Framework)與通用資源標誌碼(Universal R esource Identifier, URI)連結到相關網頁資源。
這是現在網路上很多已經在用的了。大家用的 HTTP的位址,就是 URI的一種。
很多人除了後設資料以外,也開始用資源描述架構來描述網頁裡的知識內容,要在網路上找到某個特定的資源,完全沒有問題。
我們規定大家用這個方式描述你的知識資源內容,那麼你找到你要的資源,並經由超連結連接到之後,最重要的閱讀重點在哪裡?
是要利用知識本體( Ontology)來定義關鍵詞,並做邏輯推理。

知識本體( Ontology)
每一個網頁,每一個資源上面要有一個自己定義的 Ontology,就是知識本體。
為什麼要這樣做?同一個詞,在不同的領域裡,不同的時代裡,不同的用法上,它的意義就不一樣。
所以,當下網路的搜尋常會發生錯誤。譬如你找一個芥子,那麼也許講的是佛教的「須彌入芥子」,你要講的是佛教的東西,
但你找到的可能是植物的東西,因為它用的是同樣的語詞。

網路並不知道每個網頁資源用的詞屬於哪個領域。所以不但搜尋者必須要定義這個詞代表什麼意義,屬於哪個領域。
在任一個網頁裡面,每一個詞的定義是什麼,代表的知識範圍與架構是什麼,就是這個網頁的知識本體要告訴你的。
所以,如果網頁上所有的資源都有一個宣告,告訴每一部來訪的機器,這個網頁裡面知識的定義是什麼,知識的架構是什麼,
那麼電腦就可以閱讀每個網頁。

知識本體是什麼?它是對任何一個網頁資源知識內容及資訊架構的描述和定義。

 參考資料
中央研究院語言學研究所研究員黃居仁 專題演講