ドキュメント/(8) 型・オントロジー・知識表現
2009年 12月 28日
ドキュメントは知識の容器であり、直接的な用途のほかに多様な可能性を秘めています。それを実現するために、様々なアプローチがなされてきました。技術は往々にして跛行的・間歇的に進化するものですが、ドキュメントはまさにその見本でしょう。大野氏は当初、Lispを使った人工知能研究を通じてインテリジェント・ドキュメントの研究開発に関わりましたが、市場的にはSGML系のXMLが普及したことで、その飽くなき拡張を通じて「意味」に迫るアプローチが主流を占めました。それらがほぼ暗礁に乗り上げた現在、型理論や人間の知識の本質に遡る必要性を説く大野氏の論考は、様々な立場から議論されるべきものでしょう。 (編集部)
ドキュメント技術へのアプローチ―大野邦夫氏による研究・開発の軌跡
目次
2. 製品開発:マルチメディアドキュメントからXML応用システムへ
8. 型、オントロジー、知識表現(本記事)
9. ヒューマン・インタフェース
10. テクニカル・コミュニケーション
8. 型、オントロジー、知識表現
SGMLのDTDは、文書型定義 (Document Type Definition)と訳されるが、その概念は個人的には不満であった。型を名乗るなら、論理型、整数型や文字型のようなデータ型を包含し拡張されるべきであろう。そのような型は、オブジェクト指向のクラスである。従って文書型はクラスの木構造拡張として定義されるべきである。現にインターリーフ社は、Interleaf Lispのオブジェクト指向拡張のクラスとして文書とその要素を管理していた。
DTDにおける文書の型は、木構造の要素管理のための要素名称の関係と属性と参照を管理する。DSSSLは、DTDで定義される構造をページレイアウト表現に構造変換する機構であるが、Interleafはブックカタログという機能でそれを実用的に実現しており、Interleaf Lispは、構造のナビゲーションとレイアウトのナビゲーションの双方の操作をメソッドとしてサポートしていた。それらのメソッドは、get-first-child, get-last-child, get-previous, get-next, get-parentという5方向のナビゲーションをサポートするものであった。
そのようなことを考えていたら、DOMの仕様が固まった。まさに上記のナビゲーションがサポートされている。しかもCORBAのIDLで定義されている。これは面白いことになりつつある、と思った。DTDに代わるべきXML Schemaは、データ型を定義するとのことなので、DOMに準拠するCORBAのIDL型になるのかと思ったのであるが、そうはならなかった。XMLカンファレンスで機会があったのでW3CのDOM-WGの議長であったローレン・ウッド女史にそのことを尋ねたら、CORBAのIDLによる記述はDOM-WGが多様な言語へのAPIを決めるための便宜的なもので、データ型の議論は無関係とのことであった。
そのような状況下で、文書に関係しそうな型概念について随想的に書いたのが下記の論文である。
この論文には、意外にも興味を持ってくれた人がいて、Webサイトで好意的に紹介されたりした。そのような経緯からか情報処理学会から山下賞をいただいた。
文書の型の議論としては、意味の領域へのアプローチが課題となる。オブジェクト指向のクラスは、概念としての一般名詞に相当する。そのインスタンスが固有名を持てば固有名詞である。形容詞は属性であり、動詞はメソッドである。そのように考えると、自然言語はオブジェクト指向的である。人間の情報伝達行動をモデル化することを考え、プログラミング言語でシミュレートする試みがKQML (Knowledge Query and Manipulation Language)である。このモデルは発話行為理論 (Speech Act Theory)に基づいている。さらに通信行為 (Communicative Act)というような意味的なカテゴリーを設定し、個々のカテゴリーに関連する詳細な意味的用語群をオントロジーとして扱う、拡張可能な興味深い言語であった。
KQMLでは、オントロジーはS式に基づくKIF (Knowledge Information Format)で表現されたが、それをXMLの世界に拡張する試みをエージェント技術のコンソーシアムであるFIPAが行ないACL (Agent Communication Language)として標準化を試みた。その状況を紹介したのが下記の報告である。
XMLによるオントロジー記述は、FIPAを含むエージェント技術の関係者により試みられ、米国ではDAML (DARPA Agent Markup Language)、欧州ではOIL (OntologyInference Layer)といった言語が試みられた。この流れがXMLによるオントロジー記述の流れを形成し、セマンティックWebへの期待に結びつきXML 2000におけるティム・バーナーズ=リーの講演になったと考えられる。
セマンティックWebの可能性を考えるにあたり、かつてのAIにおける知識ベースとの対比で考察してみた。エキスパートシステムの失敗は、知識ベースの構築と維持管理を、スキルのある個人が担当せねばならない点にあった。知識ベースの構築と維持管理を、自動化またはルーチンワーク的な作業として行わせるメカニズムを提供させることがエキスパートシステム普及への課題であったが、それが解決できなかったのでエキスパートシステムは普及しなかった。セマンティックWebがその問題を解決できるか否かが課題である。
知識ベースのXML記述としてのWebオントロジーの構築と維持管理を、自動化またはルーチンワーク的な作業として行わせるメカニズムを提供させることがキーになるが、XML 2000におけるティム・バーナーズ=リーの講演からは、その可能性を感じることはできなかった。だがWebが確実に進化することだけは間違いない。その方向を的確に予測することが求められていた。
その方向性は、1940年代以降のコンピュータの発達が鍵を握ると考えた。1940年代のコンピュータは2進法の世界であった。1950年代になって、FORTRANによる科学技術計算に用いられるようになり、工学分野での必須の道具になった。1960年代にはCOBOLによって事務処理にコンピュータが導入され、英数字による計算や文書処理に使われるようになった。1970年代になると、JISの漢字コードが決められて日本語の世界でもコンピュータが自由に使えるようになった。1980年代になると、XeroxのStarやAppleのMacintoshによるGUI革命が起こった。コマンドラインによる操作ではなく、マウスとウインドウシステムによりメニューやデスクトップ上の情報を選択すれば良くなった。さらに扱う情報も従来の数字や文字だけでなく、図形や画像が可能となり、一般の印刷文書の情報が自由に扱えるようになったのである。そのような技術進歩を背景に、1990年代にはDTP (Desk Top Publishing) システムが普及し、印刷出版業界のみならずオフィスの文書作成がコンピュータによる文字・図形・画像の領域に発展した。
以上の2進、数字、英数、漢字、図形、画像、マルチメディアというコンピュータが扱う情報メディアの進展は、コンピュータの出力が人間にとって分かりやすく認知し易い情報の提供へという流れを形成してきた。このことはユーザーフレンドリーとか、コンピュータの人間への接近というような言葉で語られたこともある。だがこの流れは、人類が認知してきた情報メディアとは逆の流れである。すなわち、類人猿に近いジェスチャや叫び声の時代がマルチメディアに、アルタミラやラスコーの洞窟壁画が画像に、ヒエログリフのような象形文字が図形に、表意文字が漢字に、表音文字が英数に、数式が数字に、近代論理学が2進データに対応付けられないかということを思いついたのである。要するにコンピュータにおける情報メディアの推移と人類における情報メディアの推移は対称になっていることの発見である。何故対称なのか。それは単なる偶然か、それとも必然か。もし必然と考えると今後のコンピュータが扱う情報メディアの予測が可能ではないか。そのアイデアを考察したのが下記の論文である。
詳細は論文を見て頂くこととして、必然性を想定・考察し、それはデータ型の拡張方法に関係しているというのがこの論文の趣旨である。この内容を、SAINTというメタデータ関連を扱ってくれるカンファレンスに投稿するために英訳したが、それをさらにDD研向けに改訂したのが下記の論文である。
8-4. “Digital Content Types based on Information Media Symmetry”
上記の2論文の帰結として、今後のWebが包含する二つの異なる方向性を提示した。その一つはセマンティックWebであり、情報の分析的なアプローチである。他の方向性は映像・音声をコンテンツとするマルチメディアWebであり、情報の統合的なアプローチである。情報メディアの対称性の観点からは、今後のWebの方向はマルチメディアWebである。しかし多様なマルチメディア・コンテンツを分類し個々の利用者が活用しやすくするためには、分析的なアプローチが必要となる。分析的なアプローチのためには検索に便利な情報としてのメタデータや、その系統的な関係を記述するオントロジーがキーテクノロジーとなる。だが、データ発生の都度、メタデータやオントロジーを人間が記述し編集するのでは実用システムの構築は不可能である。そのための好都合なデバイスとして携帯電話の可能性について論じたのが下記の論文ある。
8-5. 「セマンティックWebの課題と携帯電話から見た可能性」
この論文は、先にPIM(個人情報管理)の項目で紹介したので、その記述も参考にしていただけると幸いである。
以上の情報メディアの対称性、セマンティックWeb、Webオントロジー言語、携帯電話の可能性等の問題を総合し、包括的にオントロジー全般について考察したのが下記の論文である。
この論文の参考文献を見ていただくと分かるとおり、この分野は技術のみならず、論理分析哲学が関わってくる。論理分析哲学というと、ラッセルやヴィトゲンシュタインの名前が思い浮かぶが、オントロジーは彼らが論じた分野を、コンピュータを相手に再構築しているように思われる。従って、人間とコンピュータの類似点と相違点は何かを考えさせられる分野である。
チョムスキーは、人間が話す言語は基本的に同一であると言う。発話者は深層の意味構造を縦列に変換して自然言語として表層レベルで伝達し、受話者はそれを深層に変換して自分のの意味構造を編集・改訂する。事物の理解とは意味構造の編集・改訂プロセスであろう。プログラミング言語は、人間とコンピュータ間のコミュニケーション言語である。プログラミング言語も、チョムスキー的に考えると基本的には同一である。人間の深層意味構造とノイマン型コンピュータのCPUを経由した記憶装置間の表層レベルの言語である。然らば深層構造とは何かが問題である。
人工知能は、深層構造のシミュレートであろう。知識工学の世界に定性的推論という分野があり、初歩的な物理学をコンピュータが知識として構築する領域があった。オントロジーの語源はこの分野であったと思う。当時に比べてこの深層構造のシミュレートがどの程度進展したかを考えさせられる。NTTが開発したLisp方言のTAOは、マルチパラダイムという言い方で、オブジェクト指向プログラミングとロジック・プログラミングをS式レベルで統合した。クラスの多重継承と述語論理による推論を行うことが可能で論理メソッド定義が可能であった。論理変数の継承とスコープといった厄介な問題があり必ずしも実用的とは言えなかったが、木構造とパタン照合を同居させることが深層構造としての人間の知識をシミュレートするための要件となることを示唆したものであった。
エキスパートシステム開発ツールにおける知識ベースはフレームとルールから構成される。フレームが木構造を代表し、ルールがパタン照合を代表するという見方が可能である。それがXMLになってどう変わったかが問題である。XMLはインスタンスとしての木構造記述言語であり、RDFはトリプレットの命題記述言語である。そのように考えると、木構造とパタン照合の潜在的な構造はXMLの世界で具備できている。さらにRDFスキーマはクラス定義が可能なので、集合論的な概念記述も可能である。そのことからRDFの世界は知識ベースの世界になると期待していた。その成果として期待されたOWLは、意味概念的な木構造の継承をクラスで、クラス間の相互的な関係をプロパティで実現するXML用語と考えることが可能である。OWLを知識ベースとする多様な推論処理系が期待されたが、Jena程度しか一般化していない。XMLに対する懸念と批判を抱きながら職業大に来たのだが、Jenaですら卒業研究の学生にとっては敷居が高くて使いこなせなかった。対抗手段としてCommon Lispを使ってみて、CLOSによるクラス定義の簡潔さと容易さ、論理変数を使うパタン照合機能のコンパクトさに印象付けられた。ぜい肉だらけで冗長になったXMLに比べてコンパクトで融通性の高いLispのS式のメリットを改めて実感した。オッカムの剃刀の譬えのとおり、真理はコンパクトであり冗長性を排除することを要求する。XMLを用いるオントロジーは極めて厳しい状況にあると思われる。
まとめ:定性的推論分野においてオントロジーという用語が登場して20年、エージェント通信言語やセマンティックWebを目指してXMLによるオントロジー記述が試みられてから10年になるが、実用的なシステムの構築は未だに実現されていない。20世紀初頭にラッセルは”Principles of Mathematics”で論理的原子の世界を提案し、パラドックスで躓き、晩年の”Human Knowledge”で人間の知識は不確実で不完全であることを述べた。ヴィトゲンシュタインは論理的原子と類似のアプローチで世界の論理的記述について「論考」で試みたが、その後人間が語る論理は言語ゲームに過ぎないと語った。ゲーデルは不完全性定理で世界の論理記述についての矛盾と限界を指摘した。
以上は人間の論理的思考の限界を示唆すると共に、西洋哲学が対象としてきた全知全能で遍在する唯一神の存在への疑問を投げ掛けるものであろう。オントロジーの起源を遡ると中世の普遍論争に到達する。普遍概念の実在を主張する実念論と、普遍概念は実在せず名前にすぎない、とする唯名論の対立が繰り広げられ、前者はトマス・アクイナスのカトリック神学に、後者は懐疑主義のイギリス経験論へと引き継がれた。メディア論のマーシャル・マクルーハンがカトリック的背景を持ち、懐疑論者のラッセルがイギリス経験論に立脚することを考えると、マルチメディアWebとセマンティックWebの方向性も、その端緒は中世の普遍論争にまで遡ると言える。人間の知識は不確実で不完全であり、論理的厳密さを要求するコンピュータとの相性は良好ではない。 (大野邦夫 k-ohno@uitec.ac.jp)
著者紹介:大野 邦夫 (おおの くにお) 経歴はこちら
[略歴] 1968年、東京工業大学工学部機械工学科卒業、70年同大学大学院修士課程機械工学専攻修了、電電公社(現NTT)に就職。電気通信研究所、米国ウイス コンシン大学マジソン校派遣、横須賀研究所、NTTインテリジェントテクノロジ(株)、ヒューマンインタフェース研究所などに在籍。95年にNTTを退 職、グループ企業のINSエンジニアリング(株)*に転籍(*2000年にドコモ・システムズと社名変更)。同社退職後、(株)ジャストシステムに移り、 主にxfyに関わる標準化とその関連技術の調査を担当した。2007年から職業能力開発総合大学校通信システム工学科教授。現在に至る。








