G検定メモ⑦ 意味ネットワーク編


G検定を受ける前に、公式テキストを読んでメモした走り書きがあったので公開するよ。
でもこれまじで走り書きだから何の参考にもならないね。メンゴ。


知識ベースシステム
コンピュータが処理可能な知識ベースを用いて、
知識ベース
・問題解決の対象となる世界における、事実やルールの形式的記述の集合
・何らかの形式で構造化されたデータの集合
・知識ベースシステムにおける推論エンジンを動かすための元となるものの集合
知識ベース
【できること】
・永続性がある
・複製性がある
・推論の一貫性がある(同じ質問にいつも同じ回答ができる)
【できないこと】
・融通性
・柔軟性
・適応性
・創造性

意味ネットワーク
Semantic network 

ラベル付けした「概念(人間や犬、植物など)」と、各概念の間を、is-a関係とpart-of関係でつないだネットワーク。
犬is-a哺乳類、哺乳類is-a動物、肉球part-of足、足part-of犬、などの関係性を記述する。
コンピュータが、概念どうしの関係を理解できるようにしたモデル。

■オントロジー
概念体系を記述するための方法論

オントロジーとは、対象世界を どのように捉えた(概念化した)か?
をコンピュータに理解できる形で体系化したもの

オントロジーの目的
知識の共有と活用が目的

概念間の関係は、is-a関係、part-of関係で記述
part-of関係には、いろいろな種類の関係がある 最低5種類

オントロジーの構築
・ヘビーウェイトオントロジー 重量オントロジー
 記述は哲学的に考察して、綿密な設計の上で行っていく
 人が介在する傾向が強い、時間がかかる、コストもかかる

・ライトウェイトオントロジー 軽量オントロジー
 分類関係の正当性については、深く考えない
 コンピュータで概念間の関係性を自動で見つけよう という取り組みと相性が良い
 →ウェブマイニング、ビッグデータ解析、データマイニング で利用される

オントロジーを使って作成した、ウェブ上の意味ネットワークがセマンティックWeb
それを自由に使うことができるようにした物が、リンクト・オープン・データ

LOD(リンクト・オープン・データ)
ウェブ上でコンピュータ処理に適したデータを公開・共有するための技術の総称
従来のウェブがHTML文書館のハイパーリンクによって人間のための情報空間の構築を目的としてきたことに対応して、LinkedOpenDataでは構造化されたデータ同士をリンクさせる事でコンピュータが利用可能な「データのウェブ」の構築を目指している。