各分野で取り扱われるデータは多次元であることが多い. また, データごとの特徴などの予備知識が ない中で, その分類や特徴の抽出をデータマイニングする際や, 音声などのパターン認識を行う際には様々な手法が利用されている. 自己組織化マップもそのような手法の1つであり, 教師なし競合学習のアルゴリズムを持つ, フィードフォワード型の ニューラルネットワークである. 本報告では, この自己組織化マップの基礎的な概要について述べる.
自己組織化マップ(Self-Organizing Maps, 以下SOM)とは, Kohonenによって開発された大脳皮質の神経機能をモデル化したニューラルネットワークである.
ニューラルネットワークとは, 人間の脳の仕組みを模倣した情報処理機構である. ニューロンの基本的なモデルは次式で表される.
|
SOMは階層型ニューラルネットワークの一種であり, Fig.1 に示すように, 2層のネットワークである. 第1層はn次元の入力層x(t)であり, 第2層は競合層と呼ばれ, 出力を視覚的に見るため一般的に2次元配列となっている. 競合層のベクトルは, 参照ベクトルmi(t)で表現され, 入力層のn次元と同様にn個の要素を持つ.
SOMの学習は教師なし競合学習である. SOMでは学習にユークリッド距離を用いる. 学習のステップはFig.2 のようになる.
|
|
|
|
SOMはその特徴からデータマイニングツールとして, また多次元データの可視化手法として様々な分野で利用されている. 例えば, 化学分析分野において定性分析や定量分析, 大量のデータからの未知の組成の同定, 特徴抽出などがある. 可視化手法としては, 多次元のデータを2次元に射影できることから, 多目的最適化問題のパレート解の分類への利用などがなされている. その他にも, 人事適正配置問題や, 巡回セールスマン問題(TSP)などに対する最適化手法としても利用されることがある.
SOMには, 改善の加えられた多くの手法が存在する. 代表的なものとしては, SOMが教師なしのニューラルネットワークであったのに対し, 教師ありにしたものがLVQであり, パターン認識などに用いられている. その他に, 学習順序に依存する性質を改善したバッチラーニングSOM (Batch Lerning SOM, BL-SOM)や, 非ベクトルなデータへの応用が可能な中央値SOM (Median SOM), 球面上にマッピングを行う球面SOM (Spherical SOM)などがある.
SOMを利用することで, 多次元のデータを2次元に可視化することが可能である. その例として, 16種類の動物を16次元の属性で区別した結果にSOMを適用する. 各属性には程度によって0から1の数値を与え, 各動物は16次元の入力ベクトルを持つことになる. これを無料配布されているSOMに利用できるパッケージSOM_PAKを利用して, 10×10の2次元ニューロンユニットを持つSOMに射影した. なお, 今回適用したデータはTable 1 に示すとおりである.
| 属性1 | 属性2 | 属性3 | 属性4 | 属性5 | 属性6 | 属性7 | 属性8 | 属性9 | 属性10 | 属性11 | 属性12 | 属性13 | 属性14 | 属性15 | 属性16 | |
| 名前 | 小さい | 中ぐらい | 大きい | 夜行性 | 2本足 | 4本足 | 髪を持つ | 有蹄類 | たてがみ | 羽根あり | 縞あり | 狩猟 | 走る | 飛ぶ | 泳ぐ | 草食性 |
| dove(ハト) | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0.5 |
| fox(キツネ) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0.5 |
| hen(メンドリ) | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0.3 | 0 | 0 | 1 | 1 | 0.5 |
| lion(ライオン) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0.5 |
| goose(ガチョウ) | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 |
| eagle(ワシ) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 1 | 0 | 0 |
| dog(イヌ) | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 0 | 0 | 0 | 0 |
| wolf(オオカミ) | 0 | 1 | 0 | 0.5 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
| zebra(シマウマ) | 0 | 1 | 0 | 0 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
| duck(アヒル) | 1 | 1 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 0 |
| cat(ネコ) | 1 | 0 | 0 | 0.5 | 0 | 1 | 1 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |
| owl(フクロウ) | 1 | 0 | 1 | 0.5 | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 |
| tiger(トラ) | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 0 | 0 | 0 |
| horse(ウマ) | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 |
| hawk(タカ) | 1 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 0 | 1 |
| cow(ウシ) | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
SOM_PAKの利用手順は次のとおりである.
Fig.3 にSOM学習前のマップの初期状態を示し, Fig.4 にSOM学習後の最終状態のマップを示す. 学習前のマップと学習後のマップを比較すると, 明らかに学習後のマップは動物の特徴による分類がなされている. 例えば, 左上にはウシ・シマウマ・ウマなど草食動物が, 右側には鳥類が, 中央にはイヌとオオカミなど, 比較的種類として似ている動物が近くに集まっていることがわかる. このように, 大きさや食べ物など様々な特徴を入力ベクトルとして与えるだけで, 分類をかなり正確に行い, 可視化できるのがSOMの特徴である.
Fig.5 にSOM学習後のサモンマップを示す. サモンマップを見てもわかるように, 右側に鳥類, 左側の中央にはトラやライオンなど肉食動物が集まるなど, 似た特徴を持ったものが近く存在し, その類似度が高いほど, 距離が短いことが分かる.
また, Fig.6 , Fig.7 , Fig.8 にそれぞれ属性1, 属性4, 属性16の属性値のマップを示す. 属性1は小さいかどうかを示す値であり, 小さい動物ほど白に近く, 大きい動物ほど黒に近くなる. ネコや鳥類などが小さいので白に近い色で示されている. 属性4は夜行性であるかどうかを示す値である. オオカミを筆頭に, キツネ, フクロウなど夜行性の動物が白に近い色で示されている. 属性16は草食性があるかどうかを示す値である. ウマやウシなど草食の動物は白に近く, 鳥類のうち草食でも肉食でもある動物はグレーで示されている. このような属性値のマップはすべての属性に対して生成することが出来, それらを比較することで, 属性同士の関連性などを検討することが可能である.
本報告では, 教師なし競合学習を行うニューラルネットワークであるSOMについて調査し報告した. SOMは多次元データを2次元平面に射影し可視化することが可能であり, 類似するデータを近くにマッピングすることから, クラスタリング手法としても利用されている. これより, SOMを利用して多目的最適化のパレート解の可視化や, また数多くの目的関数値と設計変数値との関連性の発見などに利用したい. 次回報告では, 球面上にマッピングを行う球面SOMについて調査を行う予定である.
Copyright (C) 2005 Tomoyuki Hiroyasu, All rights reserved. Copyright (C) 2005 Mitsunori Miki, All rights reserved. Copyright (C) 2005 Fuyuko Ito, All rights reserved. No part of this document may be reproduced, copied, distributed, transferred, modified, or transmitted, in any form or by any means, without the prior written permission of the authors. In no event shall the authors be liable for any damages caused in any way out of the use of this document.