ここでは,知的化グループの概要についてもう少し詳しく説明します.
研究内容 | |
システムの性能,ユーザの利便性,環境親和性を向上させるためには知能が必要である.特に,自動車,飛行機,家電製品には知能を持った賢い機器が多く存在している.このような知能を持つ製品は従来の製品と比べて自律的に動作するため,人間にとってより快適で便利な機能を提供してくれる.知的化グループではこのような賢い機器を知的人工物と呼び,実際に知的なシステムの構築・設計を行っている. 知的人工物とは,「外部環境をセンスし,その情報を基に人工物の機能や性能を最適化する計画を立て,それに沿って動作する人工物」である.その為には,知的人工物は利用者を含む広義の環境条件の変化に対応して人工物自身のパラメータを自律的に変化させるために,Sence ,Judge ,Act の構造を持つ(図1).これによりこれまでの人工物では環境(使用者および外部環境)に負荷がかかっていたものを,知的人工物は負荷ができるだけ少なくなるように環境に合わせて変化することができる.(図2) |
図1 : Sense,Judge,Act の構造
図2 : 知的人工物のコンセプト
知的システムの構築例 | ||
集中型システムから分散型システムへ | ||
従来のシステムの研究は,主に機能や性能の向上を目的としていた.しかし,今日,システムの大規模化やオンライン・リアルタイム化などに伴い,頻繁に故障・拡張・保守などが起きるようになった.そのため,システムに求められるニーズが,システムの無停止,柔軟性,保守性へと変わった.ゆえに,従来の管理・制御・動作を一貫して行う集中型システムでは,そのニーズを充分に果たすことができなくなってきた.そこで,これらの問題を解決するのに有望なものが自律分散システムである. | ||
学習作用の取り入れ | ||
システムにおいて,学習を用いず判断基準をあらかじめ設計者が与えておく場合,利用する環境が変化する度に,その判断基準を設計者が直接変更しなければならず,手間がかかる.しかし,Q-Learningのような強化学習を用いて,自律的に判断基準を生成するようなシステムでは,環境が変化しても学習を再び行うことで対応できる. Q-Learningは強化学習の一分野である.Q-Learningでは,状態と行動の対をセットにして考え,それに対する評価を見積もる.この評価値をQ値と呼び,ある状態において,任意の行動が選択されたときに,定められた更新式によって,Q値は更新される.更新される際の報酬については目標となる状態に到達したときにおいてのみ与えられる.(図3) |
知的照明 | ||
知的照明システムは個々の機器がネットワークに接続され,ネットワークに与えた「人がいるところをX[lx]の明るさにせよ」という共通の目的に従って動作する.各々の機器が協調動作するわけではないが,各々が各自獲得した判断基準を用いて自律的に行動することで,一部の照明機器が故障した場合でお膳対として最適な方向へ進んでいく. このシステムでは,状態として扱うのは人のいる地点の照度[lx]である.行動として,各照明機器がその光度を上下させて変化させる.人のいる位置の情報,その地点の明るさは上にある照明が感知しており,Q値の更新は各ステップにおいて行われる.設定された目標状態(一定の照度+−誤差)に達すると報酬が与えられる. |
知的照明のSense,Judge,Actの構造
知的信号機 | ||
事故発生に伴う渋滞などを除いた一般道路における渋滞は,その発生箇所のほとんどが交差点や合流部であり,交差点における交通管理の役割を果たす交通信号機が渋滞解消のために大きな影響を与えている.知的信号機は,自律分散システムを交通管理最適化の分野に取り入れ,それぞれの信号が渋滞を解消する方向に進み,結果として全体の渋滞が解消される. 知的信号機は交差点単位の累積交通量,つまり,一つの交差点全体で何台の車が渋滞になっているかを累積させ,それを状態として扱う.また,行動としては,サイクル値(信号が一周する時間)と,スプリット値(主道路と従道路の青信号の割合)を変更するQ値の更新は,nステップに一回行い,その際に渋滞が0であるときと,6台以上あった渋滞が減ったときに,特定の報酬を与えるものとする. |
知的信号機のSense,Jucge,Actの構造
Top Page |