タンパク質を解くプログラム作成と基礎勉強

吉田 武史

2002 / 6 / 26(Wed)


■ 今週の研究内容

■GECCO2002の準備

 2002/7/9に開催されるGenetic and Evolutionary Computation Conference2002 (Gecco2002)の「Biological Application of Genetic and Evolutionary Computation」で発表を行うPowerPointを作成した.このPowerpointの概要(2002/6/25現在)を以下に示す.

発表タイトル Energy Minimization of Protein Tertiary Structure
by Parallel Simulated Annealing using Genetic Crossover
著者名 Takeshi Yoshida, Tomoyuki hiroyasu, Mitsunori Miki, Maki Ogura, Yuko Okamoto
Download 原稿[80KB] PowerPoint[1.6MB]
PowerPoint概要 各スライドのタイトルと内容を示す
1)Background : 背景
2)Protein Tertiary Structure : タンパク質の立体構造
3)Simulated Annealing : シミュレーテッドアニーリングについて
4)Energy function of Protein : タンパク質のエネルギー関数の特徴について
5)Purpose of this study : タンパク質を解くハイブリッド手法,PSA/GAcの提案
6)Modeling of Protein tertiary structure : 立体構造のモデル化
7)PSA/GAc : PSA/GAcのアルゴリズム説明(1)
8)PSA/GAc : PSA/GAcにおけるGenetic crossoverについて
9)PSA/GAc : PSA/GAcのアルゴリズム説明(2)
10)Target Protein Structures : 本研究で対象としたタンパク質について
11)Parameters : 実験で用いたパラメータと実験方法
12)Result : Energy : 各試行におけるエネルギー値の比較
13)Result : Protein structure : 各試行で得られたタンパク質の立体構造
14)Conclusion : まとめと結論

■ SMCチュニジアの論文作成

2002/10/6-9に開催されるIEEE International Conference on Systems, Man and Cyberneticsに投稿する論文を作成した.以下に詳細を示す.

発表タイトル Parallel Simulated Annealing with Adaptive Temperature
Determined by Genetic Algorithm
著者名 Mitsunori Miki, Tomoyuki Hiroyasu, Takeshi Yoshida, Toshihiko Fushimi
Download 原稿[452KB]
原稿概要 原稿に示した内容を示す

1)SAをTSPに適用した際に解探索を効率的に行える重要温度領域が存在する

2)重要温度領域での解探索では,解が局所解に陥ることなく,良好な解精度の範囲で推移する

3)GA操作を用いて,適応的に温度調節を行う並列SA(PSA/AT)のアルゴリズム説明

4)PSA/ATを用いて数値実験を行い,有効性を示す

■今週の文献調査

今週調査した文献,および概要を以下に示す.

Title モンテカルロシミュレーションによるタンパク質の立体構造予測
著者 岡本祐幸 出典 生物物理 1998

-1節 はじめに-
本節ではタンパク質の立体構造予測に関する歴史や分野,また研究の方法を紹介している.ひとえにタンパク質の立体構造予測といっても,中身は二つに分けられる.まず一つ目がタンパク質の自然の立体構造をそのアミノ酸配列およびタンパク質分子を取り巻く環境因子の情報のみから予測する,第一原理からの立体構造予測で,もう一方が,立体構造がどのような物理的原理や機構によって構築されるかを理解しようとするタンパク質の折り畳み問題である.
 これらを理論的に研究する方法は3種あり,1つは「物理学的手法」で,これはエネルギー関数をできるだけ簡略化した最小模型に基づいた理論である.2つ目は「分子科学的手法」で,全模型にミクロの詳細を取り入れたエネルギー関数によるものである.この方法は計算時間が膨大であるが,精度がよい.最後が「博物学的手法」で,これはデータベースを元にして,未知の構造をアミノ酸配列の情報から予測しようというものである.
 この文献では,立体構造予測問題と折り畳み問題の両方を同時に扱える分子科学的手法に基づいて研究を行っている.

-2節 タンパク質の系のエネルギー関数とシミュレーション法-
本節において,タンパク質の立体構造予測に成功するためには系の正確なエネルギー関数を用いること,エネルギーの極小状態に陥らない強力なシミュレーション法が必要であるとされている.
 系全体のエネルギー関数Etotはタンパク質分子の構造エネルギーEpとその溶媒和自由エネルギーEsの和で与えられるとしており,この研究ではECEPP/2によるEpと予備実験で得られたEsが用いられている.
 シミュレーション法に関しては徐冷法(simulated annealing)と拡張アンサンブル法(generalized-ensemble algorithms)が紹介されている.

-3節 結果-
SA法とマルチカノニカル法を4つのタンパク質(met-enkephalin, c-peptide, PTH(1-37), streptococcal protein G)に適用した結果を示している.他の研究者による方法との比較がなく,どれだけの精度かは確認できていないが,この論文の結果では,いずれものタンパク質の立体構造をある程度予測できている.

■SAのタンパク質への適用

タンパク質を対象問題としたSAの実装,および実験を行った.Table. 1に用いたパラメータ,Table. 2に30試行の平均と中央値,そして対象問題の最適解を示す.また,Fig. 1では解の推移を示す.Fig. 1の横軸はステップ数,縦軸はエネルギー値(kilo calory/mol)を示す.またFig. 1では,その試行でのベストの解推移とMCsweepごとの解の推移を示す.

Table1 実験で用いたパラメータ
対象問題 Met-enkephalin
設計変数(2面角の数) 19
最適解 -11kcal/mol 以下
総ステップ数(MCsweep) 6000
初期温度 2.00
冷却率 0.99
近傍(変動させる角度) 180

Table2 実験結果

試行回数 30
平均値 -8.201
中央値 -7.943
最良値 -12.071
最悪値 -5.564
最適解発見率 0.16(5/30)

Fig.1 SAを適用した時のエネルギー推移

今回のSAではあまり良好な結果を得ることができなかった.改良するためには近傍の幅を変動させるなどの方法が考えられるが,これまでの研究より逐次SAの限界なのかもしれない.この点に関しては,今後の検討事項とする.また以上の結果,および独自のプログラムチェックより,今回作成したSAプログラムが正確に動作していると考えられる.
■今後の課題
■三木先生への報告(結果)

本日(2002/6/26),三木先生を交えたタンパク質班研究ミーティングを行った.以下に私に関する討議概要を報告する


Research Report@Protein Group