水曜4限に確定しました。
今のところ、以下のような日程を予定していますが、進度に応じて、日程を変更する可能性があります。
2015-6追記
隔年で、下のような講義形式と、Python言語演習を行っています。2015年度はPython演習の年です。
また、講義形式の年は、もうすこし講義内容を圧縮し、論文紹介の時間を増やす方向になりつつあります。
追記ここまで
- 履修登録をしていない人、スタッフの聴講も歓迎します。毎回別の話題なので、興味のある話だけ聞きに来てもらっても構いません。
- 質問も大いに歓迎します。
概要
第1回(2011-4-14) 複雑系化学とは何か
これからの科学は、コンピュータや望遠鏡やDNAシーケンサやその他の自動機械が生成する大量のデータと向きあわなければいけません。科学が扱う対象のうち、単純簡潔で美しい理論でモデル化できるような事柄はわずかです。残りの大部分の、人間にとっては複雑すぎるが、かといって放置できない問題にいかに立ち向かうか、を主題に、主にコンピュータシミュレーションにまつわる話題をとりあげていこうと思います。
- シミュレーションからは莫大な量の情報が得られる。面白い問題は、図と地が分けがたい現象。
- コンピュータの進歩は日進月歩。 性能は指数関数的に増大し、扱う対象はどんどん複雑になっていく。シミュレーションは膨大なデータを吐き、どの研究分野でも、大量のデータを相手にするようになって、かえって理解を妨げる危険性がある。
- 一方で、コンピュータの分析能力も高まっていく。量を集めれば質が生まれることもある。コンピュータを駆使し、人間はひとつメタなレベルを追究しよう。人力ではできないレベルのことを実現しよう。そのために、今コンピュータで何ができるかを勉強しよう。ひらめきは大切だが、ひらめきはある程度機械で置きかえられる。
- これからの科学は、複雑なために規則性を見付けて、容易には判らなくなるかもしれない。科学は博物学に回帰していくと思われる。それを嫌って、単純な規則で表現できるものだけを追究するという立場もあるだろう。だが、むしろ今の時点でわかる範囲を広げ、将来だれかが単純な規則を見付けるのを期待すべきではないか。
- 参考資料
第2回(2011-4-20) パターンと相関
シミュレーションを行い、アニメーションを眺めていると、乱雑に動く分子の動きの中に、何となく規則性を見付けだせることがあります。このような規則性=パターンを見付け出しやすい人のことを、勘の良い人と言ったりしますが、もし、本当にそこにパターンが実在するのであれば、勘が良くなくても、人間じゃなくてもコンピュータでも、そのパターンは取り出せるはずです(さもなければただの勘違い)。人の直感に頼らず、パターンを見付けだす方法について語ります。
第3回(2011-4-27,5-11) ランダムネス
パターンの裏返しは乱雑です。しかし、パターンがあるように勘違いするケースと同様、乱雑と思っていたものの中に実は規則性があるかもしれません。乱雑に見えるものが本当に乱雑かどうか、どうしてわかるでしょうか? 液体や気体の中の分子の運動は、本当に乱雑なんでしょうか?
今回は、フーリエ変換について特に詳しく説明する予定なので、もしかしたら1回で終わらないかもしれません。
- フーリエ変換ノート (2011-5-10差し替えました)
- ホワイトノイズ (無圧縮WAV形式)
- ブラウンノイズ (無圧縮WAV形式)
- ピンクノイズ、 1/f^1.3 (無圧縮WAV形式)
- ピンクノイズ、 1/f (無圧縮AIFF形式)
第4回(2011-5-18) モデリング
自由度(パラメータ)が多すぎて手におえないデータを、簡単な式にあてはめて見通しを良くすることをモデル化と言います。モデルは簡単すぎても複雑すぎても役に立ちません。また、同じ現象に対して、いくつもの異なったモデルを作ることができるという点で、モデルは多分に主観的なものです。でも、主観に基いて各自が勝手気儘にモデルを作っていたのでは、研究の客観性が失われてしまいます。モデルの良し悪しはどうやって評価すればいいでしょうか。
第5回(2011-5-18) データの布置
人間は3次元よりも高次元の立体をイメージすることはできません。一方、シミュレーションが生みだす生データは超高次元です。3次元であればパターンを見付けだせる人でも、超高次元のデータの中のパターンを探すのは困難でしょう。また、やみくもにパターンマッチングや相関解析を行っても、運よくパターンにたどりつけることはまずなさそうです。多次元のデータを、低次元にうまく射影して、特徴を把みやすくする方法を語ります。
- 大阪市営地下鉄の料金表から路線図を布置する試作プログラムとデータ(NodeBox)
第6回(2011-5-25) グラフ理論
水は水素結合でつながった3次元ネットワークを持ち、これが水の性質を支配しています。また、炭素やケイ素を含む物質は、共有結合でできたネットワークを持っています。また、化学反応のネットワーク、エネルギー極小を結ぶネットワークなど、現実の物質のネットワーク以外にも、化学でネットワークの考え方が利用できるケースは数多くあります。このようなネットワークの構造を分析する際に、グラフ理論を知っているといろいろ便利なことがあります。今回はグラフ理論の基本を語ります。
第7回(2011-5-25) データベース
分類したデータを保存するソフトウェアを、データベースと呼びます。データベースの機能、性質を知っていると、膨大な量のデータをすばやく処理し利用することができます。今回は、データベースの基本を語ります。
第8回(2011-6-8) カテゴライズ
「分かる」とは、「分けることができる」という意味です。シミュレーションで得られる大量の情報の中に類似性を見出し、いくつかの分類に分けることができれば、そこでおこっていることが分かりやすくなります。今回は、データを分類する方法について語ります。
- GMMの試作プログラム(NodeBox用)
第9回(2011-6-15) 逆問題
原因があってどんな結果がでるかを調べるのを、通常の問題(順問題)と呼ぶなら、逆問題はその逆、つまり結果を見て原因を推定することを指します。例えば、X線を物体に当てて回折像を得るのを順問題とすると、逆問題は、回折像から物体の構造を推定することです。逆問題は、解くのが難しいものが多いのですが、逆問題が解けると、新しい学問分野ができるぐらいの大きなインパクトをもたらすことがあるので、チャレンジしがいがあります。コンピュータを使って、これまでにどんな逆問題が解かれてきたかを語ります。
第10回(2011-6-29) 計算幾何学
コンピュータの中で3次元構造を扱う学問分野を計算幾何学と言います。3Dのゲームを作る際には必須の知識ですが、シミュレーションの解析でも、計算幾何学は非常に強力なツールです。今回は、計算幾何学のテーマの中でも、分子シミュレーションに特に関係の深い、凸包とヴォロノイ多面体について語ります。
- サンプルプログラム
第11回(2011-7-6) パーコレーション
小さなモノマーが互いに確率的に結合を作ることで、突然巨大なネットワーク=ゲルができることがあります。このような現象を説明するモデルとして、パーコレーション理論が考えだされました。分子集団の挙動(構造、運動)を理解する際には、パーコレーションモデルの性質を知っていないと、誤った解釈を導く場合があります。今回はパーコレーションモデルについて語ります。
第12回(2011-7-13) 確率論と情報理論
情報理論は、確率統計を扱う学問であり、統計力学もまた、確率統計を扱う学問ですが、統計力学の講義の中では、情報理論は一切出てきません。せいぜい、情報エントロピーと、熱力学エントロピーの類似性が話題になる程度です。しかし、情報理論は、シミュレーションのデータを分析したり、システム内でおこる現象の因果関係を見付けだしたり、モデルを簡約化したり、分子を設計したり、様々な用途があります。そこで、今回は、情報理論と確率論にまつわる、いろんな話題について語ります。
第11.5回(日程未定) 時系列データの処理
第13回(日程未定) 組合せ最適化
第14回(日程未定) 計量
2つのもの(分子配置、結晶構造、クラスタの形、etc.)を比べた時に、それらが同じか、異なるかを調べるだけでは、1ビット分の情報しか得られませんが、違いの大きさ=距離を数値化できれば、地図を描き、世界を俯瞰し、データの欠けている部分を予測できるようになります。今回は、分子集団の構造の違いを表現する様々な距離の尺度を紹介します。
第15回(2011-7-20) (その他の話題)
来年度からは、情報物理化学という講義名に変更しようと思います。(2011-07-11 松本)