[SG2021-9] 「理学におけるデータ科学:理論と実践〜数物理論と機械学習〜」

[SG2021-9] 「理学におけるデータ科学:理論と実践〜数物理論と機械学習〜」

企画名

「理学におけるデータ科学:理論と実践〜数物理論と機械学習〜」
 

参加教員

教員名 所属 職名
中野 直人(代表教員) 理学研究科 連携講師
谷村 吉隆 化学専攻 教授
宮路 智行 数学・数理解析専攻 准教授
楠岡 誠一郎 数学・数理解析専攻 准教授
 

企画の概要

【背景】機械学習などのデータ科学的手法の発達と計算機能力の向上に伴い,様々な分野でデータの潜在的に持つ情報の抽出が試みられてきた.パターン認識や信号解析などに翻訳できるものであれば,理学でもご多分に漏れず多くの問題に対して適用してきている.一方,機械学習的手法は目新しく派手に見えるものの,ただ試すだけでは個人的にはあまり面白く感じない.手法をそのまま適用できるほど現実の問題は甘くはないので,手法の工夫に走り出すと小手先の技術改善に陥りがちになる.

【このSGでやりたいこと】このSGでは一旦技術的なことは置いておき,機械学習が「何を」学習しているか,「どのように」学習しているか,「なぜ」うまくいく(ように見える)のか,について理論的に考えてみたい.

【キーワード候補】ここでキーワードとなり得るのは数物理論である.数式を用いる以上,その性質を詳しく知るには関連する数学の理論が必要ないわけがない.また,機械学習の   代表選手であるニューラルネットワークは相互作用のある多体系であるから,(ノードが 多い前提で)統計力学的なアプローチによる研究もされている.その他に,機械学習モデ ルによる判断根拠について考えるなら対象のデータのドメイン知識が不可欠だ.気象データなら気象学,地磁気データなら地球物理学,液晶のデータなら化学の深い知識がないとモデルがきちんと学習できているかどうか判断できない.結局のところ,「このSGでやりたいこと」を実践するには何らかの「理論」が必要ということだ.

【取り組み方】取り組み方は人それぞれ.「何を」,「どのように」,「なぜ」などの興味のある問題をひたすら調べ,議論を行う.ここら辺の問題意識にシンパシーを感じる人にぜひ参加してほしい.とりあえず参加して,問題意識を共有してから考える問題を見つけても良いかもしれない.ただしあまり教員には期待しないこと.いずれにせよ積極的に取り組む人でないとこのSGで有意義に過ごすことは難しい.

【注意】機械学習の手法自体を学びたい者はSGを頼らずに自分で勉強することを薦める.その方が手っ取り早い.大学には講義もあるし,ウェブ上には数多の記事がある.片っ端からコードを写経すれば一通りの技術は身に付く.このSGではそのケアはしない.

 

実施期間・頻度

不定期(定期的に集まることはしない)
原則Slack,Miro等のオンラインコミュニケーションツールを用いて情報交換と進捗確認を行い,必要に応じてZoomでミーティングする.

 

TA雇用の有無

 

スタディグループへの登録は締め切りました。
関心のある方は macs *sci.kyoto-u.ac.jp(*を@に変えてください)までご連絡ください。

TAG