トップページ > お知らせ > チュートリアルセミナー報告

企画委員会からのお知らせ

2007年度統計関連学会連合大会・チュートリアルセミナー報告

今年度のチュートリアルセミナーの開催に当たって、学会員からテーマを募ることとなった。今回3テーマを実施したが、1テーマは応募いただいたものである。広く会員から希望テーマを出していただくことにより、より会員に密着したチュートリアルセミナーを企画できるものと思う。例年と異なり、本年のセミナーは2時間30分のテーマ2つをまとめて1コース、5時間のテーマを1コースとする2コースを並行して実施した。関東地方を台風が直撃するという状況にも関わらず、225名収容の教室のいずれもが満席に近い状況であった。多くの方のご聴講をいただいたことにお礼申し上げます。

テーマ1:ベイズ統計とベイジアンネットワーク

オーガナイザー:繁桝算男(東京大学総合文化研究科)
講師:繁桝算男(東京大学総合文化研究科)、植野真臣 (電気通信大学)、本村陽一 (産業技術総合研究所)

本チュートリアルは、現在注目されており、すでに多くの分野で実際に使われているベイジアンネットワークモデルについて、専門的に勉強をしたことのない方に対し、基本的な考え方を説明し、実際に役に立つシステムを作るノウハウを紹介することを意図したものである。このチュートリアルは3人の講師が担当した。まず、繁桝がベイジアンネットワークモデルに基づく分析において、なぜ、ベイジアン的アプローチが必要であるかを説明した。複雑な現象をグラフで表現し、さらに、データによって、そのモデルを改良し、実際の問題解決に用いるという一連のプロセスにおいて、ベイズ的な考え方はなにしろ相性がいいのである。次に、植野真臣氏が、データによる学習、すなわち、条件付確率のパラメータの推定や、パスの取捨選択というモデルの改善について、自身の研究成果を踏まえていろいろな方法を講義された。最後に、本村陽一氏が、ベイジアンネットワークのモデリングと学習の基本的な部分を復習した上で、実際的なシステムを作る過程を自らの体験に基づいて説明された。全体を通じて、基本的発想、問題解決にかかわる事象に対する理解と選択肢の整理をつなげることによって、役に立つシステムをつくる道筋をつけることを心がけたつもりである。

テーマ2:大規模データ解析の現状と問題点

オーガナイザー:樋口知之(統計数理研究所)
講師:樋口知之(統計数理研究所)

複雑なシステムが不断に生み出す大量のデータの解析処理,そこからの有用な情報の自動的な抽出,つまり計算機による知識獲得の重要性が叫ばれて久しいが,統計科学がこの要求に満足に答えてきたのか,特にデータマイニングや機械学習等の他隣接研究領域と比較して十分であったのかは自省すべき時期にきている.このような背景のもとで,統計関連学会関係者の奮起に大いに期待する意図もあり,本セッションはオーガナイザーの樋口が講師も務めた.いわば一人独演会的な企画であったが,台風が関東を直撃し諸々の交通機関がマヒした中,比較的広めの部屋がいっぱいになるくらい大勢の方にご聴講いただき, この場を持ってあらためて感謝申し上げたい.
本チュートリアルでは、統計科学の研究者が大量データの解析にあたって障害となる,欠損値や異常値の取り扱い等の前処理技術から,ベイジアンモデリングを利用した異種情報の統合手法までを,講師の多数の実例経験をおりまぜて紹介した.前半部分では,大規模データ解析周辺の現状分析と数理的基礎の解説を行い,また後半では,人工衛星時系列データ,GPSデータ,POSデータ,マイクロアレイデータ等の解析例を図説する中で直面した困難をいかに克服していったかを紹介した.講師の時間配分ミスにより,後半部分がトピックス紹介程度にしかならなかったことを申し訳なく思う.
大規模データ解析ができる人材は日本ではかなり少数であるため,近い将来,大規模データ解析手法に係わる諸関連研究分野が融合の上一つの領域名を冠した研究分野に発展していき,そこにおいて人材育成が効率よく行えるようになることを切に願っている.
(スライドが次のURLから入手可能)
http://daweb.ism.ac.jp/articles/Tutorial07HiguchiBW.pdf

テーマ3:生存時間解析における競合危険モデル入門

オーガナイザー:上坂浩之(日本イーライリリー)
講師:西川正子(国立保健医療科学院・技術評価部)

生存時間解析は、ある個体あるいは対象を経時的に観察し、注目している事象が発生するまでの時間を解析の対象とする。このとき注目している事象以外の原因、すなわち競合危険によるセンサリングの発生が問題になる。医学・生物学データの解析ではしばしば競合危険因子間の独立性が仮定されるが、この仮定は多くの場合データから確認できない。また生存関数の推定ではKaplan-Meier推定量がよく用いられるが、競合危険因子が存在する場合、Kaplan-Meier推定量は妥当でないことが知られている。
このセミナーでは、生存時間解析の基礎事項を振り返った後、医療における医薬品やその他の治療法または予防法の有効性・安全性評価の場面を中心として、競合危険を考慮すべき状況、統計的モデルとその推測法が分かりやすく解説された。また、競合危険因子を考慮すべき状況の例が、実際の臨床試験を引用して具体的に紹介された。
大変多くの方が聴講され、225人を収容できる講義室も満員の盛況であった。医薬・医学における事象までの発生時間を扱うデータの解析において、競合危険を考慮すべき状況は多いと考えられるが、本セミナーで紹介されたような競合危険を考慮した解析はまだまだ少ないようである。本セミナーによって競合危険モデルの活用が促進されることを期待する。