情報技術AI研究所

Information Technology and Artificial Intelligence Research Laboratory

Project2 
基盤となるHPC/組込みシステムの研究研究成果


HPC 応用の研究開発(林研)




リハビリテーションゲーム・介護福祉ロボットの開発(河並研)

  • 著者 中村 恭太,前田 香織,河並 崇
  • タイトル 介護支援ロボット用アプリケーション開発およびハードウェアの拡張
  • 出典 なし
  • 概要 近年,日本は急速な高齢化を遂げていく中,介護ロボットの需要は増え続けている.一方,既存の介護ロボットは高価なため導入が難しい上に,高機能化によって操作が複雑な場合が多く,利用対象者が限定されてしまう.そこで,安価で拡張性の高いロボット「Rapiro」を基盤とした介護福祉ロボットの開発を行った.センサー等の新規ハードウェアの追加および,音声認識やテレビリモコンによる操作,センサー情報の読み上げ,動画ストリーミングによる遠隔監視機能を備える.



省電力圃場監視および制御システムの開発(河並研)




鉄道玩具を題材とした組み込みシステム入門教材の開発(河並研)

  • 著者:河並 崇,鍛冶 俊平,鷹合 大輔,林 亮子
  • タイトル:プラレールを活用した組込みシステム入門教材の開発
  • 出典:電子情報通信学会 技術研究報告 コンピュータシステム研究会 ETNET2015
  • 概要:組込みシステムはハードウェアからソフトウェアまで幅広い領域を学ぶ必要があるため,従来,専門家でなければ開発は難しいとされていた.しかしながら,近年ではArduinoなど高度な専門知識を必要としないオープンソースハードウェアが誕生し,誰もが組込みシステムの開発をはじめることができるようになってきている.本研究では,主に中高生以上のプログラミング未経験者を対象とし,Arduinoを用いた組込みシステム入門教材の開発を行った.この教材はプログラミング入門から始まり,最終的にはマイコンで鉄道玩具であるプラレールを制御する.



シミュレーションとデータマイニングを組み合わせたアクティブシミュレーション技術の開発(林研)


平成26年度論文・発表等

  1. データマイニング技術を用いた分子構造の自動分類の試み, 林 亮子,水関博志,第37回 情報化学討論会2014講演要旨集,pp. 104--105, (2014).
  2. 「競合学習を用いた炭化水素分子の類似度マップ」,岡田 彩,林 亮子,平成26年度電気関係学会北陸支部連合大会,F27, (2014).
  3. 「計算科学とデータマイニングを用いた材料設計システム」, 林 亮子, 水関 博志, FIT2014(第13回情報科学技術フォーラム),第1分冊pp. 91-94, (2014).
  4. データマイニング技術を用いたシミュレーション結果自動分類の試み, 林 亮子,水関博志, ナノ学会 第12回大会, (2014).

はじめに

 近年では計算機が高速化し,単一計算コアを使用しても小規模の量子化学計算が数秒程度で実行可能である.さらに,日常的に使用するデスクトップ計算機でも複数の計算コアを持つようになっており,複数の計算を並行して行うことができる.また,計算化学プログラムも成熟してきており[1][2],容易に計算化学計算を行うことができる.一方,計算結果の実体は大量の数値データであり,すでにケモインフォマティクス分野[3]で行われているように,データマイニング技術[4]による知識発見が有効であると考えられる.
 著者らは近年,計算結果の自動データ処理に基づく材料設計を目標として,研究開発を行っている[5][6].本稿ではGaussian09によってC2H2F2分子の構造最適化を行ったデータを用い,データマイニング技術の一つである決定木を用いて試験的に分子構造の分類を試みた結果を報告する.
 本稿の構成は次の通りである.第2章では本稿が扱う例題の内容および設定条件を説明する.そして,構造最適化データを自動分類した結果を紹介し,妥当性を議論する.第3章では,得られた結果をまとめ,今後の課題を述べる.


C2H2F2分子の異性体決定木

計算化学の内容

 本研究では最初のステップとして,計算化学プログラムGaussian09を使用する.Gaussian09は最も有名な量子化学パッケージの一つであり,解説書も日本語版を含め充実していて,比較的利用しやすい.本研究では主に構造最適化を扱うが,構造最適化を行うと,初期条件で設定した分子の構造が最終的には変化する可能性がある.そのため,構造最適化の結果として実現した分子構造を数値的に再確認する必要がある.
 本稿では,分子構造を確認する例題として,C2H2F2分子の異性体分類を行う.C2H2F2分子は3種類の異性体を持つが,それらの原子配置を図1に示す.3種類の異性体間の主な違いは,2個のフッ素原子の位置関係であるため,視覚的にも異性体を分類でき,分類結果の確認が容易である.C2H2F2分子は1つの平面上に6個の原子が存在する構造を持ち,立体異性体が存在しないので,構造の数値的な扱いが容易である
 本稿では,分子の構造データとして原子間距離行列を使用する.今回使用したデータを表1に示す.原子間距離行列は,分子中の全ての原子の組み合わせで2原子間距離を計算し,行列状に並べたものである.表1に示すように,今回は原子間距離行列そのままではなく,同種原子の原子間距離,そしてC-H距離,C-F距離およびH-F距離の最大値および最小値を抜き出して使用する.
 構造最適化に用いた計算条件を述べる.今回はGaussian09において計算方法と基底関数の組み合わせを3種類使用する.これらはGaussian09での指定方法を用いると次のように表される.

  1. RHF/3-21g     (Hartree-Fock法)
  2. RHF/6-31G(d)  (同上)
  3. MP2/6-31G(d) (Møller-Plasset摂動法)

これらは文献[2]中の演習問題で用いられている組み合わせであり,C2H2F2分子は化学的に特異な物質ではないので,おおむね問題のない条件と考えられる.上記の1.が今回使用する中で最も計算モデルが簡単であり,列挙した順番に計算モデルが詳細化されていく.


データ処理内容

 本研究では,データ処理に統計解析環境Rを利用する.Rはオープンソースの統計処理用プログラミング言語であり,近年では数多くのデータマイニング手法が既にパッケージ化されていて,誰でも無料で利用することができる.さらに必要であれば独自のパッケージを開発することも可能であるため,本研究での利用に適している
 今回は入力データに,「どの異性体か」を含めており,異性体を分類する規則を決定することを目標とする.今回は異性体を分類する決定木の作成を試み,Rのパッケージmvpartを用いた.このパッケージはジニ係数を計算して,2進分岐する決定木を作成する.mvpartは2進分岐する決定木を作成するため,3つの異性体を分類するための分類規則は2つ得られることになる.


決定木と分類ルール

 表1のデータをmvpartに入力して得られた決定木を図2に示す.これはRの出力の木に,図1の分子構造を相当する部分に付して,分類規則の意味を吹き出しで記入して作成した.

図1.C2H2F2分子の3種類の異性体

 図2ではまずフッ化ビニリデンが分岐しており,その分岐規則は2つのH間距離である.ジフルオロエテンがシス形かトランス形かの分岐でもH間距離を用いて分岐している.表1を見ると,C間距離は3種類の異性体に大きな違いはないが,Hで最大の距離は最小の距離の約1.6倍であり,明らかに差がある.Fも1.6倍程度異なるが,Hよりは差が小さい.異種原子での原子間距離はここまで顕著な差はない.そのため,Hの原子間距離が分岐規則に採用されたと考えられる.得られた分岐規則は分子中の原子の数値的な配置とよく適合するものと考えられる.この規則の複数計算結果への適用を今後検討したい.

図2.C2H2F2分子の異性体決定木

表1.決定木作成に用いたC2H2F2分子データ


まとめ

 本稿では決定木を用いて計算の結果得られる分子構造の自動分類を試みた.その結果,おおむね妥当と考えられる分岐規則を自動的に得ることができた.

 今後の課題は多数の結果データを自動処理することである.構造がうまくできず失敗したデータを含む,初期条件を自動設定したデータを適切に処理できるかどうかを調査していく予定である.また,分子構造を分類するために使用するデータマイニング手法についても引き続き検討していく予定である.



TOP活動報告>Project2 詳細