大阪大学 基礎工学研究科

長井研究室

身体操作則と環境の相互学習モデルの構築幼児発達過程の理解に向けた構成的アプローチ

概要

本研究の目的は、身体運動制御から言語理解・操作や行動決定といった高次認知までの知能発達の過程をロボットで再現することである。
知能発達に対し、身体と環境の相互作用が大きな影響を与えていると考え、自己の状態を表現するモデルと周囲の環境を表現するモデルが 相互に作用しあう統合モデルを中心においた知能モデルを構築し、発達過程の数理モデル化を行う。 最終的に,構築したモデルを搭載したロボットを用いた実験を通して,モデルの学習過程を解析することで、 身体と環境の相互作用がどのように働き,発達過程が進行するのかを明らかにする。

発達過程に対する本研究の仮説

本研究では,知能発達の過程は次のような変化の過程であると考えている。

  1. 身体の発達や環境の変化に起因し、知覚情報が変化する。
  2. 観測された未知の情報に対し,それらを正しく知覚するために、自らの内部モデルを適応させる。
  3. 適応結果を踏まえ、身体と環境の状態に対するモデルを最適化する。

1 の変化は、段階的に繰り返し発生すると考えられ、上記の適応を繰り返すことで、 徐々に汎化性と複雑さが高い自己と環境に対する認識が可能なモデルが獲得される。

身体と知能の発達過程

身体操作則と環境の相互学習モデル

相互関係のモデル化

上記で述べたような知能発達が起きるには、身体と環境に対する相互的な関係をモデル化することが不可欠である。 本研究では、この相互関係を観測情報を次元圧縮し,形成された潜在空間上で表現する。 ここでのポイントは、一方の状態変化はもう一方の状態変化を引き起こす外的な入力と捉え、相互関係をモデル化する点である。

このように考えると、相互関係は身体状態表現部,環境状態表現部,相互作用表現部の3つにより 構成される相互的なマルコフ決定過程での2つの状態の時間変化として表されることになる。

深層学習を用いた潜在空間の形成

Multmodal Variational AutoEncorder のモデル構造

自己や環境の状態は、実環境において多様なモダリティ情報の組み合わせとしてセンサを通して観測できる。 しかし、情報は高次元情報となる場合も多く、そのままでは上述した身体と環境の相互的な関係を捉えることは難しい。 そのため、複数のモダリティ情報を統合しつつ、潜在情報を抽出する能力が重要となる。

この目的を満たすため、深層学習によって生成モデルを学習する手法である Variational AutoEncoder(VAE)に 複数モダリティの統合層を追加した深層生成モデル「Multimodal VAE」を提案する。 左図のようなネットワークでは、同時に観測した複数モダリティの情報を1つの潜在情報で表現する必要があり、 共起性に基づいた潜在空間の形成が行えわることが期待される。

検証実験

MVAE を用いて物体に対する潜在空間の形成が可能であるかを検証した。

本実験では,67 個 11 カテゴリの物体から視覚,触覚,聴覚の3種のモダリティ情報を取得した。
学習後,中間層に表現された潜在空間が右図である。 各物体に対するカテゴリに関する情報を与えず,学習を行ったにも関わらず獲得された潜在空間では、 物体のカテゴリごとのクラスターが形成されていることが確認された。

この結果は、今回構築した MVAE を用いることで、教師無し学習によって実世界を理解するための潜在空間が獲得できる 可能性を示すものだと考えている。

形成された物体に対する潜在空間

Author青木 達哉 (Tatsuya Aoki)