アイテムタイプ |
Article |
ID |
|
プレビュー |
画像 |
|
キャプション |
|
|
本文 |
2020000008-20200199.pdf
Type |
:application/pdf |
Download
|
Size |
:127.3 KB
|
Last updated |
:Feb 16, 2024 |
Downloads |
: 55 |
Total downloads since Feb 16, 2024 : 55
|
|
本文公開日 |
|
タイトル |
タイトル |
ロボットによる巧みな物体操作を実現するための自己教師あり学習法の提案
|
カナ |
ロボット ニ ヨル タクミナ ブッタイ ソウサ オ ジツゲンスル タメ ノ ジコ キョウシ アリ ガクシュウホウ ノ テイアン
|
ローマ字 |
Robotto ni yoru takumina buttai sōsa o jitsugensuru tame no jiko kyōshi ari gakushūhō no teian
|
|
別タイトル |
名前 |
Self-supervised learning method to realize skillful object manipulation by a robot
|
カナ |
|
ローマ字 |
|
|
著者 |
名前 |
村田, 真悟
|
カナ |
ムラタ, シンゴ
|
ローマ字 |
Murata, Shingo
|
所属 |
慶應義塾大学理工学部専任講師
|
所属(翻訳) |
|
役割 |
Research team head
|
外部リンク |
|
|
版 |
|
出版地 |
|
出版者 |
名前 |
慶應義塾大学
|
カナ |
ケイオウ ギジュク ダイガク
|
ローマ字 |
Keiō gijuku daigaku
|
|
日付 |
出版年(from:yyyy) |
2021
|
出版年(to:yyyy) |
|
作成日(yyyy-mm-dd) |
|
更新日(yyyy-mm-dd) |
|
記録日(yyyy-mm-dd) |
|
|
形態 |
|
上位タイトル |
名前 |
学事振興資金研究成果実績報告書
|
翻訳 |
|
巻 |
|
号 |
|
年 |
2020
|
月 |
|
開始ページ |
|
終了ページ |
|
|
ISSN |
|
ISBN |
|
DOI |
|
URI |
|
JaLCDOI |
|
NII論文ID |
|
医中誌ID |
|
その他ID |
|
博士論文情報 |
学位授与番号 |
|
学位授与年月日 |
|
学位名 |
|
学位授与機関 |
|
|
抄録 |
本研究では,ロボットによる巧みな物体操作を実現するため,プレイデータを用いた自己教師あり学習法を提案し,その実装を行った.具体的には,深層学習をロボティクス分野に対して有効に適用するための,(1)新たな自己教師データ取得フレームワークと(2)取得したデータを学習するための深層生成モデルの構築を行った.
(1)では人がマスタースレーブ方式によって,その人の「興味」に基づいてロボットを操作することでロボット(自己)の多様な視覚・運動情報データを取得した.具体的には,ロボットが操作可能な物体が配置された環境において,興味に基づき自由にマスター側のロボットを操縦することでスレーブ側のロボットを1時間操作した.その際に,スレーブ側のロボットの関節角度とカメラ画像の時系列データを取得した.本研究ではこのデータを,人が自由に「遊びながら」取得したという意味でプレイデータと呼ぶ.
(2)では変分自己符号化器(VAE: Variational Autoencoder)と再帰型ニューラルネットワーク(RNN: Recurrent Neural Network)を統合した変分再帰型自己符号化器(VRAE: Variational Recurrent Autoencoder)を構築し,取得したプレイデータの学習を行った.VRAEは,取得した時系列データの全体から一部を切り取り,その最終状態に到達することを目指し,視覚・運動状態の予測学習を行った.学習後のモデルをロボットに搭載し,学習済・未学習の環境における物体操作能力の検証を行った.検証の結果,従来の正例のみを用いていた教師あり学習では困難であったエラーリカバリが,本研究で提案する自己教師あり学習法で実現可能であることが示された.また,従来の強化学習においては環境をランダムに探索するため無駄なデータが含まれるという問題があるが,提案手法は人がロボットを興味に基づいて操作するため,取得されたデータは多様性を有する意味のあるものとなり,データの効率的な取得も実現することができた.
In this study, we proposed and implemented a self-supervised learning method using play data to realize skillful object manipulation by a robot. Specifically, we developed (1) a new framework for acquiring self-supervised data and (2) a deep generative model for learning the acquired data in order to effectively apply deep learning to the field of robotics.
In (1), a human operator freely controls a robot based on his or her "interests" in a master-slave manner to acquire various visual and proprioceptive data from a robot. In particular, the operator controlled a slave robot in an environment with manipulatable objects by directly guiding a master robot based on his or her interests during an hour. Time series data of joint angles and camera images of the slave robot were recorded. In this study, we call these data "play data" in the sense that they were acquired while he or she was playing freely.
In (2), we developed a variational recurrent autoencoder (VRAE) that integrates a variational autoencoder (VAE) and a recurrent neural network (RNN). Given a final state of a part of whole time series data as a goal, the VRAE learned to generate a predictive sequence of the visual and proprioceptive states to reach the final state. We implemented the trained model in the robot and tested its ability to manipulate objects in both trained and untrained situations. The experimental results demonstrated that our proposed self-supervised learning method can achieve error recovery that is not difficult to be achieved in the conventional supervised learning method using only positive examples. In addition, while conventional reinforcement learning has the problem of including useless data due to the random exploration of an environment, our proposed method which asks human operators to manipulate a robot based on their interests realizes the meaningful and efficient data collection with diversity.
|
|
目次 |
|
キーワード |
|
NDC |
|
注記 |
|
言語 |
|
資源タイプ |
|
ジャンル |
|
著者版フラグ |
|
関連DOI |
|
アクセス条件 |
|
最終更新日 |
|
作成日 |
|
所有者 |
|
更新履歴 |
|
インデックス |
|
関連アイテム |
|