慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

ホーム  »»  アイテム一覧  »»  アイテム詳細

アイテム詳細

アイテムタイプ Article
ID
2020000008-20200199  
プレビュー
画像
thumbnail  
キャプション  
本文
2020000008-20200199.pdf
Type :application/pdf Download
Size :127.3 KB
Last updated :Feb 16, 2024
Downloads : 55

Total downloads since Feb 16, 2024 : 55
 
本文公開日
 
タイトル
タイトル ロボットによる巧みな物体操作を実現するための自己教師あり学習法の提案  
カナ ロボット ニ ヨル タクミナ ブッタイ ソウサ オ ジツゲンスル タメ ノ ジコ キョウシ アリ ガクシュウホウ ノ テイアン  
ローマ字 Robotto ni yoru takumina buttai sōsa o jitsugensuru tame no jiko kyōshi ari gakushūhō no teian  
別タイトル
名前 Self-supervised learning method to realize skillful object manipulation by a robot  
カナ  
ローマ字  
著者
名前 村田, 真悟  
カナ ムラタ, シンゴ  
ローマ字 Murata, Shingo  
所属 慶應義塾大学理工学部専任講師  
所属(翻訳)  
役割 Research team head  
外部リンク  
 
出版地
 
出版者
名前 慶應義塾大学  
カナ ケイオウ ギジュク ダイガク  
ローマ字 Keiō gijuku daigaku  
日付
出版年(from:yyyy) 2021  
出版年(to:yyyy)  
作成日(yyyy-mm-dd)  
更新日(yyyy-mm-dd)  
記録日(yyyy-mm-dd)  
形態
1 pdf  
上位タイトル
名前 学事振興資金研究成果実績報告書  
翻訳  
 
 
2020  
 
開始ページ  
終了ページ  
ISSN
 
ISBN
 
DOI
URI
JaLCDOI
NII論文ID
 
医中誌ID
 
その他ID
 
博士論文情報
学位授与番号  
学位授与年月日  
学位名  
学位授与機関  
抄録
本研究では,ロボットによる巧みな物体操作を実現するため,プレイデータを用いた自己教師あり学習法を提案し,その実装を行った.具体的には,深層学習をロボティクス分野に対して有効に適用するための,(1)新たな自己教師データ取得フレームワークと(2)取得したデータを学習するための深層生成モデルの構築を行った.
(1)では人がマスタースレーブ方式によって,その人の「興味」に基づいてロボットを操作することでロボット(自己)の多様な視覚・運動情報データを取得した.具体的には,ロボットが操作可能な物体が配置された環境において,興味に基づき自由にマスター側のロボットを操縦することでスレーブ側のロボットを1時間操作した.その際に,スレーブ側のロボットの関節角度とカメラ画像の時系列データを取得した.本研究ではこのデータを,人が自由に「遊びながら」取得したという意味でプレイデータと呼ぶ.
(2)では変分自己符号化器(VAE: Variational Autoencoder)と再帰型ニューラルネットワーク(RNN: Recurrent Neural Network)を統合した変分再帰型自己符号化器(VRAE: Variational Recurrent Autoencoder)を構築し,取得したプレイデータの学習を行った.VRAEは,取得した時系列データの全体から一部を切り取り,その最終状態に到達することを目指し,視覚・運動状態の予測学習を行った.学習後のモデルをロボットに搭載し,学習済・未学習の環境における物体操作能力の検証を行った.検証の結果,従来の正例のみを用いていた教師あり学習では困難であったエラーリカバリが,本研究で提案する自己教師あり学習法で実現可能であることが示された.また,従来の強化学習においては環境をランダムに探索するため無駄なデータが含まれるという問題があるが,提案手法は人がロボットを興味に基づいて操作するため,取得されたデータは多様性を有する意味のあるものとなり,データの効率的な取得も実現することができた.
In this study, we proposed and implemented a self-supervised learning method using play data to realize skillful object manipulation by a robot. Specifically, we developed (1) a new framework for acquiring self-supervised data and (2) a deep generative model for learning the acquired data in order to effectively apply deep learning to the field of robotics.
In (1), a human operator freely controls a robot based on his or her "interests" in a master-slave manner to acquire various visual and proprioceptive data from a robot. In particular, the operator controlled a slave robot in an environment with manipulatable objects by directly guiding a master robot based on his or her interests during an hour. Time series data of joint angles and camera images of the slave robot were recorded. In this study, we call these data "play data" in the sense that they were acquired while he or she was playing freely.
In (2), we developed a variational recurrent autoencoder (VRAE) that integrates a variational autoencoder (VAE) and a recurrent neural network (RNN). Given a final state of a part of whole time series data as a goal, the VRAE learned to generate a predictive sequence of the visual and proprioceptive states to reach the final state. We implemented the trained model in the robot and tested its ability to manipulate objects in both trained and untrained situations. The experimental results demonstrated that our proposed self-supervised learning method can achieve error recovery that is not difficult to be achieved in the conventional supervised learning method using only positive examples. In addition, while conventional reinforcement learning has the problem of including useless data due to the random exploration of an environment, our proposed method which asks human operators to manipulate a robot based on their interests realizes the meaningful and efficient data collection with diversity.
 
目次

 
キーワード
 
NDC
 
注記

 
言語
日本語  

英語  
資源タイプ
text  
ジャンル
Research Paper  
著者版フラグ
publisher  
関連DOI
アクセス条件

 
最終更新日
Feb 16, 2024 13:35:19  
作成日
Feb 16, 2024 13:35:19  
所有者
mediacenter
 
更新履歴
Feb 16, 2024    インデックス を変更
 
インデックス
/ Public / 塾内助成報告書 / 学事振興資金研究成果実績報告書 / 2020年度
 
関連アイテム
 

ランキング

最も多く閲覧されたアイテム
1位 「危険の予見可能... (546) 1st
2位 故意犯と過失犯の... (518)
3位 世襲経営者のマネ... (456)
4位 新自由主義に抗す... (434)
5位 731部隊と細菌戦 ... (396)

最も多くダウンロードされたアイテム
1位 価格に対する消費... (1061) 1st
2位 楽天とアマゾンの... (940)
3位 アセトアニリドの... (746)
4位 インフルエンサー... (535)
5位 731部隊と細菌戦 ... (495)

LINK

慶應義塾ホームページへ
慶應義塾大学メディアセンターデジタルコレクション
慶應義塾大学メディアセンター本部
慶應義塾研究者情報データベース