
基盤モデルとロボットの融合 マルチモーダルAIでロボットはどう変わるのか
キバンモデルトロボットノユウゴウ マルチモーダルエーアイデロボットハドウカワルノカ
【岡野原大輔氏 推薦!!】
これまでのロボットには困難だったタスクにどう挑むのか。
「フィジカルAI時代」の中核技術を理解するための指針となる一冊。
★★生成AIによる大変革、次の主役はロボット!★★
■ロボットを知らなくても読める!
この大変革の流れを知らずして、AI・情報科学の未来は語れません。
AIに関心のある研究者、エンジニア、マネージャー、起業家――
技術の潮目をつかみたいすべての人に贈ります。
■AIが“世界に接する”時代へ!
生成AIは、いまや言語や画像にとどまりません。
LLMを超え、より大規模でマルチモーダルなモデルが「基盤モデル」です。
それがロボットと結びつき、世界に接するAIが生まれています。
・「あれ取ってきて」という指示に応答するロボット
・みずからコードを書いて自分を制御するロボット
・未知の環境でも、試行錯誤して成果を出すロボット
かつてできなかったことが、基盤モデルの力で実現しています。
■語り尽くすのは、最前線を走る若きツートップの研究者!
「そもそも、基盤モデルとは何なのか?」
「基盤モデルでロボットの何が変わるのか?」
「基盤モデルをロボットにどう使うのか?」
技術の本質を捉えたい人に向けて、深く・わかりやすく語り尽くします。
【目次】
第1章 基盤モデルとロボット
第2章 基盤モデルでロボットの何が変わるのか
第3章 これまでのロボット
第4章 基盤モデルができること
第5章 基盤モデルをロボットにどう使うか
第6章 ロボット基盤モデル
第7章 今後の展開
- 前巻
- 次巻
オンライン書店で購入する
目次
第1章 基盤モデルとロボット
1.1 基盤モデルとは
1.2 基盤モデルのロボットへの応用
1.3 基盤モデルによるパラダイムシフト
1.4 基盤モデルで変わるロボット研究の世界
1.5 本書の構成
第2章 基盤モデルでロボットの何が変わるのか
2.1 自然言語を理解し、実行可能性を考えながらタスクを遂行する―SayCan
2.2 ロボットが自身のプログラムを生成する―Code as Policies
2.3 状況を理解し、失敗を修正する―REFLECT
2.4 言語的な意味をもった地図を生成する―CLIP-Fields
2.5 自然言語から動作を直接生成する―CLIPORT
2.6 ロボットの経験を拡張する―GenAug
2.7 多様なロボットの多様なスクを1つのネットワークで実行する―RT-X
2.8 本章のまとめ
第3章 これまでのロボット
3.1 一般的なロボットの制御フロー
3.2 さまざまなロボット
3.3 モダリティとその表現
3.4 低レベル認識
3.5 高レベル認識
3.6 高レベル計画
3.7 低レベル計画
3.8 ロボットのこれまでの常識と基盤モデルがもたらすもの
第4章 基盤モデルができること
4.1 ロボットが解釈可能な表現とは
4.2 深層学習から基盤モデルへ
4.3 基盤モデルの特徴
4.4 生成モデル
4.5 さまざまな基盤モデル
4.6 本章のまとめ
第5章 基盤モデルをロボットにどう使うか
5.1 基盤モデルをロボットに応用するアプローチ
5.2 低レベル認識への基盤モデルの応用
5.3 高レベル認識への基盤モデルの応用
5.4 高レベル計画への基盤モデルの応用
5.5 低レベル計画への基盤モデルの応用
5.6 データ拡張
5.7 本章のまとめ
第6章 ロボット基盤モデル
6.1 汎用事前学習ロボットビジョンモデル
6.2 ロボットのための視覚言語モデル(VLM)
6.3 一気通貫のロボット制御モデル
6.4 ロボット基盤モデルのためのデータセット
6.5 ロボット基盤モデルの今後
第7章 今後の展開
7.1 基盤モデルの急速な進展
7.2 基盤モデルと多様なモダリティ
7.3 基盤モデルとスキルの粒度
7.4 基盤モデルの推論スピード
7.5 基盤モデルと身体性
7.6 基盤モデルと認知発達
7.7 基盤モデルと実タスク
7.8 さいごに
書誌情報
紙版
発売日
2025年08月29日
ISBN
9784065395851
判型
A5
価格
定価:3,630円(本体3,300円)
ページ数
272ページ
著者紹介
河原塚 健人 東京大学大学院情報理工学系研究科附属情報理工学教育研究センター 講師 2017年東京大学工学部機械情報工学科卒業.2022年東京大学大学院情報理工学系研究科知能機械情報学専攻博士課程修了.博士(情報理工学).特任助教を経て,2025年より現職.東京大学情報システム工学研究室(JSK)所属. 専門は筋骨格ヒューマノイドの身体設計と制御,オープンソースハードウェアの4脚ロボット開発,深層学習に基づく知能ロボットなど. 著書:共著『Data-centric AI入門』技術評論社(2024)
松嶋 達也 東京大学大学院工学系研究科技術経営戦略学専攻 特任助教 一般社団法人AIロボット協会(AIRoA) CTO 2018年東京大学工学部システム創成学科卒業.2023年東京大学大学院工学系研究科技術経営戦略学専攻博士課程修了.博士(工学).特任研究員を経て,2025年より現職.東京大学松尾・岩澤研究室のサブグループとなっているTRAIL(Tokyo Robotics and AI Lab)の立ち上げを牽引. 専門はロボットのオフラインデータを用いた制御の学習(模倣学習・オフライン強化学習),機械学習モデルを活用したサービスロボットシステム設計など. 著書:共訳『強化学習(第2版)』森北出版(2022)
オンライン書店一覧
関連シリーズ
-
Pythonで動かしながら学ぶ コンピュータネットワーク
-
Pythonではじめる データ分析のための前処理入門
-
ソフトウェアの挑戦
-
Pythonではじめる時系列分析入門
-
プログラミング〈新〉作法
-
Polarsとpandasで学ぶ データ処理アイデアレシピ55
-
RustによるWebアプリケーション開発
-
ゼロから学ぶGit/GitHub
-
Pythonでスラスラわかる ベイズ推論「超」入門
-
Juliaプログラミング大全
-
Kaggleに挑む深層学習プログラミングの極意
-
ゼロから学ぶRust
-
ROS2とPythonで作って学ぶAIロボット入門
-
Pythonではじめるベイズ機械学習入門
-
Rではじめる地理空間データの統計解析入門
-
ゼロからはじめるデータサイエンス入門
-
Pythonではじめるテキストアナリティクス入門
-
Python数値計算プログラミング
-
1週間で学べる!Julia数値計算プログラミング
-
問題解決力を鍛える!アルゴリズムとデータ構造
-
ゼロからつくるPython機械学習プログラミング入門
-
これからのロボットプログラミング入門
-
モンテカルロ統計計算
-
スパース回帰分析とパターン認識
-
Rで学ぶ統計的データ解析
-
ゼロから学ぶPythonプログラミング
-
Pythonで学ぶアルゴリズムとデータ構造
-
PythonではじめるKaggleスタートブック
-
最適化手法入門
-
RとStanではじめる ベイズ統計モデリングによるデータ分析入門
-
データ分析のためのデータ可視化入門
-
ProcessingによるCGとメディアアート
-
入門者のPython
-
Web学習アプリ対応 C言語入門
-
ホログラフィ入門
-
pixivエンジニアが教えるプログラミング入門
-
使える! MATLAB/Simulinkプログラミング
-
最新 使える!MATLAB
-
今日から使える! MATLAB 数値計算から古典制御まで
-
OpenCVによる画像処理入門
-
OpenCVによるコンピュータビジョン・機械学習入門
-
LabVIEW画像計測入門
-
IDLプログラミング入門―基本概念から3次元グラフィックス
-
GPUプログラミング入門 -CUDA5による実装