基盤モデルとロボットの融合　マルチモーダルＡＩでロボットはどう変わるのか

キバンモデルトロボットノユウゴウ　マルチモーダルエーアイデロボットハドウカワルノカ

著：河原塚　健人，
著：松嶋　達也

【岡野原大輔氏推薦!!】
これまでのロボットには困難だったタスクにどう挑むのか。
「フィジカルAI時代」の中核技術を理解するための指針となる一冊。

★★生成AIによる大変革、次の主役はロボット！★★

■ロボットを知らなくても読める！
この大変革の流れを知らずして、AI・情報科学の未来は語れません。
AIに関心のある研究者、エンジニア、マネージャー、起業家――
技術の潮目をつかみたいすべての人に贈ります。

■AIが“世界に接する”時代へ！
生成AIは、いまや言語や画像にとどまりません。
LLMを超え、より大規模でマルチモーダルなモデルが「基盤モデル」です。
それがロボットと結びつき、世界に接するAIが生まれています。
・「あれ取ってきて」という指示に応答するロボット
・みずからコードを書いて自分を制御するロボット
・未知の環境でも、試行錯誤して成果を出すロボット
かつてできなかったことが、基盤モデルの力で実現しています。

■語り尽くすのは、最前線を走る若きツートップの研究者！
「そもそも、基盤モデルとは何なのか？」
「基盤モデルでロボットの何が変わるのか？」
「基盤モデルをロボットにどう使うのか？」
技術の本質を捉えたい人に向けて、深く・わかりやすく語り尽くします。

【目次】
第1章　基盤モデルとロボット
第2章　基盤モデルでロボットの何が変わるのか
第3章　これまでのロボット
第4章　基盤モデルができること
第5章　基盤モデルをロボットにどう使うか
第6章　ロボット基盤モデル
第7章　今後の展開

前巻
次巻

オンライン書店で購入する

ネット書店一覧

書誌情報

著者紹介

オンライン書店一覧

関連シリーズ

第1章　基盤モデルとロボット
1.1　基盤モデルとは
1.2　基盤モデルのロボットへの応用
1.3　基盤モデルによるパラダイムシフト
1.4　基盤モデルで変わるロボット研究の世界
1.5　本書の構成

第2章　基盤モデルでロボットの何が変わるのか
2.1　自然言語を理解し、実行可能性を考えながらタスクを遂行する―SayCan
2.2　ロボットが自身のプログラムを生成する―Code as Policies
2.3　状況を理解し、失敗を修正する―REFLECT
2.4　言語的な意味をもった地図を生成する―CLIP-Fields
2.5　自然言語から動作を直接生成する―CLIPORT
2.6　ロボットの経験を拡張する―GenAug
2.7　多様なロボットの多様なスクを1つのネットワークで実行する―RT-X
2.8　本章のまとめ

第3章　これまでのロボット
3.1　一般的なロボットの制御フロー
3.2　さまざまなロボット
3.3　モダリティとその表現
3.4　低レベル認識
3.5　高レベル認識
3.6　高レベル計画
3.7　低レベル計画
3.8　ロボットのこれまでの常識と基盤モデルがもたらすもの

第4章　基盤モデルができること
4.1　ロボットが解釈可能な表現とは
4.2　深層学習から基盤モデルへ
4.3　基盤モデルの特徴
4.4　生成モデル
4.5　さまざまな基盤モデル
4.6　本章のまとめ

第5章　基盤モデルをロボットにどう使うか
5.1　基盤モデルをロボットに応用するアプローチ
5.2　低レベル認識への基盤モデルの応用
5.3　高レベル認識への基盤モデルの応用
5.4　高レベル計画への基盤モデルの応用
5.5　低レベル計画への基盤モデルの応用
5.6　データ拡張
5.7　本章のまとめ

第6章　ロボット基盤モデル
6.1　汎用事前学習ロボットビジョンモデル
6.2　ロボットのための視覚言語モデル（VLM）
6.3　一気通貫のロボット制御モデル
6.4　ロボット基盤モデルのためのデータセット
6.5　ロボット基盤モデルの今後

第7章　今後の展開
7.1　基盤モデルの急速な進展
7.2　基盤モデルと多様なモダリティ
7.3　基盤モデルとスキルの粒度
7.4　基盤モデルの推論スピード
7.5　基盤モデルと身体性
7.6　基盤モデルと認知発達
7.7　基盤モデルと実タスク
7.8　さいごに

書誌情報

紙版

発売日

2025年08月29日

ISBN

9784065395851

判型

価格

定価：3,630円（本体3,300円）

ページ数

272ページ

著者紹介

著：河原塚　健人（カワハラヅカ　ケント）

河原塚健人東京大学大学院情報理工学系研究科附属情報理工学教育研究センター講師 2017年東京大学工学部機械情報工学科卒業．2022年東京大学大学院情報理工学系研究科知能機械情報学専攻博士課程修了．博士（情報理工学）．特任助教を経て，2025年より現職．東京大学情報システム工学研究室（JSK）所属．専門は筋骨格ヒューマノイドの身体設計と制御，オープンソースハードウェアの4脚ロボット開発，深層学習に基づく知能ロボットなど．著書：共著『Data-centric AI入門』技術評論社（2024）

著：松嶋　達也（マツシマ　タツヤ）

松嶋達也東京大学大学院工学系研究科技術経営戦略学専攻特任助教一般社団法人AIロボット協会（AIRoA） CTO 2018年東京大学工学部システム創成学科卒業．2023年東京大学大学院工学系研究科技術経営戦略学専攻博士課程修了．博士（工学）．特任研究員を経て，2025年より現職．東京大学松尾・岩澤研究室のサブグループとなっているTRAIL（Tokyo Robotics and AI Lab）の立ち上げを牽引．専門はロボットのオフラインデータを用いた制御の学習（模倣学習・オフライン強化学習），機械学習モデルを活用したサービスロボットシステム設計など．著書：共訳『強化学習（第2版）』森北出版（2022）