2025.07.02

Google Cloud Next 2025 @ ラスベガス出張レポート!

イベント参加レポート Google Cloud Next 生成 AI

こんにちは、IT 戦略企画室の小笠原、八木です。

先日、ラスベガスで開催された Google Cloud 主催のカンファレンス「Google Cloud Next 2025」に参加してきましたので、本ブログにて様子をお届けします!

Google Cloud Next 2025 とは?

Google Cloud が主催する、最新のクラウド技術や生成 AI ソリューションを紹介する大規模なオンサイトイベント。各国のビジネスリーダー、イノベーター、エンジニアなどが集い、Google Cloud の最新情報や革新的なソリューションを体験する場として、世界中から注目されています。

開催概要

  • 日程: 2025 年 4 月 9 日〜 11 日(現地時間)
  • 総参加人数:32,000 名超
    うち、日本からの参加人数:約 900 名
  • 聴講可能なセッション数:900 以上
  • 会場:Mandalay Bay Resort & Casino

コンベンションセンターとホテルの一部を貸し切っての開催。とにかく会場が広く、セッション間の移動で 10 分以上必要な場合もあります。宿泊しているホテルも当然広いため、油断していると 1 日で 2 万歩くらいは簡単に到達してしまいます。

Next'25 会場
ランチ会場 ランチ会場
会場で配られる昼食の量は日本の 3 倍! ランチルームの冷房がキンキンにもかかわらず、平然と半袖半ズボンという、積んでいるエンジンの違いを見せつけられました。

注目ポイント

今回の目玉は、昨年に引き続きまだまだ生成 AI。Google が開発した大規模言語モデル・Gemini(ジェミニ)の進化は凄まじく、テキストだけでなく画像や動画、音声といった異なる形式のデータを正確に処理することができ、より人間に近づいている印象を受けました。そういった賢い AI がタスクを自律的にこなす「AI エージェント」というキーワードも生成 AI と同等かそれ以上に注目されています。Keynote(基調講演)にはグローバル企業のトップが登場し、Google Cloud の利用や今後の展開に関してメッセージを発信していました。日本からはトヨタ一社だったのは寂しいところですが、製造業や金融機関など、リアル世界での AI 活用の本格化を実感しました。

イベントの内容は Google およびパートナー企業によるセッションの受講と体験型展示の大きく 2 つ。セッションは 900 以上の中から各自で事前登録をして受講します。また、1 階では展示が常設されているので、合間の時間で最新技術と触れ合いました。

※ Keynote 内容は以下リンクから YouTube で御覧になれます。
Opening Keynote: The new way to cloud

各セッション・展示のハイライト

今回の Gemini アップデートは凄まじく、紹介したいトピックがたくさんあるのですが、特に印象に残っているものを厳選して共有させていただきます。

動画生成 AI

Veo 2

「Veo 2」は Google 製の最新動画生成 AI であり、大幅に機能がアップデートされました。

  • テキストからビデオ生成:テキストプロンプトを入力するだけで、指定された内容に沿った動画を自動生成します。
  • 画像からビデオ生成:静止画像を元に動画を生成します。
  • ビデオ拡張:既存の動画を拡張して新しいシーンを追加します。
  • カメラコントロール:カメラの動きや視点を細かく設定できます。
  • 補間:動画のフレーム間を滑らかに繋げることで、より自然な動きを実現します。
  • インペインティング:動画の一部を修正・補完します。
  • アウトペインティング:動画のフレーム外に新しい要素を追加します。

これらの機能を利用し、
①テキストで書いたあらすじをイラストに変換
②カメラの動きを自由にコントロール
③インペインティングを利用して人物のみを消し、補間機能でそれらをつなぎ合わせる
④画像をもとに動画を作成

といったデモが会場で流れたのですが、かなり驚きのクオリティでした……。これらは専門技術を必要とせず直感的に使用できるため、いくつかの機能は実際の制作現場で役立たせることができるのではないでしょうか。

スケッチから 3D 動画を生成

入力画面に描いたラフスケッチからハイクオリティの3D画像を生成し、それらを複製してつなぎ合わせることで、画像間の動きを補完し動画を生成してくれるような AI エージェントを体験しました。原理は以下の通りです。

  • Gemini がマルチモーダル推論を通じて入力を処理し、Imagen プロンプトを作成
  • Imagen 3 は静止画のビデオフレームを作成し、Gemini は高度に制御可能な画像編集を提供
  • Gemini はシーンの方向によって Veo のショットを分析し、ビデオプロンプトを作成
  • Veo 2 は画像を動的なビデオに変換し、複数のショットをつなぎ合わせる

筆者が入力画面に適当に猫をスケッチして入力したところ、まずはなんとも言えぬクオリティの画像が出力されました。そこでテキストプロンプトによる指示で 3 ターンほど修正したところ、想定に近い状態の猫の画像を生成することができました。その後、複製した画像を元に、猫が空を飛ぶ動画を作ろうと試みたのですが、背景にカモメが空を飛び交ってタイムアップ。ここまで数分間の出来事のため、驚きを禁じ得ませんでした。

設定を入力して 4 コマ漫画を生成

プロンプトから簡単な設定を指示して、起承転結に沿った 4 コマ漫画を生成してくれる展示がありました。プロンプトによる調整で彩色や言語変更、絵の一部を修正など柔軟に対応可能です。重要なのは漫画内容のクオリティですが、人の心を動かすことは AI にはまだまだ難しいように思えました。

特に面白かったのが、“temperature”というパラメータをコントロールできるバーです。“temperature”とは、モデルが生成するテキストの創造性や多様性を制御するパラメータです。その値が低いとモデルはより決定的で予測可能なテキストを生成し、高ければ、よりランダムで創造的なテキストを生成します。試しに “temperature” を高くしてみると、男性キャラの服装がスカートに変更されました。発想の転換として使える場面がある……かも?

業務効率化(Gemini in Meet / Chat)

Meet 会議での議事書き起こしは、今でも既に利用されている方も多いかと思います。新しい Gemini では、自動生成した議事録を複数言語に変換することができ、また会議の要約や各人への ToDo 割り当てなど良い感じにやってくれるそうです。デモ動画ではかなり驚かされました。遅刻したメンバーに対して、ここまでの会の振り返りをリアルタイムで表示させ、また会議が停滞してくると議論が活発化するように、Gemini が論点をアシストしてくれていました。おまけに会議後には次回日程を自動で調整してくれ、カレンダー予約をしてくれるという、まさにファシリテーターの役割を担ってくれます。実務への活用のイメージが容易に湧き、使ってみたくなるような機能でした。

Chat 機能もパワーアップします。Gmail や Google ドキュメント、スプレッドシートなどとシームレスに連携し、Chat ベースで様々な情報を取り出すことが可能になるようです。また、Google 製品以外では Salesforce や Zendesk、Figma といった講談社内でも利用実績のある外部アプリケーションへの拡張も予定しているとのことでした。

データ分析

BIgQuery がハブとなり、様々なデータ関連のサービスが統合されていく印象を受けました。データエンジニアリング・データアナリティクス・データサイエンス・データガバナンスと、現状では分断されているプロセスをシームレスに連携していくロードマップのようです。ここにも AI が搭載されるため、現状では解決に時間がかかるタスクの省力化や自動化にもつながります。さらには自然言語ベースの分析や可視化ができることにより、コードを書く必要がないケースも増え、さらにデータの民主化が進んでいくことが予想されます。

実際のデモでは、事業メンバーが技術スキルを有さずとも、テキストベースでデータへアクセスが可能となり、履歴からよく閲覧するデータ群を AI エージェントが勝手に推測してダッシュボードとして可視化をしてくれる使い方が紹介されていました。

※関連として、Developer Keynote 内容が以下リンクから YouTube でご覧になれます。
Developer Keynote: You can just build things

展示の様子 展示の様子
その他もエンタメに富んだ展示が多数! Googler が楽しそうにレクチャーしてくれました。
  • 左)シュートフォームを矯正してくれる AI Basketball Coach は大人気で長蛇の列でした。
  • 右)お題に沿って客同士でレゴの組み立てを競い、AI がリアルタイムに実況。
      最終的には勝敗を判定してくれます。

感想

AI 活用といっても、これまでは実業務ベースでなかなかフィットしないというのが正直なところだったのですが、Gemini 2.5 はかなりの進化を遂げています。今まで Meet や Gmail、スプレッドシート、各種デベロッパーツールなどそれぞれ単体で使用していたものが、「AI エージェント」を介して有機的に統合されます。GAS やマクロのように少し勉強をしなければ組めなかった使い方が、テキストベースで誰でも利用できるということです。さらに AI は回答をしてくれるだけでなく、推論・判断をして良い感じに人間をアシストしてくれるようになります。今後は Google 以外のアプリケーションへもますます統合が加速し、もはや社会インフラに組み込まれるのではないかという恐怖すら感じました。

編集部など社内の他部署の海外出張で受ける所感と異なる点で意外だったのが、現地での漫画コンテンツの引きの弱さです。国内では盤石な「Japanese Manga Publisher」に誰も興味を持ってくれず悔しい思いをしました。一方で、我々のホームでないイベントに参加することも新鮮で、また専門的なことが分からなくても純粋に楽しめる(技術を使いたくなってみる)内容になっていたため、次回はぜひ編集部の方々と一緒に行ってみたいと強く思います。

A・I が止まらない!

番外:Sphere

セッション後の自由時間に Sphere へ行ってきました。Sphere はマディソン・スクエア・ガーデン社が手がけ2023年開業の高さ約 112 m・幅約 157 m、収容キャパ約 2 万人に及ぶ超巨大球形アリーナ。外壁の LED は「世界最大」の約 5.4 万平方メートルで、内側には「世界最高の解像度」(16 K × 16 K)を誇る約 1.5 万平方メートルの LED スクリーンが設置され、建設費は約 23 億ドル(日本円で約 3,400 億円)と言われています。

外壁スクリーンに映し出すだけでも広告費は 1 日で約 45 万ドルと言われており、『ONE PIECE』が TV アニメ放送開始 25 年周年を記念して 1 週間ジャック したことが有名です。

Sphere

また、Google Cloud と協業し、1939 年の名作映画『オズの魔法使い』 を生成 AI にて復刻。世界最大のスクリーンに適応させ、2025 年 8 月 28 日に公開予定です。

我々は、映画『ブラック・スワン』や『レスラー』でおなじみのダーレン・アロノフスキー監督が手がける『ポストカード・フロム・アース』という演目を鑑賞しました。生命の誕生から世界各国の自然風景、民族文化、やがては工業化が進んで戦争が起き、環境破壊が始まっていく様が 360° 全方位の美麗なスクリーンにて映し出されていくのですが、ハッキリ言ってめちゃめちゃ感動しました。座席が動いたり、風や匂いが出たり、と没入型のアミューズメントになっています。アメリカらしい規模感の正義を感じました。入場は 114 ドルと比較的お手頃価格だったのですが、良いものにはもっとお金を払いたい気持ちになり、物販で Sphere T シャツをペアルックで購入してしまいました。

Sphere Tシャツ

これでいつでも気分はラスベガス。クエリも捗ります。ペラペラの素材なのでとても涼しいです!

著者紹介

小笠原 傑 / IT 戦略企画室 デジタルソリューション部

2021 年中途入社のデータアナリスト。データ活用、小型プリクラ機保守担当。

八木 遼 / IT 戦略企画室 One to One マーケティング部 兼 グローバル統括室

2022 年中途入社のプロジェクトマネージャー。ヤンマガ Web、マガポケ、K MANGA の開発運営を担当。

講談社では一緒に働く仲間を募集しています