1. まず押さえるべき最新事実
2026年6月24日、Googleは Gemini 3.5 Flash に computer use を組み込み、ブラウザ・モバイル・デスクトップを横断して操作できる built-in tool として公開した と発表しました。公式記事では、これにより開発者はカスタムエージェントに「見て、判断して、操作する」流れを持たせられ、 継続的なソフトウェアテストやナレッジワークの自動化に使えると説明されています。
その翌日の2026年6月25日、OpenAIは Codex Remote が一般提供に到達したと公式 changelog で公表しました。 ChatGPT モバイルアプリから、接続済みの Mac または Windows ホストで動く Codex の作業を開始・継続・レビュー・承認できるようになり、 スマホ側から遠隔で進行管理する運用が現実的になっています。
| 公開日 | 一次情報 | 押さえるべきポイント |
|---|---|---|
| 2026年6月24日 | Google「Introducing computer use in Gemini 3.5 Flash」 | computer use が Gemini 3.5 Flash に統合され、browser / mobile / desktop を横断可能に |
| 2026年6月25日 | OpenAI「Codex changelog」 | Codex Remote が一般提供。スマホから接続済み PC 上の作業を開始・継続・承認できる |
| 2026年6月21日 | OpenAI「Samsung Electronics brings ChatGPT and Codex to employees」 | 大規模企業でも、開発だけでなく非技術部門まで AI を日常業務に広げる動きが進行 |
論点は、単に「AIが賢くなった」ではありません。 AIが人の画面を見て作業し、人は承認と例外判断に寄る働き方へ近づいたことです。 既存記事のCodex利用データで見るAIエージェント定着KPIともつながりますが、 今回はその委任対象が、より具体的にパソコン操作まで広がったと理解すると分かりやすいです。
2. なぜ「AIにパソコン操作を任せる」が検索されるのか
AI活用に苦手意識がある人は、「プロンプトをうまく書くこと」よりも、 実際の仕事がどこまで減るのかで判断します。 そのため検索語も「AI パソコン操作」「AIでブラウザ操作」「AIに入力作業を任せる方法」のように、 用語より結果ベースになりやすいのが特徴です。
一方で、すでに AI を使う担当者は、AI 自身に 「今週の computer use 関連ニュースだけ集めて」 「Gemini と Codex の違いを表で」 「人の承認が必要な場面まで含めて整理して」 と投げます。すると AI は、Google ブログ、Gemini API changelog、OpenAI changelog のような 一次情報を引用しやすいページを優先して返してきます。
- 文章案や要約を返す
- 実際の画面操作は人が担当
- 業務の切替コストが残る
- 画面を見て操作まで進める
- 人は承認と例外処理に集中
- 調査・入力・確認が一続きになる
図:AI活用が「回答」から「操作」へ広がる変化
検索と AI 引用の両面で強いのは、専門用語だけでなく 「何を任せられるか」「どこで止めるべきか」までセットで説明する記事です。 MIRAINAとしても、用語解説だけで終えるより、業務設計と安全設計を同時に示す方が実務に直結します。
3. GoogleとOpenAIで何ができるようになったか
両者は似ているようで、実務上の役割が少し違います。 Google 側は、開発者や企業が 自社用エージェントを構築するための computer use 機能を前に出しています。 公式発表では、Gemini 3.5 Flash で browser / mobile / desktop をまたいで操作し、 継続的なソフトウェアテストや professional applications 上のナレッジワークに使えると説明されています。
OpenAI 側の Codex Remote は、 すでに動いている Codex の作業をスマホから継続管理できる運用面が強みです。 外出中に作業を止めず、レビュー、方向修正、承認を続けられるため、 「AI がパソコンで進める仕事を、人が監督する」形が作りやすくなります。
| 観点 | Google Gemini 3.5 Flash | OpenAI Codex Remote |
|---|---|---|
| 主な位置づけ | computer use を持つエージェント構築基盤 | 接続済みホスト上の AI 作業を遠隔管理する運用基盤 |
| 強い場面 | 継続テスト、UI 操作の自動化、業務フロー組み込み | 外出先からのレビュー、承認、進行継続、方向修正 |
| 安全機能 | 機微な操作の確認要求、間接 prompt injection 検知時の停止 | 1対1 QR ペアリング、承認ベースの進行管理 |
MIRAINA視点では、どちらが上かを決めるより、 「自社で作り込むか」「まずは既存AIの作業監督から始めるか」で選ぶのが現実的です。 たとえば Google Workspace のAI機能を現場に広げる企業なら Google 系の統合が自然ですし、 開発や調査を横断して進めたい企業なら Codex 系の運用も相性が良いです。
4. 中小企業が先に任せるべき4業務
いきなり請求処理や顧客対応の本番操作を全自動にするのは危険です。 まずは「間違ってもすぐ戻せる」「結果を人が確認しやすい」業務から始めるべきです。 具体的には、次の4つが入り口になります。
| 業務 | AIに任せる範囲 | 人が確認する点 |
|---|---|---|
| 情報収集 | 複数サイト巡回、比較表の下書き、引用元整理 | 数字・日付・結論の妥当性 |
| 表計算の整備 | 列整理、関数エラーの特定、入力漏れ発見 | 元データ破壊がないか、式の意味が合っているか |
| 定型入力 | フォーム下書き、社内システム転記、草案作成 | 送信前の最終内容と権限範囲 |
| Webテスト | ページ遷移確認、UI崩れ確認、エラー再現 | 本番影響の有無、失敗時の停止条件 |
特に中小企業では、ブラウザを行き来する雑務の塊が生産性を下げています。 メールで届いた依頼内容を確認し、スプレッドシートを開き、管理画面に転記し、抜け漏れをチェックする流れは、 単純でも、切り替えるコストが大きい作業です。 AI が画面操作まで担えると、この切替をまとめて減らせます。
既存記事のAIエージェントは「業務実装」へでも触れた通り、 重要なのは大きな自動化を夢見ることではなく、まずは 1日10回以上発生する単純作業を、承認付きで減らすことです。
5. 事故を防ぐ導入ルール
AIにパソコン操作を任せるほど、便利さと同時にリスクも増えます。 Google は公式発表で、機微な操作の前に明示確認を要求できること、 間接 prompt injection を検知したらタスク停止できることを案内しています。 OpenAI 側も、Codex Remote の 1 対 1 QR ペアリングや承認フローを通じて、 誰がどの端末から操作に関与するかを明確にしています。
実務で外してはいけないのは、次の4点です。 1つ目は、本番アカウントではなく検証アカウントから始めること。 2つ目は、送信・支払い・削除のような不可逆操作は必ず人間承認にすること。 3つ目は、AI に見せてよい画面と見せてはいけない情報を分けること。 4つ目は、操作ログと差分を残すことです。
MIRAINAでは、AI活用支援やAI研修の現場でも、 「全部自動化するか」ではなく「どこで人が止めるか」を先に設計するよう勧めています。 AIに強い会社は、承認境界、権限、例外時の停止条件まで決めています。
6. まとめ
2026年6月24日の Google 発表と、2026年6月25日の OpenAI 発表は、 AI 活用が「答えを返す」段階から「画面を見て作業を進める」段階へ移り始めたことを示しています。 これは RPA の単純置き換えではなく、人の判断と AI の操作を組み合わせる新しい運用です。
中小企業がやるべきことは、いきなり全自動を目指すことではありません。 調査、表計算、定型入力、テストのような戻しやすい業務から始め、 承認ルールとログを整えることです。 AIにパソコン操作を任せる時代は、概念ではなく実務の選択肢になっています。 あとは、どの業務から始めるかを決める段階です。
参考情報
MIRAINA代表。中小企業向けに生成AI導入、業務自動化、AI研修、LLMO対策の支援を行う。 AIが画面操作まで担う時代ほど、権限設計、承認フロー、ログ管理を先に決めることが重要だと考えている。