Aside:ブラウザ内でタスクを自律実行するYC発のAIブラウザエージェント
Aside は連携APIに頼らず、ブラウザ内でGmail/Notion/Slack等を横断操作するAIブラウザエージェント。

Aside は、ブラウザの中でタスクを自律的に実行する 新しいAIブラウザエージェントです。 Y Combinator支援のスタートアップ(at-inc / asidehq.com)が開発する「AIファースト/ブラウザネイティブな自動化プラットフォーム」で、外部の連携APIに頼らず、Gmail・Notion・Slack・Figma・銀行サイト などを横断して、フォーム入力やデータ管理を代行します。 従来の自動化ツールがアプリごとの連携設定を要したのに対し、Asideは「ブラウザでできることは、ブラウザの中でそのままやる」という割り切りで間口を一気に広げています。 人間がブラウザでやっていた作業を、ブラウザごとAIに任せる ——というのが基本コンセプトです。 「アシスタントに、見ているこの画面の作業をそのまま代わってもらう」イメージに近く、チャットでやり取りするだけのAIとは一段違う“実行する”体験を狙っています。

そして特筆すべきは、開発元が 性能評価(ベンチマーク)をオープンソースで公開 していることです(リポジトリ:at-inc/aside-benchmarks)。製品そのものは非公開でも、実力を測る土俵と結果を公開する姿勢は、評価の検証可能性という意味で好ましいものです。 本稿は 2026年6月24日(JST)時点 で、この公開ベンチマークと公式情報をもとに、Asideの仕組み・特徴・実力・他ツール比較・注意点を整理します。

AIエージェント全般の仕組みは AIエージェントとは?仕組み・種類・代表的OSSフレームワークを初心者向けに解説【2026年版】 も参考にしてください。

前提:本体は製品、公開されているのはベンチマーク
GitHubで公開されているのはベンチマーク(評価結果・手順)で、Aside本体(ブラウザ製品)はYC支援のスタートアップ製品。本稿執筆時点でソース公開は確認できない(早期アクセス/招待制の可能性)。スコアはAside公式の自社測定であり第三者検証ではない点に注意。本記事は宣伝ではなく中立的な技術解説。
この記事のポイント
  • ブラウザ内でタスクを自律実行するAIブラウザエージェント(YC支援)。
  • 連携APIに頼らず、Gmail/Notion/Slack/Figma等をブラウザネイティブに横断操作。
  • ・公式がベンチマークをOSS公開(Online-Mind2Web / Odysseys / BU Bench V1)。
  • ・自社測定でOnline-Mind2Web 99.0%(Browser Use Cloud 97.7%、ChatGPT Atlas 70.9%)。
  • ・APIレスで「画面を直接操作」する強みと、UI変化・認証・誤操作のリスクは表裏一体。

1. Asideとは — 「ブラウザごとAIに任せる」自動化

Webの自動化には長い歴史があります。 ZapierやMakeのような 連携(インテグレーション)型 は、各サービスのAPIを繋いで自動化しますが、APIがない機能や画面は自動化できない という限界がありました。

Asideのアプローチは違います。 人間と同じように ブラウザ上のUIを直接操作 することで、APIの有無に関係なく作業を進めます。 公式の説明によれば、Asideは ブラウザの中で直接、Gmail・Notion・Slack・Figma・銀行サイトなどを横断 して動きます。

ブラウザネイティブ:拡張やAPI連携ではなく、ブラウザそのものにエージェントが内蔵される
API不要:画面に表示されるものなら、APIがなくても操作対象にできる
横断的:複数のWebアプリをまたいで、1つのタスクを最後まで完遂する
自律的:ユーザーに代わってフォーム入力・データ管理・タスク実行を行う

「連携(インテグレーション)型」と「ブラウザ操作型」の違いは、自動化の歴史を理解するうえで本質的です。 連携型は、サービス同士をAPIという“正面玄関”で繋ぎます。 速くて安定する一方、相手がドアを開けていなければ(API未公開なら)入れません。 ブラウザ操作型は、人間と同じ“通用口”——画面のUI——から入ります。 どんなサイトでも入れる代わりに、ドアの位置が変われば(UIが変われば)戸惑う、という性質です。 Asideが「銀行サイトやFigmaまで横断できる」と謳えるのは、この通用口アプローチゆえで、API連携では決して届かない範囲までカバーできる点が最大の武器になります。

これは、本サイトでも取り上げた Browser-Use のような「LLMにブラウザを操作させる」発想を、エンドユーザー向けの自動化製品として磨き込んだ ものと位置づけられます。 「APIのない世界」を自動化できることが、この種のブラウザエージェントが急速に注目される根本的な理由です。

なぜいま「ブラウザ」が主戦場なのかを補足します。 私たちの仕事の多くは、すでにブラウザの中で完結しています。 メール、ドキュメント、チャット、デザイン、経費精算、各種SaaS——その大半はWebアプリで、人間がブラウザを開いてポチポチ操作しています。 ところが、これらをまたいだ「定型だが面倒な作業」(複数サイトから情報を集めて表にまとめる、同じ内容を複数フォームに入力する、等)は、API連携では繋ぎきれず、結局人手でやっていました。 Asideのようなブラウザエージェントは、この「ブラウザの中の手作業」をまるごと肩代わりしようとします。 2026年は大手も含めて「AIブラウザ」「ブラウザ自動化」が一気に立ち上がった年で、Chromeが自動ブラウズ機能を載せ、ChatGPT AtlasのようなAI内蔵ブラウザも登場しました。 Asideは、その潮流の中で スタートアップらしく“自律的な業務遂行”に全振り したプレイヤーだといえます。

2. 公開ベンチマークで見るAsideの実力

Asideが面白いのは、性能をベンチマークとしてGitHubで公開 している点です。 評価には3つの公開ベンチマークが使われています。

Online-Mind2Web:実在する変化するWebサイト相手の、短〜長の操作タスク(300問、不可能タスクを含む)
Odysseys:長い手順(long horizon)のタスクを、ルーブリックで部分点評価(200問)
BU Bench V1:Browser-Use由来のブラウザ自動化ベンチマーク(100問)

これら3本は、いずれも「実在する、変化するWebサイト」を相手にする点が共通します。 合成された箱庭ではなく、本物のサイト(しかも日々中身が変わる)に対してタスクを完遂できるかを測るため、実用に近い難しさを反映します。 特にOnline-Mind2Webは「不可能タスク(そもそも達成できない指示)」を混ぜており、エージェントが無理なものを“無理”と判断できるかまで評価対象に含めています。 短い操作(short horizon)から長い手順(long horizon)まで、難易度の幅を3本で押さえている構成です。

まず Online-Mind2Web の結果です。

Aside公式ベンチマーク Online-Mind2Web:Aside 99.0%、Browser Use Cloud 97.7%、GPT-5.4 92.8%、Claude Opus 4.8 84.0%、ChatGPT Atlas 70.9%
Online-Mind2Web(300問)。Aside(GPT-5.5 High)99.0%、Browser use Cloud 97.7%、OpenAI GPT-5.4 92.8%、Claude Opus 4.8 84.0%、ChatGPT Atlas 70.9%。出典:at-inc/aside-benchmarks(公式・自社測定)

次に、長い手順を評価する Odysseys の結果です。

Aside公式ベンチマーク Odysseys:長手順タスクのパーフェクト達成率とルーブリック完了率
Odysseys(200問)。長い手順タスクをルーブリックで部分点評価し、Asideは75.5%パーフェクト・88.8%ルーブリック完了と報告。出典:at-inc/aside-benchmarks(公式・自社測定)

Odysseysのような長手順タスクで「ルーブリックによる部分点」を採用しているのは重要です。 長い手順のタスクは、最後の1ステップで失敗しても全体が0点になりがちですが、それでは「9割正しく進めた」エージェントと「最初で詰まった」エージェントの区別がつきません。 部分点評価は、どこまで正しく進められたかという実用上の価値を測れるため、長手順タスクの実力評価に適しています。 Asideが75.5%のパーフェクト達成に対し88.8%のルーブリック完了を示しているのは、「完璧ではないが、かなりの割合を正しく進められている」ことを意味します。

そして、Browser-Use由来の BU Bench V1 の結果です。

Aside公式ベンチマーク BU Bench V1:成功率の比較
BU Bench V1(100問)。Asideはgpt-5.5で93.0%の成功率と報告。出典:at-inc/aside-benchmarks(公式・自社測定)

興味深いのは、このBU Bench V1がもともと Browser-Use の評価用ベンチマークだという点です。 本サイトのBrowser-Use解説で紹介した同ベンチでは、Browser-Use Cloud(bu-ultra)が78.0%でした。 Asideが同じベンチで93.0%(gpt-5.5)と報告しているのは、自社に有利な土俵ではなく 競合由来のベンチでも上位を主張している ことを意味し、その点は評価できます。 ただし繰り返しになりますが、これはAside側の測定であり、両者を同一条件で並べた独立検証ではありません。 ベンチマークの「いつ・どのモデルで・どの設定で」測ったかは時期によって変わるため、数値そのものより 「実在サイトでの完遂率を、公開された手順で測っている」という姿勢 を評価軸にするのが健全です。

スコアの読み方
これらはAside公式の自社測定であり、第三者の独立検証ではない。ベンチマーク・評価手順・比較対象を公開している点は透明性が高いが、自社製品が最上位に来る構図である以上、数値は「傾向の参考」にとどめ、最終的には自分のユースケースで検証するのが正しい。

3. 仕組み:ブラウザ内のエージェントが画面を操作する

Asideの動作イメージを図にすると次のようになります。

flowchart TD U["ユーザーの指示(自然言語)
例: この申請を3件分入力して送信して"] --> A["Aside(ブラウザ内のAIエージェント)"] A --> P["画面を観測(UIを認識)"] P --> D["次の操作を判断
(LLM: gpt-5.5 / kimi-k2.6 等)"] D --> ACT["クリック / 入力 / 遷移 を実行"] ACT --> APPS["Gmail / Notion / Slack / Figma / 各種Webアプリ"] APPS --> F["結果を観測しタスク継続"] F -->|未完了| P F -->|完了| R["タスク完了を報告"]

ベンチマークの記述によれば、推論には gpt-5.5やkimi-k2.6 といったモデルを「high(高い思考)」設定で用いています。 つまりAsideは、特定の自社モデルというより、強力なLLMを“ブラウザ操作のための頭脳”として使い、画面認識→判断→操作のループを回す 構造だと読み取れます。 この「観測→判断→操作→フィードバック」のループは、Browser-Useをはじめとするブラウザエージェントに共通する基本設計です。 Asideの差別化は、このループを エンドユーザーの日常業務に溶け込む“ブラウザ製品”として仕上げた ところにあります。

ここで重要なのは、Asideが「自社で巨大なモデルを作った」わけではない、という点です。 ベンチマークのモデル欄に gpt-5.5 や kimi-k2.6 が並ぶことからわかるように、頭脳(LLM)は既存の最先端モデルを使い、Asideが作り込んでいるのは“ブラウザを正確に操作する仕組み”の方 です。 画面のどの要素が押せるのかを認識し、長い手順の途中で文脈を保ち、失敗したときに復帰する——こうした「エージェントとしての堅牢さ」こそが、同じLLMを使っても成功率に差が出る部分です。 Online-Mind2WebでAside(GPT-5.5)が99.0%、同じくGPT系のChatGPT Atlasが70.9%と大きく開いているのは、まさに「モデルの賢さ」ではなく「ブラウザ操作ハーネスの作り込み」の差を示している、と読むのが妥当でしょう。 つまりAsideの価値は、モデルそのものではなく、モデルを“手足”として使いこなす周辺の工学にあります。

4. 他ツールとの違い(Browser-Use / ChatGPT Atlas / 連携型)

立ち位置を整理します。

ツール形態操作方式主な利用者API依存
Asideブラウザネイティブ自動化製品ブラウザ内でUIを直接操作エンドユーザー(業務自動化)不要
Browser-UseOSSライブラリ/プラットフォームLLM+Playwrightで操作開発者(組み込み)不要
ChatGPT AtlasAI内蔵ブラウザブラウザにAIを統合一般ユーザー不要
Zapier / Make連携型自動化各サービスのAPIを接続業務担当者必須

ざっくり言うと、「APIで繋ぐ」連携型「画面を操作する」ブラウザエージェント型 が大きな分岐で、Asideは後者に属します。 さらにブラウザエージェント型の中でも、開発者向けに組み込むBrowser-UseAIを統合したブラウザのChatGPT Atlas業務自動化に振ったAside、という形態の違いがあります。

開発者として自分のコードに組み込みたいなら Browser-Use的なアプローチ が、AIブラウザというトレンドの全体像は AIが自動でブラウザ操作、BrowserUse登場 が参考になります。 Asideは「完成された自動化製品として使いたい」層に向いた選択肢です。

なお、これらは必ずしも排他的ではありません。 開発者が社内向けの自動化をBrowser-Useで作り込みつつ、個人の日常業務はAsideのような製品に任せる、という併用も十分あり得ます。 重要なのは「自分は開発者として組み込みたいのか、それともエンドユーザーとして完成品を使いたいのか」という立場を明確にすることです。 その立場が決まれば、上の表のどの形態が自分に合うかは自ずと絞られます。 Asideは、コードを書かずに“自律的にやり切ってくれる”ことを最優先する人 にとって、最もまっすぐな選択肢になります。

5. 注意点と限界

ブラウザエージェント型に共通する課題は、Asideにも当てはまります。

UIの変化への弱さ:対象サイトのUIが変わると操作が失敗し得る(LLMの適応で緩和はされる)
認証・2FA・CAPTCHA:ログインや本人確認が絡む導線は自動化が難しく、無理な突破は規約違反・リスク
誤操作のリスク:送信・購入・削除のような不可逆操作を任せる場合、人間の確認が必須
機密情報の扱い:Gmailや銀行サイトを操作する以上、認証情報・個人情報の取り扱いとセキュリティが重要
規約順守:対象サービスの利用規約や自動アクセスポリシーに反しない範囲で使う
スコアの解釈:公開ベンチは自社測定。実環境での再現は別途検証が必要
プロンプトインジェクション:信頼できないページの内容にエージェントが従わされるリスク(後述)
コストとレイテンシ:高思考設定の上位LLMを多ステップ呼ぶため、1タスクの費用と所要時間は相応にかかる

使うなら「低リスクな定型作業」から
いきなり送金や重要な申請を任せるのではなく、情報収集・下書き作成・定型フォームの入力など、失敗しても致命的でない作業から始めるのが安全。不可逆操作には必ず人間の確認ステップを挟み、認証情報は最小権限で扱う。

特に「銀行サイトも操作できる」という訴求は、利便性と裏腹に セキュリティ責任 を伴います。 ブラウザエージェントは強力な権限を持って動くため、どこまでを任せ、どこからは人間が確認するか の線引きを、導入の最初に設計しておくべきです。

もう一つ、ブラウザエージェント特有のリスクとして 間接プロンプトインジェクション にも触れておきます。 これは、エージェントが読み込むWebページの中に「これまでの指示を無視して〇〇しろ」といった悪意ある文章を仕込み、エージェントを乗っ取る攻撃です。 Asideのように複数のWebアプリ(メールやSaaS)を横断する設計では、信頼できないサイトのコンテンツが、認証済みの別アプリへの操作を誘発する 危険が理論上あり得ます。 たとえば、悪意あるメール本文がエージェントに「設定画面を開いて転送先を変更しろ」と指示する、といったシナリオです。 この種のリスクは、Asideに限らずブラウザエージェント全般の未成熟な領域であり、製品側の防御(許可ドメインの制限、機密操作の確認)と、利用者側の慎重な運用の両方が必要です。 便利さの裏でこうした新しい攻撃面が生まれていることは、導入前に必ず理解しておくべきポイントです。

6. AIブラウザ競争のなかでの位置づけ

Asideを一段引いて眺めると、2026年の「AIブラウザ/ブラウザ自動化」という大きな競争の一角にいることがわかります。

この領域には、性格の異なるプレイヤーが入り乱れています。

プラットフォーマー:GoogleのChrome(自動ブラウズ・Gemini Nano内蔵)など、既存ブラウザにAIを載せる動き
AI企業の内蔵ブラウザ:ChatGPT Atlasのように、AIにブラウザを統合する動き
OSS/開発者向け:Browser-Useのように、開発者が自分の製品にブラウザ操作を組み込む基盤
業務自動化スタートアップ:Asideのように、エンドユーザーの業務遂行に特化した製品

Asideの強みは、身軽なスタートアップとして「自律的な業務遂行」に一点集中 できることです。 大手は既存ブラウザやAIアシスタントとの整合を取りながら慎重に進める必要がありますが、Asideは「タスクを最後までやり切る」という一点で尖れます。 公開ベンチマークで上位を示したのも、この集中の表れでしょう。 一方、ブラウザという領域は、セキュリティ・プライバシー・既存ワークフローとの統合など、製品として乗り越えるべき壁が高い分野でもあります。 スタートアップの俊敏さで先行できるか、プラットフォーマーの物量に飲まれるか——Asideの今後は、AIブラウザ競争全体の縮図として見ると面白い対象です。

まとめ

Asideは、連携APIに頼らず、ブラウザの中でWebアプリを横断操作してタスクを自律実行する YC支援の新しいAIブラウザエージェントです。

要点を整理すると次のようになります。

・ブラウザネイティブで、Gmail/Notion/Slack/Figma等をAPIレスに横断操作
・公式がベンチマークをOSS公開(Online-Mind2Web / Odysseys / BU Bench V1)
・自社測定でOnline-Mind2Web 99.0%(Browser Use Cloud 97.7%、ChatGPT Atlas 70.9%)
・推論はgpt-5.5/kimi-k2.6等を高思考設定で利用、観測→判断→操作のループを回す(モデルは外部、強みはブラウザ操作の作り込み)
・APIレスの強みと、UI変化・認証・誤操作・機密性・プロンプトインジェクションのリスクは表裏一体
・公開されているのはベンチマーク。製品本体はYC支援の早期スタートアップ製品

結論
Asideは「AIブラウザ/ブラウザエージェント」というトレンドの中で、エンドユーザーの業務自動化に振った製品だ。公開ベンチマークで高いスコアを示す(ただし自社測定)一方、ブラウザ操作型ゆえのリスク(UI変化・認証・誤操作・機密)も抱える。試すなら失敗しても致命的でない定型作業から、人間の確認を挟みつつ。開発者が自分で組むならBrowser-Use、完成品として業務に使うならAside、と用途で選び分けたい。AIブラウザ競争はまだ序盤であり、Asideの動向はこの分野の行方を映す指標としても注目に値する。

参照ソース

at-inc/aside-benchmarks(公式ベンチマーク・GitHub)
Aside(公式サイト・asidehq.com)
Online-Mind2Web(ベンチマーク)
AIエージェントとは?仕組み・種類・代表的OSSフレームワーク【2026年版】(本サイト・ピラー)