こんにちは、Heywaです。
ブラウザ自動化の歴史において、Seleniumは間違いなく「巨人」でした。しかし、AIエージェントが自律的にブラウザを操作する時代が到来した今、従来のテストフレームワークでは対応しきれない課題が見え始めています。
そんな中、2025年末に大きなニュースが飛び込んできました。Seleniumの共同開発者であるJason Huggins氏が、AIエージェント向けに特化した新しいブラウザ自動化ツール「Vibium」を公開したのです。
今回は、この「Vibium」をClaude Codeと組み合わせて実際に試してみた結果と、従来のSelenium(やPlaywright)との違い、そして「今すぐ移行すべきか?」という判断基準について、システム思考の観点から詳細に解説します。
Vibiumとは何か?Seleniumとの決定的な違い
Vibiumの公式な自己定義は「Browser automation for AI agents and humans(AIエージェントと人間のためのブラウザ自動化)」です。ここで重要なのは、Vibiumが「テストフレームワークではない」という点です。
SeleniumやPlaywrightが「テストの実行から検証(アサーション)までを完結させる全部入りツール」であるのに対し、Vibiumは「ブラウザ操作のランタイム」に特化しています。
| 比較項目 | Selenium / Playwright | Vibium |
|---|---|---|
| 主な用途 | E2Eテスト、CI/CDでのリグレッションテスト | AIエージェントによる探索的テスト、即席の自動化 |
| 通信プロトコル | WebDriver / CDP (Chrome DevTools Protocol) | WebDriver BiDi (W3C標準の双方向通信) |
| セットアップ | ドライバの管理や環境構築が必要(Playwrightは比較的楽) | npm install vibium のみ(Chrome for Testingも自動DL) |
| AI連携 | 後付けの拡張機能やMCPサーバーが必要 | MCPサーバーを標準内蔵(ゼロセットアップで連携) |
| テスト機能 | ランナー、アサーション、レポート出力が内蔵 | なし(Vitestなどの外部ライブラリと組み合わせる必要あり) |
特に注目すべきは、VibiumがWebDriver BiDiというW3C標準の新しい通信規格を採用している点です。これにより、将来的にはブラウザ依存のない長期的な安定性が期待できます。
Claude CodeでVibiumを動かしてみた
Vibiumの最大の強みは、Claude CodeなどのAIエージェントとの連携が異常なほど簡単なことです。実際にMac M1環境で試してみました。
1. 驚愕のゼロセットアップ
ターミナルで以下のコマンドを叩くだけで、Claude CodeにVibiumのMCPサーバーが接続されます。
claude mcp add vibium -- npx -y vibium
これだけで準備完了です。Selenium時代にChromeDriverのバージョン不整合で苦しんだ経験からすると、魔法のような手軽さです。
2. 自然言語でのブラウザ操作指示
Claude Codeに対して、以下のように自然言語で指示を出します。
「Vibiumを使って awesome03.com にアクセスし、検索欄に『Python』と入力して検索ボタンをクリックして。その後、結果のスクリーンショットを撮って保存して。」
すると、Claude CodeはVibiumのMCPツールを呼び出し、自律的にCSSセレクタを推論しながらブラウザを操作し始めます。もし最初のセレクタで要素が見つからなくても、AIが「別のセレクタを試してみます」と自己修復的にリトライしてくれるのが非常に強力です。
VibiumのV2ロードマップ:AI駆動の真骨頂
現在リリースされているV1でも十分に面白いですが、Jason Huggins氏が描くV2のロードマップはさらに野心的です。
- Cortex(Thinkレイヤー): SQLiteとベクトル埋め込みを利用したアプリマップ・メモリ機能。AIがサイトの構造を記憶します。
- Retina(Senseレイヤー): DOMスナップショットとスクリーンショットによる高度な画面認識。
- 自然言語ロケーター:
vibe.do("ログインボタンをクリック")のように、CSSセレクタやXPathを一切書かずに要素を操作できるようになります。
これが実現すれば、プログラミング知識のないメンバーでも、自然言語だけで堅牢な自動化スクリプトを構築できる世界がやってきます。
結論:今すぐVibiumに移行すべきか?
では、現在SeleniumやPlaywrightで構築している自動化パイプラインを、今すぐVibiumに移行すべきでしょうか?
結論としては、「用途による使い分け」が正解です。
「VibiumがSeleniumの完全な代替品になる」という認識は現時点では誤りです。CI/CDパイプラインに組み込んで毎日安定稼働させる「決定論的」なリグレッションテストや、1円単位の精密な金額検証が必要なスクレイピングにおいては、引き続きPlaywrightやSelenium(適切なエラー処理を実装したもの)が圧倒的に有利です。
一方で、以下のようなシーンではVibiumが輝きます。
- 探索的テスト: 「この画面で想定外の操作をしたらどうなるか」をAIに半自動で調査させる。
- 即席の動作確認: テストコードを書くほどではない一時的なタスクを、Claude Code経由でサクッと実行させる。
- 非エンジニアによる自動化: 将来的に自然言語ロケーターが実装されれば、業務部門の担当者が自ら自動化ツールを作れるようになります。
私は現在、堅牢性が求められるボートレース予測のデータ収集にはSelenium(設定ファイル分離・指数バックオフ実装済み)を使い続けつつ、新しいサイトの構造調査や単発のスクレイピングタスクにはClaude Code + Vibiumを使う、というハイブリッド運用を始めています。
AI時代のブラウザ自動化は、「コードでガチガチに固める」アプローチと「AIの推論に柔軟に任せる」アプローチの使い分けが鍵になります。皆さんもぜひ、この新しい波「Vibium」を体験してみてください。
