Canary(YC W26) は、コードベースを読み込んでPRの変更内容を理解し、影響を受けるユーザーフローのテストを自動生成・実行するAIエージェントだ。WindsurfやCognition、Googleでコーディングツールを開発してきた2人が創業した。
PRをプッシュするとCanaryがdiffを解析し、プレビュー環境に対してエンドツーエンドのテストを実行。結果と録画をPRコメントとして直接投稿し、想定外の挙動を自動でフラグ立てする。生成されたテストは回帰スイートに組み込むことも可能で、平文英語でテスト内容を指示するだけでテストスイートを作成・スケジューリングできる。
導入企業では、請求フローで元の提案額と約1,600ドルのズレが生じるバグをリリース前に検出した実績も。AIでリリース速度が上がる一方、本番環境でのデグレが増加している現状に対応するツールとして注目を集めている。