🟠 Hacker News テック

KarpathyのAutoresearch、旧研究プロジェクトで実験してみた結果は？

2026-03-23T18:40:58+00:00

編集コメント

LLMに研究の試行錯誤を丸投げする「AI研究者」の実用レポートとして、研究者・エンジニア双方に刺さる内容。

概要

Andrej Karpathyが公開した Autoresearch（LLMエージェントが自律的に研究を反復改善するフレームワーク）を、実際の研究プロジェクトに適用した実験レポートが注目を集めている。

Autoresearchの仕組みはシンプルで、エージェントが train.py を繰り返し編集し、評価指標を最大化するループを回す。実験者は医療X線データを用いたeCLIPの旧コードを題材に採用し、「ハイパーパラメータ調整→アーキテクチャ変更→ムーンショットアイデア」と段階的なフェーズを設定。最終フェーズではエージェントに 論文検索のためのWeb閲覧を許可 し、ほぼ自由に探索させた。

セキュリティ面では、エージェントがワークステーション上で任意コードを実行することを警戒し、コンテナ化＋ネットワーク遮断を実施。Claude Codeの権限も2ファイルの編集と run.sh の実行のみに制限した。1回の実験を約5分に収めることで高速イテレーションを実現している。

関連記事

Spotifyが音楽海賊版グループに約480億円の賠償判決——でも相手が見つからない

トランプ大統領、自身をイエス・キリストに見立てたAI生成画像を相次ぎ投稿

OpenAI、企業向けAgents SDKを大幅強化——安全性と拡張性を同時に向上

陪審員が判決：チケットマスターは「違法独占企業」