【実録】AIエージェント「Manus」の実力は？ナンプレを5分で解く驚異の性能を徹底レビュー

はじめに次々と新しいサービスが登場する生成AIの世界。その中でも、自律的にタスクを実行する「AIエージェント」は、私たちの働き方を根底から変える可能性を秘めています。今回は、世界初の汎用AIエージェントとして注目を集める「Manus（マヌス）」について、弊社代表の岡田が実際に使用した感想を、エンジニアの秋月との対談形式で深掘りしていきます。プログラミングや分析タスクにおけるManusの実力、得意なこと、そして現時点での限界とは？具体的な使用例を交えながら、そのポテンシャルを徹底的にレビューします。世界初の汎用AIエージェント「Manus」とは？岡田：今日話したいテーマがAIエージェントの「Manus」です。このツールの使い道が、ようやく具体的にわかってきました。Manusは、Butterfly Effectという会社が開発した「世界初の汎用AIエージェント」と謳われています。その最大の特徴は、ユーザーの指示に基づき、クラウド上にサンドボックス環境（Ubuntu）を構築し、その中で自律的にタスクを実行してくれる点にあります。秋月：なるほど。単にテキストを生成するLLMとは違い、実際にコンピュータを操作して作業を進めてくれるわけですね。岡田：その通りです。他のAIエージェント、例えばChatGPT o3（*注1）などと比較したとき、Manusの際立った特徴として挙げられるのが、実行するタスクを「TODOリスト」として最初に明示してくれることです。これから何をどのような手順で行うのかをユーザーが事前に把握できるため、プロセスの透明性が非常に高い。タスクが完了するごとにチェックマークがついていくので、進捗管理も容易です。事例①：ナンプレを5分で解答。ChatGPT o3を圧倒する速度と精度岡田：Manusの実力を測るために、いくつかタスクを依頼してみました。その一つが「ナンプレを解かせる」というものです。これが驚くべき結果でして。以前、同じ問題をo3に解かせた際は約20分かかったのですが、Manusはわずか5分ほどで正確に解き明かしました。秋月：20分が5分に！それは驚異的な速さですね。なぜそこまで差が出たのでしょうか？岡田：おそらく、Manusのタスク処理能力、特にPythonコードをスムーズに実行できる環境が大きく影響していると見ています。Manusはまず、ナンプレの問題を解析し、それを解くためのPythonコードを自動で生成しました。さらに、その解答が正しいかどうかを検証するためのコードまで自動で書き上げ、実行してくれました。この一連の流れが非常にスムーズで、一切の無駄がありませんでした。秋月：なるほど。単に答えを出すだけでなく、その答えを検証するプロセスまで自動化してくれるのは信頼性が高いですね。岡田：はい。特にデータの正規化のような、構造化された問題に対しては絶大な強さを発揮する印象です。タスクを細かく分解し、一つひとつ着実に実行していく。その動きは、まるで熟練のプログラマーを見ているかのようです。Manusの強み：なぜプログラム関連のタスクに強いのか？秋月：話を聞いていると、Manusは特にプログラムで解決できるような、論理的なタスクに強い印象を受けますね。岡田：まさしくその通りです。分析系のタスクに関しても、o3より強いと感じる場面が多々ありました。その理由の一つとして考えられるのが、先ほども触れた「Ubuntuが起動する自由度の高い実行環境」の存在です。秋月：サンドボックス環境で、Pandas（*注2）のようなライブラリを自由にインストールしたり、Linuxコマンドでディレクトリを移動したり、ファイルを作成したりと、人間がコンピュータを操作するのに近い動きができますからね。岡田：そうなんです。実際の動作ログを見ると、cdコマンドでディレクトリを移動したり、touchコマンドでファイルを作成したりと、本当に人間のように環境を使いこなしています。この柔軟な実行環境を最大限に活用する能力が、Manusの強さの源泉なのでしょう。裏側のLLMモデルはおそらくOpenAIのものだとは思いますが、その動かし方が非常に巧みです。秋月：タスクの実行プロセスを後から詳細に振り返れるのも、教育的価値があって素晴らしいですね。どういう手順で問題を解決したのかが可視化されるのは、他にない大きなメリットです。事例②：大規模開発の限界と、光るポテンシャル岡田：一方で、Manusにも限界はあります。試しに「Dify（*注3）のようなLLMプラットフォームを開発してください」という、かなり大規模なタスクを依頼してみました。秋月：それはかなり無茶な要求ですね（笑）。結果はどうでしたか？岡田：結論から言うと、さすがにアプリケーションを完全に完成させることはできませんでした。しかし、その過程は非常に興味深かったです。まず、タスク分解の精度が驚くほど高く、どのような機能が必要かをWebで検索し、競合サービスをクロールして情報を収集し、クリック操作まで行うなど、ブラウザの自動操作までやってのけました。岡田：最終的に、API仕様書や丁寧なユーザーマニュアルまで生成してくれたのですが、肝心の本体は完成しませんでした。おそらく、これほど大規模なタスクになると、コンテキストウィンドウの制約に引っかかってしまうのでしょう。秋月：なるほど。ただ、タスクの計画能力や情報収集能力は非常に高いと。小規模な、いわゆる「使い捨ての便利アプリ」のようなものを作るのには、非常に向いているかもしれませんね。気になるコストは？無料で使えるクレジット制度岡田：Manusはクレジット制を採用していて、毎日ログインすると300クレジットがもらえる「ログインボーナス」のような仕組みがあります。そのため、私はこれまでずっと無料で利用できています。秋月：無料で試せるのはありがたいですね。クレジットはどのような時に消費されるのですか？岡田：最もクレジットを消費したのは、Webスクレイピングでリストを作成させた時です。これは単純にコンピュータの起動時間が長くなったためだと思われます。一方で、先ほどのナンプレや簡単なデータ整形であれば、1タスクあたり70〜150クレジット程度で収まりました。まとめ：Manusは「分析・コーディングタスク」の強力な相棒岡田：今回Manusを実際に使ってみて、特にコーディングや分析といった、プログラムで解決できるタスクにおいて非常に高いポテンシャルを秘めていると感じました。秋月：タスクを自動で分解し、TODOリストで進捗を可視化しながら、サンドボックス環境で縦横無尽にコマンドを実行していく。その動きは、まさに自律的に働くエンジニアのようです。岡田：大規模な開発はまだ難しいものの、日常的なデータ分析や、ちょっとしたツール開発、アルゴリズムの検証といった場面では、人間のエンジニアを強力にサポートしてくれる存在になるでしょう。「使い捨てのアプリ」を瞬時に作れる、という感覚は新しい体験でした。今後、AIエージェントがさらに進化していく中で、Manusが見せたような「自律的なタスク実行能力」が一つのスタンダードになっていくのかもしれません。その業務課題、AIで解決できるかもしれません「AIエージェントで定型業務を効率化したい」 「社内に眠る膨大なデータをビジネスに活かしたい」このような課題をお持ちではありませんか？私たちは、お客様一人ひとりの状況を丁寧にヒアリングし、本記事でご紹介したような最新のAI技術を活用して、ビジネスを加速させるための最適なご提案をいたします。AI戦略の策定から、具体的なシステム開発・導入、運用サポートまで、一気通貫でお任せください。「何から始めれば良いかわからない」という段階でも全く問題ありません。 まずは貴社の状況を、お気軽にお聞かせください。＞＞ AI開発・コンサルティングの無料相談はこちら（*注釈）ツール・用語解説注1：o3 ChatGPT o3モデルのこと。注2：Pandas データ分析を容易にするための機能を提供するPythonのライブラリ。データフレームという独自のデータ構造を用いて、数値や時系列データの操作・分析を効率的に行うことができる。注3：Dify LangGenius社が運営するLLM開発プラットフォーム https://dify.ai/jp