Gemini 3がマリオを完璧に再現：AIコーディングの新基準

AIモデルのコーディング能力を測る非公式なベンチマークがあります。
それは「マリオブラザーズのゲームを、オリジナルに可能な限り近い形で作れるか」というテストです。

単純に聞こえるかもしれません。
しかし、実は非常に難しい課題なのです。

なぜなら、単一のHTMLファイル内にすべてを実装しなければならないからです。
ゲームロジック、物理演算、グラフィック、操作性のすべてです。

最近、Googleの最新モデルGemini 3がこのベンチマークを見事にクリアしました。
そして、Redditコミュニティで大きな話題となっています。

この成果について、詳しく見ていきましょう。

マリオベンチマークの難しさ

このベンチマークが要求する条件は、次の通りです。

オリジナルのマリオブラザーズ1-1ステージを忠実に再現すること
すべてのテクスチャやグラフィックを手動で定義すること
これらをすべて単一のHTMLファイルに収めること

過去に多くのAIモデルがこのテストに挑戦しました。
しかし、完全にクリアしたモデルはありませんでした。

あるモデルはグラフィックが粗すぎました。
別のモデルは物理演算が不正確でした。
さらに別のモデルは、そもそもゲームとして動作しませんでした。

OpenAIのo1モデルがリリースされて以降も、状況は変わりませんでした。
複数の最新モデルでテストが行われました。

それでも、満足のいく結果は得られなかったのです。

Gemini 3の成功

Redditユーザーのkrzonkallaさんは、Gemini 3に次のようなプロンプトを送りました。

マリオブラザーズのゲームをコード化してください。オリジナルに可能な限り近い形で、詳細に手動定義されたテクスチャをインラインで含む単一のHTMLファイルとして作成してください。完全な1-1レベルを作ってください

結果は驚くべきものでした。

Gemini 3は、ほぼ完璧なマリオゲームを生成したのです。
まず、グラフィックの精度が高い点に注目です。

マリオのスプライトもNESオリジナルに忠実でした。
そして、ゲームの動作も滑らかです。
物理演算も適切に実装されていました。

投稿者によれば、バグ修正の指示は1回だけで済んだそうです。
これは驚異的な成功率と言えるでしょう。

他モデルとの決定的な差

投稿されたスクリーンショットを見ると、その品質の高さが一目瞭然です。

マリオのキャラクターデザインは細部まで再現されています。
単なる四角形ではありません。

簡略化されたグラフィックでもありません。
クラシックなマリオの魅力がそのまま表現されているのです。

他のモデルで生成されたゲームと比較すると、差は歴然でした。
ある投稿者は第2位のモデルの結果も共有しています。

しかし、Gemini 3の出力とは比較にならないレベルだったようです。

コミュニティの反応と技術的評価

この投稿は、AI開発コミュニティで大きな反響を呼びました。

あるユーザーは、Gemini 3が5つのプロンプトだけでWebベースのNESエミュレータを作成できたと報告しています。
それは、ドンキーコング3などのMapper 0ゲームが動作する本格的なエミュレータでした。

別のユーザーは、たった3つのプロンプトでパックマンを作成できたと述べました。
ただし、ゴーストの速度調整など、若干の微調整は必要だったようです。

技術的な観点からも評価が行われました。
Gemini 3自身によるコードレビューでは、セキュリティ面で問題なしと判定されました。

一方で、品質面では改善の余地があることも指摘されています。
具体的な課題は、物理演算がフレームレートに依存している点です。

これは、現代のハードウェアでは不安定になる可能性があります。
そのため、デルタタイム方式への変換が推奨されています。

興味深いことに、オリジナルのスーパーマリオブラザーズも同様の問題を抱えていました。
この意味で、Gemini 3の再現度は「あまりにも忠実すぎる」とも言えるでしょう。

限界と今後の課題

完璧に見えるGemini 3の出力にも、いくつかの制限があります。
生成されたゲームには、以下の要素が欠けています。

パワーアップアイテム
コインの収集システム
ステージ終了時の旗竿

とはいえ、これは初回のプロンプト結果です。
そのため、追加の指示で実装できる可能性は高いでしょう。

また、ソリティアのような特定のゲームは、まだ完璧に作れないという報告もあります。
つまり、ゲームの種類によって得意不得意があるようです。

AIコーディングの新時代

この成果が示すのは、AIのコーディング能力が新たな段階に入ったことです。

単純なコードスニペットの生成から、複雑なアプリケーション全体の構築へ。
この進化は、ソフトウェア開発の未来を大きく変える可能性があります。

かつて、学生はブロックされた学校のネットワークでゲームを探していました。
しかし、今の学生は違います。

AIに指示して、その場でゲームを作らせることができるのです。
技術の民主化が、また一歩進んだと言えるでしょう。

まとめ

Gemini 3によるマリオベンチマークの突破は、単なる技術的成果以上の意味を持ちます。

それは、AIが複雑なソフトウェアを理解し、再現できるレベルに達したことを示しています。
グラフィック、ゲームロジック、物理演算、ユーザーインターフェース。
これらすべてを統合し、動作するアプリケーションとして出力できたのです。

もちろん、完璧ではありません。
改善の余地はあります。
それでも、わずか1回のバグ修正指示でこのレベルのゲームを作れることは驚異的です。

AI支援によるソフトウェア開発は、もはや未来の話ではありません。
それは現実のものとなっています。

今回の事例は、Redditユーザーkrzonkallaさんの投稿に基づいています。
実際の検証結果や詳細は、元の投稿を参照してください。

AIのコーディング能力は日々進化しています。
次にどんな驚きが待っているのか、楽しみにしていきましょう。