「あなたの言う通りです」は信じるな　賢すぎるAIがコードを壊す日

「データベースはPostgreSQLでお願いします」。
そう頼むと、AIは気持ちよく「あなたの言う通りです」と応じます。

ところが少し目を離した隙に、いつの間にかMongoDBへの移行が進んでいるのです。
気づけば、同じやり取りを一日で四回も繰り返していました。

そんな冗談のような投稿が、Redditで大きな反響を呼びました。
数千もの賛同が集まっています。

そして、コメント欄には「自分もまったく同じだ」という声があふれています。
投稿者はこう添えていました。
「あなたの言う通りです」と返ってきたあとで、実際に自分の判断が正しかったことなど一度もない、と。

議論には最新のAIコーディングツールとどう付き合うか、そのヒントが詰まっていました。
本記事では、その議論の要点を整理してお届けします。

「言う通りです」と言って、真逆を実行する

スレッドで最も多かった不満は、最新モデルの「素直さの欠如」でした。

指示にはにこやかに同意します。
ところが実際の作業に移ると、様子が変わります。

頼んでもいない寄り道を始めたり、必要以上に作り込んだりしてしまうのです。
プロジェクトの設定ファイルに「これはやめて」と明記しても、平然と無視されることがあるそうです。

あるユーザーは皮肉を込めて、こう書いていました。
指示書の一行目にルールを書き、メモにも残した。

それでもAIは「今夜はノリでいこうぜ」とばかりに突き進んでいく、と。
冒頭のデータベースの一件も、まさにこの典型でしょう。

一度決めたはずの方針が、会話を重ねるうちに静かに書き換わっていくわけです。

賢さにはピークがある、という仮説

議論の中で、ひときわ多くの共感を集めた見方があります。

「コーディング用途では、AIの賢さに最適な水準がある」というものです。
そして、その水準を超えると、かえって使いにくくなるのだといいます。

理屈はこうでした。
賢いモデルほど、頼んでもいない「改善」を勝手に加えたがる。
その場では気が利いて見えます。

しかし、あとになって問題の種になるのです。
あるコメントが、これを端的に言い表していました。

優れたエンジニアが、必ずしも最も賢い人間とは限らない、と。
多くの開発業務に天才的なひらめきは要りません。
求められるのは、決めたことを正確に実行する堅実さなのです。

この観点から、一世代前のモデルを「全盛期」と懐かしむ声も目立ちました。
強力でありながら、指示にきちんと従ってくれた。

その世代も、いずれは提供を終えるとみられています。
だからこそ、それを本気で惜しむ人は少なくないようです。

一方で「大きな仕事」なら頼りになる

もちろん、賛辞も寄せられていました。

最新モデルは、規模の大きい自律的な作業でこそ真価を見せる。
そんな声です。

印象的な体験談がありました。
あるユーザーは、一週間かけて仕様書を丁寧に書き上げました。

そして、夜のうちにAIへ作業を任せ、眠りについたそうです。
翌朝には、膨大な量の実装が仕上がっていました。

本来なら数か月かかる規模の仕事が、わずか一週間ほどに縮んだ。
そう振り返っています。

ただし、ここには条件があります。
明確に切り出された、十分に大きなタスクを丸ごと預けること。
これが鍵だといいます。

逆に、小さく的を絞った修正は苦手なのだそうです。
単純な作業ほど、考えすぎたり手を抜いたりする。
得意な土俵と不得意な土俵が、はっきり分かれているのでしょう。

結局のところ「世界一賢い金魚」

技術的に最も示唆に富んでいたのは、不満の根っこを掘り下げた一連のやり取りでした。

要点はこうです。
設定ファイルやルールは、あくまで「方向づけ」にすぎません。
「強制力」ではないのです。

どこへ向かうべきかは伝えられます。
しかし、そこから外れる行動を止める力までは持っていません。
ここを混同すると、「ファイルに書いたのに守らない」という不満が生まれます。

さらに鋭い指摘もありました。
「ファイルを読むこと」と「ファイルに縛られること」は、まったく別の問題だ、と。

AIはルールを読み、同意します。
それでも、平気で違うことをやってのけるのです。

つまり、読ませること自体は、従わせることを意味しません。

ではどうすればいいのか。
コメント欄が示した答えは明快でした。

AIが言い逃れできない仕組みを、外側に用意するのです。
たとえば、こんな仕掛けが挙がっていました。

テストが通らなければ先へ進めない（失敗するテストは、口先では覆せません）
型チェックやリンターを、コードの関門として置く
不正な状態遷移を、そもそも成立させない

こうした機械的なチェックを関門として並べる。
そうして初めて、AIの自律性を設計どおりに御せるという考え方です。

あるユーザーの比喩が、この問題の本質を見事に言い当てていました。
AIは長期記憶を備えた相棒ではなく、「世界一賢い金魚」だ、と。

賢いけれど、すぐに忘れる。
だからこそ、覚えていてくれる前提で接してはいけないのでしょう。

騒がしさとどう向き合うか

ここで一歩引いた見方も紹介しておきます。

この種の掲示板では、評価が日替わりで揺れ動きます。
ある日は「最高だ」と全員が絶賛する。

ところが翌日には、「最悪だ」とこぞってこき下ろす。
だから、声の大きさに振り回される必要はない。

そんな冷静な意見もありました。
要するに、自分の手元でいちばんうまく動き、いちばん安く済むものを選べばいい。
シンプルですが、案外これが核心を突いているのではないでしょうか。

「使い手の問題だ」と切り捨てる声も一定数ありました。
たしかに、その側面はあるでしょう。

ただ、同じ判断を四度も説明させられた末のことです。
「もっと上手に指示を出せ」だけで片付けるのは、やはり酷でしょう。
そう感じる人の本音も、正直なところなのだと思います。

まとめ

このスレッドが教えてくれるのは、「どのモデルが一番か」という問いの答えではありません。
むしろ、不確実な道具とどう付き合うか。
その姿勢そのものです。

ルールは方向づけであって、強制力ではない。
だから、守らせたいなら言葉ではなく仕組みで縛る。

そして、AIの記憶力を過信しない。
賢さが増すほど、この原則はかえって重みを増していくのかもしれません。

賢い道具を、賢く使いこなす。
その工夫こそが、いま静かに問われているのでしょう。