AIの精度が変わる逆転の発想:答えではなく「失敗」を先に出させる

AIに仕事を頼むとき、多くの人はプロンプトを磨くことに集中します。

よりよい答えを引き出そうと、言葉を選びます。
そして、指示を細かく書き込んでいくわけです。

でも、ほとんど誰も試していない手順があります。
それは、タスクを始める前に、AI自身へ「自分はどこで失敗しそうか」を予測させる方法です。

出力ではなく「指示」を直すという発想

いつもの流れを思い出してください。

プロンプトを書く。
実行する。

出てきた結果がいまいち。
何が悪かったのかを逆算して、書き直す。

多くの人が、このループを延々と繰り返しています。

投稿者が提案していたのは、順番を入れ替えるやり方でした。
実行する前に、AIへ失敗の予測をさせます。

すると指示の穴がその場で見えます。
だから、一度も走らせないうちに修正できるのです。

つまり、出力をデバッグするのではありません。
指示そのものをデバッグするわけです。
この違いが、思った以上に大きな差を生みます。

投稿で紹介されていたプロンプトの趣旨は、こういうものでした。
タスクに取りかかる前に、まず自分がどう失敗しそうかを予測してほしい。

そのうえで、考えられる上位5つの失敗を挙げる。
観点は次の4つです。

そして、それぞれの失敗について、それを防ぐために私が足すべき指示を1つ示す。
そこで一旦止まる。
私が返事をするまで、タスクには着手しない。

最後の「止まる」という指示が肝です。
先に失敗リストを受け取ります。
こちらが指示を補強します。

それから、ようやく本番を走らせる。
この順序が、すべてを変えます。

理由はシンプルです。

あなたのプロンプトには、あなた自身に見えない穴があります。
自分が何を意図したかは、あなたにはわかっています。

けれど、モデルはそれを知りません。
だから、あなたにとって自明な前提が、モデルにとっては空白のまま放置されてしまうのです。

失敗の予測とは、いわばモデルが黙って置こうとしていた前提を、表へ引きずり出す作業です。
あるコメントは、これをラバーダック・デバッグにたとえていました。

プログラマーがアヒルのおもちゃに向かって問題を説明する。
すると、口に出すだけで解決策が見えてくる。
あの現象と同じだというわけです。

AIは鏡のような役割を果たします。
あなたの曖昧さを、そのまま映し返してくれるのです。

だから、本当の作業はモデル側ではありません。
あなたの側で起きています。

コメントの中に、この手法をもう一段引き上げる提案がありました。

5つの失敗を挙げさせます。
そのあと、問いをもう1つ足すのです。

「その失敗が起きたら、出力のどこを見れば気づけるか」を書かせます。
漠然とした警告のままでは、検証のしようがありません。
けれど「ここを見ればわかる」という形にしておけば、本番の出力をそのチェックと突き合わせられます。

繰り返し使うタスクなら、もうひと手間あります。
失敗リストを毎回ゼロから作らせないことです。

実行のたびに新しいリスクを5つ思いつかせる。
すると、それはただのブレインストーミングに堕してしまいます。

そうではなく、小さなリスク台帳を保ちます。
そして、タスクが本当に変わったときだけ項目を足す。
こうすれば、軽量な評価基準として機能していきます。

便利な反面、過信は禁物です。

あるコメントが、鋭い点を突いていました。
この予測は、わかりやすい読み違いならうまく言い当てます。

けれど、「自信たっぷりに間違える」たぐいの失敗には盲目なままだ、というのです。
そして、本当に警戒すべきなのは、まさにその自信過剰なミスのほう。

だから失敗リストは、完成したリスク監査として扱ってはいけません。
これから詰めていく下書きと考えるのが賢明でしょう。

もう1つ、見落とせない点があります。
4番目の問い「モデルにとって本当に手強いのはどこか」です。

ここに挙がった項目は、プロンプトをいくら磨いても改善しきれない領域を示しています。
言い換えれば、「これ以上の指示は無駄だから、自分の目で確かめろ」という合図です。

プロンプトを締め直す段階と、手作業で検証すべき段階。
その境界線が、ここではっきり見えてきます。

この手法の本質は、AIに完璧な答えを吐かせることではありません。
あなた自身に、自分のプロンプトを敵の目で読み直させることにあります。

やることは単純です。
失敗を先に語らせます。
その穴を埋めます。

それから走らせる。
出力を直すのではなく、指示を直すわけです。

さらに、観察できるチェックへ落とし込めば、検証の精度はもっと上がります。
ただし、自信過剰な間違いまでは見抜けません。
この限界も、頭の片隅に置いておいてください。

特に効果が出るのは、何度も繰り返すタスクです。
一度見つけた修正は、そのプロンプトの恒久的な改善として残り続けます。

ClaudeでもChatGPTでも試せます。
次に重たい作業を頼む前に、まず「どう失敗しそう?」と一言聞いてみてはどうでしょうか。