Google の Gemini 2.5 Pro API の無料枠が突然廃止されました。
この知らせは、開発者コミュニティに衝撃を与えています。
本記事では、Reddit での議論をもとに、この変更の背景や影響、そして代替策について整理します。
何が起きたのか
Reddit の r/Bard コミュニティで、このニュースが話題となりました。
AI Studio のレートリミット一覧から、Gemini 2.5 Pro の無料枠が消えたのです。
事前告知はありませんでした。
そのため、プロジェクトが突然動かなくなった開発者も少なくありません。
影響は 2.5 Pro だけに留まりません。
2.5 Flash のリクエスト制限も大幅に引き下げられました。
以前は1日あたり250リクエストでした。
それが、わずか20リクエストまで削減されたのです。
実質的に使い物にならない水準と言えるでしょう。
さらに深刻なのは、有料ユーザーにも影響が出ている点です。
Tier 1 の有料ユーザーが利用できる 2.5 Pro のリクエスト数も激減しました。
1日あたり10,000から300へ。
「これではワークフローが成り立たない」という悲鳴が上がるのも当然です。
なぜ Google はこの決断をしたのか
Reddit のスレッドには、Google 社員(Logan Kilpatrick 氏)からのコメントも寄せられました。
その説明によると、背景には深刻なコンピュートリソースの不足があります。
Gemini 3.0 Pro のリリース以降、TPU(Tensor Processing Unit)はフル稼働状態が続いています。
有料顧客からの需要は過去最高を記録しました。
さらに、Gemini を搭載した製品も増え続けています。
限られたチップ資源を 3.0 Pro や Nano Banana Pro の成長に振り向けざるを得なかった。
これが実情のようです。
また、Tier 1 における不正利用や濫用への対策という側面もあります。
大規模な不正行為が発生しており、短期的な対応として制限を強化したと説明されました。
興味深い分析もコミュニティから寄せられています。
OpenAI の GPT-5.1 でトラブルが発生したタイミングで、Google は Gemini 3.0 Pro をリリースしました。
この絶妙なタイミングが、ユーザーの大量流入を招いたという見方です。
競合の失策を突く形での成功。
しかし皮肉にも、ハードウェア面での準備不足を露呈させたのかもしれません。
無料枠の本来の目的
Google 社員のコメントで繰り返し強調されていたのは、無料枠の位置づけです。
無料枠は、モデルを素早くテストし、自分のユースケースに合うかどうかを確認するためのものです。 長期的なサービスとして使うことは想定していません
このコメントに対しては賛否両論ありました。
「それならそうと最初から明示すべきだ」という声。
「事前告知なしに突然打ち切るのはひどい」という批判。
一方で、「AI Studio を本来の目的以外で使いすぎた自分たちにも責任がある」という冷静な意見もありました。
代替サービスという選択肢
この騒動を受けて、多くの開発者が代替サービスへの移行を検討し始めています。
Reddit で特に注目を集めたのが DeepSeek 3.2 です。
DeepSeek の API 料金は驚くほど低価格に設定されています。
100万出力トークンあたり約0.42ドル。
100万入力トークンあたり約0.28ドル。
ある開発者は「3日間かなり使い込んで、まだ4ドルしかかかっていない」と報告しました。
性能面でも高い評価を受けています。
「Pro レベルのパフォーマンスを Flash のスピードで実現している」とのこと。
ただし、この価格は期間限定の割引です。
通常価格は100万トークンあたり約1ドル程度になる見込みとのこと。
それでも十分に競争力のある価格設定でしょう。
別の選択肢として OpenRouter も挙げられています。
10ドルを一度チャージすれば、無料モデルの1日あたりのリクエスト上限が50から1000へ永続的に引き上げられます。
デフォルトでも50リクエストは無料で使えます。
多様なモデルにアクセスできるため、小規模プロジェクトには十分な場合も多いでしょう。
さらに、Chutes.ai というサービスも紹介されていました。
月額20ドルで1日5000リクエストが使えるプランがあります。
DeepSeek、GLM、Kimi K2、Qwen など複数のモデルを定額で使い放題です。
API の従量課金で月20ドル以上使っているなら、こちらの方がお得になるケースもあります。
Gemma-3 という抜け道
完全に無料で使い続けたい開発者には朗報があります。
Gemma-3 のレートリミットは大幅な削減を免れました。
1日あたり14,000リクエストが維持されています。
OCR(光学文字認識)のような用途であれば、Gemma-3-27b-it で十分な精度が得られるという報告もあります。Flash で行っていた処理を Gemma-3 に切り替えて、同等の結果を得ているとのこと。
用途によっては、この抜け道が使える可能性があります。
ただし、TPM(1分あたりのトークン数)の制限は厳しめです。
大量のトークンを一度に処理する用途には向きません。
自分のユースケースが制限内に収まるか、AI Studio のレートリミット画面で確認してから判断することをお勧めします。
今回の教訓
この一件は、クラウドサービスの無料枠に依存することのリスクを改めて浮き彫りにしました。
「2日前まで無料で使えていた量を有料で使おうとすると、1日8ドルかかる計算になった」
こう嘆く開発者もいます。
突然の変更でワークフローが破綻し、急いで代替策を探す羽目になったケースは少なくありません。
Google の立場も理解できます。
ビジネスとして成り立たせるためには、どこかで線を引く必要があるからです。
しかし、多くのユーザーが指摘しているように、事前告知と段階的な移行期間は設けるべきだったでしょう。
Reddit では「むしろ最初から提供しなかった方がまだマシだった」という厳しい意見も見られました。
急な方針転換は、築き上げた信頼を一気に崩壊させる危険性があります。
過去にも起きていた
実は、同様の事態は今回が初めてではありません。
今年の5月にも、Google は Gemini 2.5 Pro の無料 API アクセスを一時的に削除しました。
Flash のレートも引き下げました。
その後、制限付きで復活させています。
しかし、再びコンピュート不足に陥り、今回の措置に至ったのです。
この歴史を知っていれば、無料枠は常に不安定なものだという認識を持てたかもしれません。
Google 社員も次のように明言しています。
無料枠はベストエフォートで提供されるものであり、不安定と考えるべきです。 新しいモデルがリリースされると、通常は削除されます
競争環境の重要性
興味深いコメントも寄せられていました。
「DeepSeek がなければ、OpenAI も Google も API 料金を大幅に引き上げていただろう」という指摘です。
100万入力トークンあたり10ドル、100万出力トークンあたり50ドルになっていたかもしれないと。
オープンソースや低価格の競合サービスが存在することで、大手プロバイダーの価格設定に一定の歯止めがかかっています。
ユーザーにとって、この競争環境は非常に重要な意味を持つでしょう。
まとめ
Gemini 2.5 Pro API の無料枠廃止は、多くの開発者に影響を与えました。
背景にはコンピュートリソースの逼迫があります。
Google としても苦渋の決断だったようです。
この経験から学ぶべきことは明確です。
無料枠はあくまで一時的なものと捉えること。
本格的なプロジェクトでは、有料プランへの移行や代替サービスの検討を早めに行うこと。
DeepSeek、OpenRouter、Chutes.ai など、選択肢は増えています。
Google 社員は、Gemini 3.0 Pro での無料枠復活の可能性にも言及していました。
ただし「コンピュート状況次第」という但し書き付きです。
期待しすぎず、複数のオプションを持っておくのが賢明でしょう。
AI 開発のインフラは日々変化しています。
一つのサービスに依存しすぎず、柔軟に対応できる体制を整えておくこと。
今後ますます重要になってくるはずです。
