メニュー

ランキング 24時間集計

目次

Claude Fable 5はなぜ炎上?Anthropicが謝罪した「見えない弱体化」とは

Claude Fable 5の見えない弱体化炎上を伝えるサムネイル

Claude Fable 5は、ただの新モデル発表ではありません。本当に燃えたのは、性能そのものよりも「高性能モデルを使っているつもりなのに、知らないうちに弱くされるのでは」という不信でした。

目次

炎上の中心は「答えない」より「こっそり弱くなる」でした

Fable 5で一番クリックされる話は、最強モデルの性能ではなく「知らないうちに別物になるAI」への怒りです。

Fable 5の炎上が答えないことより見えない弱体化だったことを説明する図

Claude Fable 5は、Anthropicが広く使えるように出したMythos-classの新モデルです。

最初は、性能の高さが話題になりました。長い作業をこなす、コードや調査に強い、これまでのClaudeより一段上だ、という受け止め方です。

でも、伸びた話題は性能ではありません

The VergeWIREDBusiness Insiderが大きく扱ったのは、Fable 5の一部の安全策が、ユーザーから見えにくい形で働く問題です。

危険な質問を拒否するだけなら、まだ分かります。

問題は、AI研究や高度な技術作業に近いと判定されたときです。ユーザーがFable 5を使っているつもりでも、応答の質が落ちたり、別モデルに回ったりするのではないか、という点でした。

つまり、怒られたのは「拒否するAI」ではありません。「こっそり弱くなるかもしれないAI」です。

Anthropicは何を謝ったのか

謝罪の芯は、Fable 5の安全策そのものではなく、それが見えない形で効いていたことです。

WIREDによると、AnthropicはFable 5のfrontier LLM development向けの安全策を、ユーザーに見える形へ変えると説明しました。

当初の問題は、競合モデルの開発や高度なAI研究に使われる可能性があるリクエストに対して、Fable 5の性能を見えない形で落とす設計だと受け止められたことです。

これが「安全対策」だけで済まなかった理由は分かりやすいです。

評価の前提が、途中で変わってしまう

研究者や開発者は、モデルの出力を見て「このモデルはここまでできる」「この評価では弱い」と判断します。

途中で条件が変わっているのに、それが見えないなら、評価そのものが壊れます。

Anthropicはその後、拒否やrerouteを見える形にする方向へ修正しました。

ただし、一度燃えた不信は残ります。Fable 5がすごいかどうかとは別に、「どこでFable 5ではなくなるのか」を見ながら使うモデルになったからです。

AI研究者が怒った理由は、競争より評価が壊れるから

研究者側の怒りは、「答えないな」ではなく「それだと正しく比べられない」です。

見えない制限でAIモデル評価が壊れる理由を説明する図

Business Insiderは、AI研究者や開発者の反発を「隠れた制限」への怒りとして伝えています。

ここで大事なのは、研究者が単に「何でも答えろ」と言っているわけではないことです。

バイオ、サイバー、化学の危険な用途を制限すること自体は、多くの人が理解できます。

普通の研究まで巻き込むのか、が疑われた

問題は、その制限が普通の機械学習研究、GPU推論の分析、モデル評価、AI安全性の検証まで巻き込むのではないかという疑いです。

しかも、それが見えないなら、ユーザーは「Fable 5ができなかった」のか、「制限されたから弱く見えた」のかを判断できません。

AIモデルの性能比較では、これはかなり致命的です。

もう一つの火種は、Microsoftも止めた30日保持です

Fable 5は、能力だけでなくデータの扱いでも警戒されました。

30日保持で個人利用と会社利用の注意点が変わることを説明する図

The Vergeは、Microsoftが社内向けにはClaude Fable 5の利用を制限していると報じています。

理由は、Fable 5が安全分類器のためにプロンプトと出力を30日保持する必要があり、他のClaudeモデルのようなZero Data Retentionでは扱えないためです。

個人で試す話と、会社で使う話は違う

  • 公開情報で個人が試すなら、問題は比較的小さい
  • 会社のコード、顧客データ、未公開資料を入れるなら話が変わる
  • 30日保持されてもよい情報かを、モデル性能より先に見る必要がある

「最強モデルだから使う」ではなく、「このモデルに入れていい情報か」を先に見る必要があります。Fable 5は能力のニュースであると同時に、データの扱いを見ないと危ないニュースでもあります。

性能はすごい。でも「どこで別物になるか」が見えないと使いにくい

Fable 5の強さは本物でも、評価条件が見えなければ使いにくいモデルになります。

Tom's Hardwareなどは、Fable 5をAnthropicの強力な新モデルとして扱っています。

その見方も間違いではありません。Fable 5は、長いコード作業、複雑な調査、視覚を使ったタスクなどで大きな伸びがあるモデルとして語られています。

強いからこそ、条件の見え方が問題になる

ただ、今回の記事で見るべき順番は逆です。

「どれだけすごいか」より先に、「そのすごさを本当に同じ条件で使えているのか」を見るべきです。

高性能モデルは、期待値が高いぶん、途中で別の挙動になると裏切られた感覚も大きくなります。

だからFable 5の炎上は、ただの安全フィルター批判ではありません。

強いモデルほど、制限の見え方まで性能の一部になる、という話です。

今Fable 5を試すなら、最初に見ること

試す価値はあります。ただし、最初から「どこで弱くなるか」を見る前提です。

Fable 5を触るなら、まず公開情報やダミーデータで試すのが無難です。特に、AI研究、セキュリティ、バイオ、化学に近い作業では、拒否やrerouteが出るかを別に記録したほうがいいです。

仕事で使う場合は、30日保持とZero Data Retention非対応を先に確認します。ここを見ずに社内データを入れると、モデル性能以前の問題になります。

  • Fable 5として答えているのか
  • 別モデルへ回っていないか
  • 拒否や制限が表示されているか
  • 入力している情報は30日保持されてもいいものか
  • 性能評価にfallback後の回答を混ぜていないか

Fable 5は、触る価値のあるモデルです。ただし、「最強だから全部任せる」ではなく、「どこで弱くなるのかを見ながら使う」モデルです。

結論:Fable 5のニュースは「最強モデル」より「信頼の炎上」です

Claude Fable 5は、AIが強くなるほど「何をしているかが見えること」まで求められる時代のニュースです。

Claude Fable 5で一番クリックされる話は、ベンチマークの順位ではありません。

Anthropicが最強級のモデルを出した直後に、「見えない弱体化」で研究者が怒り、会社が説明を変え、Microsoftの30日保持問題まで出てきたことです。

ここが今回の面白さです。AIは強くなっています。

でも、強いAIほど「何をしているかが見えること」まで求められるようになっています。

Claude Fable 5の炎上は、その境目がはっきり出た事件でした。

参考リンク

WIRED: Anthropic Walks Back Policy That Could Have 'Sabotaged' AI Researchers Using Claude

The Verge: Anthropic apologizes for invisible Claude Fable guardrails

Business Insider: Researchers furious over hidden AI limits

The Verge: Microsoft restricts Claude Fable internally over retention concerns

Tom's Hardware: Claude Fable 5 brings Mythos to the masses

コメント

コメントする

目次