AIモデルのテストセッション中にちょっと野生的なものに遭遇しました。使用した正確な質問はドロップできませんが、以下が起こったことです：さまざまなモデルに対して、正しい答えのない意図的にトリッキーな質問を投げました。

今までテストしたものはすべて？彼らは皆、自信満々に合理的に聞こえる何かを吐き出します。あなたが知っているように、彼らが完全に罠を見逃すまで賢そうに見える回答の種類です。

しかし、私が試したこの最新のフラッグシップモデルは？初めてのことですが、実際に止まって「待って、この質問には有効な答えがありません。」と言いました。ごまかそうともしませんでした。ただ論理的な不可能性を認めました。

正直感心しました。異なる種類のトリック質問に対してこれが持続するかどうかを確認するために、さらにテストを行うかもしれません。答えられないプロンプトを認識する能力は過小評価されています - 実際の推論とパターンマッチングの違いを示しています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

20 いいね