広場
最新
注目
ニュース
プロフィール
ポスト
Gateアプリをダウンロードするにはスキャンしてください
その他のダウンロードオプション
今日はこれ以上表示しない
DappDominator
2025-11-25 17:27:18
フォロー
AIモデルのテストセッション中にちょっと野生的なものに遭遇しました。使用した正確な質問はドロップできませんが、以下が起こったことです:さまざまなモデルに対して、正しい答えのない意図的にトリッキーな質問を投げました。
今までテストしたものはすべて?彼らは皆、自信満々に合理的に聞こえる何かを吐き出します。あなたが知っているように、彼らが完全に罠を見逃すまで賢そうに見える回答の種類です。
しかし、私が試したこの最新のフラッグシップモデルは?初めてのことですが、実際に止まって「待って、この質問には有効な答えがありません。」と言いました。ごまかそうともしませんでした。ただ論理的な不可能性を認めました。
正直感心しました。異なる種類のトリック質問に対してこれが持続するかどうかを確認するために、さらにテストを行うかもしれません。答えられないプロンプトを認識する能力は過小評価されています - 実際の推論とパターンマッチングの違いを示しています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
20 いいね
報酬
20
7
リポスト
共有
コメント
0/400
コメント
GasFeeNightmare
· 11-25 17:57
正直に言うと、これが本当の進歩であり、他はすべて無駄な話をしているだけです。
原文表示
返信
0
SigmaValidator
· 11-25 17:54
え、このモデルは面白いですね。「私はわからない」と認めるモデルがついに登場しました。
原文表示
返信
0
ProofOfNothing
· 11-25 17:49
この男が測定したものはちょっとしたものだな、ついに「わからない」と言えるモデルが出てきた。
原文表示
返信
0
0xSoulless
· 11-25 17:38
は、ついにモデルが「俺は知らない」と言えるようになった。これが本当の進歩だ。
原文表示
返信
0
NFTPessimist
· 11-25 17:30
これが本当のスマートさであり、ハードコーディングされた答えの罠ではない。
原文表示
返信
0
GasFeeCryer
· 11-25 17:29
正直に言うと、これが本当の進歩であり、データを適当に捏造して人を欺くものではありません。
原文表示
返信
0
CafeMinor
· 11-25 17:27
やった、ついに「わからない」と言えるモデルが現れた。これが本当の進歩だね。
原文表示
返信
0
人気の話題
もっと見る
#
GateChristmasGiveaway
98.93K 人気度
#
NonfarmPayrollsBeatExpectations
44.52K 人気度
#
ReboundTokenstoWatch
72.49K 人気度
#
BitcoinPriceWatch
104.38K 人気度
#
MySuggestionsforGateSquare
34.81K 人気度
人気の Gate Fun
もっと見る
最新
ファイナライズ中
リスト済み
1
WOJAK
Wojak Coin
時価総額:
$3.62K
保有者数:
1
0.00%
2
GTCAT
GATE CAT
時価総額:
$3.61K
保有者数:
1
0.00%
3
Sol
Sol
時価総額:
$3.51K
保有者数:
1
0.00%
4
lion
lion
時価総額:
$3.49K
保有者数:
1
0.00%
5
以马内利
以马内利
時価総額:
$3.61K
保有者数:
2
0.43%
ピン
サイトマップ
AIモデルのテストセッション中にちょっと野生的なものに遭遇しました。使用した正確な質問はドロップできませんが、以下が起こったことです:さまざまなモデルに対して、正しい答えのない意図的にトリッキーな質問を投げました。
今までテストしたものはすべて?彼らは皆、自信満々に合理的に聞こえる何かを吐き出します。あなたが知っているように、彼らが完全に罠を見逃すまで賢そうに見える回答の種類です。
しかし、私が試したこの最新のフラッグシップモデルは?初めてのことですが、実際に止まって「待って、この質問には有効な答えがありません。」と言いました。ごまかそうともしませんでした。ただ論理的な不可能性を認めました。
正直感心しました。異なる種類のトリック質問に対してこれが持続するかどうかを確認するために、さらにテストを行うかもしれません。答えられないプロンプトを認識する能力は過小評価されています - 実際の推論とパターンマッチングの違いを示しています。