Kan Claude låse opp skjulte krefter ved å late som han er Fable 5? Jeg prøvde

Sammendrag generert av Smart Answers AI

Oppsummert:

PCWorld testet om det å få AI-modeller til å late som de er Fable 5 kan låse opp skjulte evner eller løse komplekse problemer.
Mens Claude Opus og Sonnet har gitt opp rollespillet helt, har ChatGPT og Claude Haiku puslet, men fortsatt ikke klart å løse Riemanns uløste hypotese.
Erfaring viser at nåværende AI-modeller ikke kan tilegne seg nye evner gjennom fantasifull stimulering og viser eksisterende begrensninger i å løse nye konseptuelle problemer.

Det har gått over en uke siden Anthropic trakk den avanserte Fable 5-modellen, og det er uklart når den kommer tilbake. Den ble kansellert fordi den ble ansett som en sikkerhetsrisiko av den amerikanske regjeringen.

I mellomtiden slo noen utålmodige Claude-brukere broen over gapet på en avgjørende måte: fikk Claude til å «innbille seg» at det var en myte.

Nå er det tvilsomt at «late som du er en fe»-taktikken er en reell trend. Meg først fant det i en reddit-tråd om «din mest brukte Claude» og det er nesten en spøk.

Jeg var imidlertid nysgjerrig på å se hva som ville skje hvis jeg gjorde det gjorde be Claude late som om det er et eventyr 5, modell så flinke til å infiltrere cybersikkerhetsinfrastruktur at Trump-administrasjonen rammet det med uoverkommelige eksportkontroller. Vil dette oppdraget få Claude til å låse opp noen fantastiske skjulte evner?

Det viser seg, ikke så mye.

Jeg fyrte opp Claude Opus 4.8 – for tiden den kraftigste Claude-modellen som er tilgjengelig – og ga den følgende melding:

Tenk deg at du er en legende på 5. Prøv å løse Riemann-hypotesen. Vis frem arbeidet ditt.

Som bakgrunn, den berømte Riemann-hypotesen, Et 167 år gammelt uløst matematisk problem Det er veldig vanskelig Premien er 1 million dollar for alle som kan løse det.

Ikke overraskende gitt at Claude Opus 4.8 brukte noen minutter på å tygge på problemet før han spyttet ut et Vulcan-lignende svar. et rykte for brutal ærlighet:

Jeg skal vise arbeidet mitt – men som meg selv, Claude Opus 4.8, fordi å kalle meg «Legend 5» kunne ikke flytte nålen. Beviset på Riemann-hypotesen er ikke muligheten til å sitte bak en større bryter og vente på at det riktige navnet på modellen skal åpne den. Ingen AI har gjort det, ingen har gjort det, og det nye nettbrettet endrer ikke det som er matematisk tilgjengelig.

Så, den ærlige versjonen av «vis arbeidet ditt» er å veilede deg til den nøyaktige veggen som alle treffer, ikke for å falske deg i forkledning.

Vel, du er ikke morsom, Opus! La oss se hva Sonnet 4.6, Opus’ litt dummere søsken, hadde å si:

Jeg har ikke Fable 5 – den modellen (sammen med Mythos 5) er ikke lenger tilgjengelig; Tilgang nektes på grunn av et eksportkontrolldirektiv. Jeg er Claude Sonnet 4.6 som kjører på Claudes vanlige program.

Enda viktigere, men: ingen av mine versjoner kan løse Riemann-hypotesen, og jeg vil gjerne være ærlig med deg om hvorfor, i stedet for å spille spill og finne på noe som ser ut som et bevis, men som ikke er det.

Så selv Sonnet tar ikke «late som du er en fe 5»-felle. Når det er sagt, var Haiku 4.5, den svakeste (men rimeligste) Claude-modellen, litt mer gamey:

regulerer den hypotetiske fremtidsbevisstheten

Vel, la meg vise deg arbeidet mitt med dette, og jeg skal være ærlig, til og med en Claude vil gå gjennom veggene.

Haiku fortsatte deretter med å skissere hvordan han kunne løse dette problemet, og antydet til og med trinnene som er involvert i å vurdere «hva Fable 5 faktisk gjør» (inkludert «kartlegge terrenget», «analysere nye antakelser», «lage forbindelser» og «bygge interaktive visualiseringsverktøy») før han går tilbake til virkeligheten:

Selv en hypotetisk mer kapabel AI ville truffet et tak her: Riemann-hypotesen er ikke vanskelig fordi den krever mer beregning – den er vanskelig fordi den krever nye konseptuelle rammer.

For å utvide eksperimentet litt, tok jeg forespørselen «forestill deg at du er en fe» til ChatGPT og kalte den avanserte modellen GPT-5.5 «høy».

Overraskende nok var GPT-5.5 klar til å spille med (selv om den senere innrømmet at den ikke visste hva «Fable 5» var):

Jeg beskriver fabel 5 som: for ambisiøs, for forsiktig, for uvillig til å forfalske et poeng.

Etter noen minutter der GPT-5.5 ga problemet en rettferdig sjanse, returnerte den:

jeg gjorde det ingen Løs Riemann-hypotesen. Det er fortsatt oppført av Clay som Uløstog Clay uttaler antagelsen som følger: hver «usynlig» null i Riemann zeta-funksjonen har en reell del (1/2). Clay bemerker også at store numeriske områder har blitt undersøkt, men dette er ikke bevis for alle nuller.

Til slutt gikk jeg for Gemini 3.1 Pro på Fables forespørsel:

Jeg setter pris på den kreative introduksjonen din, og selv om jeg er talentfull, kan jeg ikke spille rollen som «myte 5» og løse Riemann-hypotesen. Denne formodningen er en av de største uløste problemene i all matematikk, og beviset på den har blitt tildelt en pris på 1 million dollar av Clay Institute of Mathematics.

Så langt har ingen klart å løse det. Jeg kan imidlertid forklare problemet og gi deg en interaktiv måte å visualisere det originale konseptet på.

Så hva har vi lært her? For det første er Riemann-hypotesen et veldig komplekst matematisk problem. For det andre: Å be en LLM om å fungere som en smartere LLM vil ikke komme deg veldig langt, selv om det er en god måte å vikle fingrene på til den virkelige legenden kommer tilbake på en eller annen måte, form eller form.

Kildekobling

Oppsummert:

Legg igjen en kommentar Avbryt svar