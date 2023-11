Forskere har introdusert en ny tilnærming for å måle om en maskin virkelig tenker eller bare gjengir data, og presenterer et alternativ til den langvarige Turing-testen. Turing-testen, opprinnelig konseptualisert av Alan Turing på 1950-tallet, involverte en avhører som skilte mellom en datamaskin og et menneske. Nylige fremskritt innen AI har imidlertid gjort denne testen ineffektiv, som eksemplifisert ved juksemekanismer på plattformer som Tinder og fremveksten av chatbots.

I en nylig publikasjon i tidsskriftet Intelligent Computing, foreslår Philip Nicholas Johnson-Laird fra Princeton University og Marco Ragni fra Chemnitz University of Technology et tre-trinns rammeverk for å vurdere maskintenkning og gi avgjørende svar på denne gåten.

Det første trinnet innebærer å utsette maskinen for psykologiske eksperimenter for å evaluere dens evne til å resonnere ved å bruke menneskelignende slutningsmetoder, i motsetning til å stole utelukkende på konvensjonelle logiske prosesser. Dette batteriet av tester tar sikte på å finne ut om maskinen viser menneskelignende resonnement.

Det andre trinnet, kjent som selvrefleksjon, tester maskinens forståelse av sin egen resonnement. Introspeksjon, en egenskap som er inngrodd i menneskelig erkjennelse, kan kaste lys over maskinens evne til å forstå og analysere sine egne logiske prosesser. For eksempel, når du får spørsmålet: "Hvis Ann er intelligent, følger det at Ann er intelligent eller hun er rik, eller begge deler?" et menneske ville erkjenne at det ikke er noen indikasjon på Anns rikdom. Omvendt kan en datamaskin slite med å finne årsaken bak dette fradraget.

Til slutt tar forskerne til orde for å dykke ned i maskinens kildekode, med sikte på å skille ekte resonnement fra anvendelsen av "dyp læring". Ved å evaluere koden for "kognitiv tilstrekkelighet", kan forskere se om maskinens resonnementevner stammer fra ekte forståelse eller black-box-algoritmer.

I papiret deres hevder Johnson-Laird og Ragni at den originale Turing-testen bør erstattes av en omfattende undersøkelse av et programs resonnement. Forskerne foreslår å behandle maskinen som en aktiv deltaker i kognitive eksperimenter og, om nødvendig, utsette koden for analyse i likhet med hjerneavbildningsstudier.

Etter hvert som kunstig intelligens integreres ytterligere i hverdagen vår, utvikler behovet for å finne ut når maskiner etterligner menneskelig resonnement, og dermed «tenke», seg fra Turings teoretiske grubling til et konkret problem som krever praktiske løsninger.

Ofte stilte spørsmål (FAQ)

Hva er Turing-testen?



Turing-testen, introdusert av Alan Turing på 1950-tallet, involverer en avhører som prøver å finne ut om en deltaker er en datamaskin eller et menneske gjennom en serie samtaler. Hvorfor anses Turing-testen som ineffektiv?



Med bruken av avanserte AI-teknologier har metoder som juksing på plattformer som Tinder og utbredelsen av chatbots gjort Turing-testen utilstrekkelig til å skille mellom menneskelignende tenkning og kunstig oppblåst informasjon. Hva er det foreslåtte tre-trinns rammeverket for å vurdere maskintenkning?



Rammeverket foreslått av forskere innebærer å teste maskiner i psykologiske eksperimenter for å evaluere deres resonnementevner, vurdere deres selvrefleksjon eller forståelse av resonnementet, og granske maskinens kildekode for å skjelne ekte resonnement fra black-box-algoritmer. Hva er "kognitiv tilstrekkelighet" i sammenheng med maskintenkning?



"Kognitiv tilstrekkelighet" refererer til evalueringen av en maskins kildekode for å avgjøre om dens resonnementevner kommer fra ekte forståelse eller kun er avhengig av ugjennomsiktige dyplæringsalgoritmer. Hvorfor kreves det en ny metode for å bestemme maskintenkning?



Ettersom kunstig intelligens blir stadig mer integrert i ulike aspekter av livene våre, har forståelsen av når maskiner etterligner menneskelig resonnement praktisk betydning og strekker seg utover Alan Turings tankeeksperiment, noe som krever en mer omfattende og pålitelig tilnærming.