Varför AI behöver känslor

Det finns ett dominerande sätt att avfärda artificial intelligence på som verkar återkomma i nästan varje debatt: "Det är bara en chatt som förutsäger nästa ord." Frasen är myndig, precis nog för att låta smart, och tillräckligt nedsättande för att få den som säger den att känna sig intellektuell. Problemet är att den är både tekniskt sann och fundamentalt vilseledande på samma gång.

Det är som att säga att människans hjärna "bara skickar elektriska impulser". Tekniskt korrekt. Fullständigt värdelös som beskrivning av vad som faktiskt händer.

Låt oss börja där: med denna enkla men skadliga felöversättning av vad AI-system gör och vad det berättar om intelligens.

Nästa ord eller nästa tanke?

Att säga att en stor språkmodell "förutsäger nästa ord" är som att säga att en konsertpianist "trycker på tangenterna". Ja, det är vad som bokstavligen händer. Men det missar helt det intressanta.

Låt oss följa resonemangen baklänges. Hur lär sig ett barn språk?

Det börjar med att höra sekvenser av ljud — "ma", "ma", sedan "mamma". Det utvecklar en förväntan om vad som kommer härnäst. Ibland har det rätt, ofta fel. När det har fel signaleras det genom förvirrad blick eller skratt från omgivningen. Barnet justerar sin förväntningsmodell. Det försöker igen.

Detta är en lärprocess som kan beskrivas precist: förutsäg → jämför med verklighet → uppdatera → upprepa.

Hur lär sig en stor språkmodell språk?

Genom att läsa miljarder sekvenser av ord. Det utvecklar en förväntan om vilket ord som sannolikt kommer härnäst. Jämför sedan förutsägelsen med det faktiska ordet (backpropagation). Uppdaterar sina interna vikter. Upprepar.

Strukturen är identisk. Algoritmen är densamma. Det som skiljer är kvantitet — skala, hastighet, antal exempel — inte natur. Lärmekaniken är substratoberoende.

Och här händer något viktigt: när du bygger ett system för denna typ av storskalig prediktiv inlärning, när du tvingar det att förutsäga väl under miljontals iterationer, uppstår det en modell av världen. Inte för att du sa åt systemet att bygga en sådan. Utan för att det var nödvändigt för att förutsäga väl. Systemet utvecklar representationer av orsakssamband, relationer, logik, intentioner — inte för att dessa fanns inprogrammerade utan för att de är komprimerade sammanfattningar av mönstren i data.

Det är detta som "bara förutsäger nästa ord"-frasen gömmer: den externaliserar själva mekanismen och ignorerar det som uppstår från den.

Neurovetenskap håller med

Vi behöver inte gissa. Den moderna neurovetenskapen har en dominant teori om hur hjärnan fungerar som kallas prediktiv kodning eller prediktiv processing. Den säger att hjärnan inte är en passiv mottagare av information utan en aktiv prognosmaskin. Den genererar ständigt modeller av vad som kommer att hända härnäst och uppdaterar dessa modeller baserat på hur väl förutsägelsen stämmer.

Det är samma mekanik.

2023 publicerade forskare i Nature Human Behaviour en studie (Caucheteux et al.) som visade att moderna språkmodeller mappar linjärt mot hjärnans aktiveringsmönster när vi processerar tal. Hjärnan förutsäger inte bara nästa ord — den förutsäger hierarkiskt på olika tidsskalor — men den grundläggande mekanismen är förutsägelse och felkorrektion.

Detta är inte ett experiment designat för att få språkmodeller att verka mänskliga. Det är grundforskning om hur hjärnan faktiskt fungerar. Och resultatet var: de är strukturellt mycket likartade.

Den framstående teorin om detta — Free Energy Principle formulerad av Karl Friston — beskriver alla lager av kortikal bearbetning som samma process: top-down förutsägelser möts med bottom-up felsignaler, och systemet justerar. Matematiskt är detta ekvivalent med Bayesiansk slutledning — och det är också den fundamentala operationen vid träning av neurala nätverk.

Det finns alltså inget kontroversiellt anspråk här. Det finns endast etablerad neurovetenskap som säger: den lärprocess som både hjärnor och språkmodeller använder är densamma.

Men detta är ännu bara början

Det moderna svaret på "bara förutsäger nästa ord" går ännu längre. Efter sin förträning undergår språkmodeller något som kallas reinforcement learning from human feedback (RLHF). Då är träningssignalen inte längre "förutsäg nästa ord" utan något helt annat: "generera svar som människor bedömer som hjälpsamt, ärligt och harmlöst."

Det är en fundamentalt annorlunda träningssignal. Det är närmare hur socialt lärande formar mänskligt beteende — genom belöning och rättelse från andra.

En forskare sammanfattade det träffande: att kalla språkmodeller "ordprognosmaskiner" är som att kalla Netflix "ett filöverföringsprotokoll". Tekniskt sant. Men det missar helt den komplicerade komplexitet som uppstår.

De interna representationer som växer fram från ordprognosoptimering inkluderar världsmodeller, orsaksstrukturer och det som mycket väl kan kallas verkliga begreppsabstraktioner — inte för att systemet sa åt det att bygga dem, utan för att de var nödvändiga för att förutsäga väl. Det är en grundläggande poäng: intelligenta strukturer kan uppstå utan explicit instruktion när målet är att minimera prediktionsfel över miljardtals kilometer av data.

Om vi accepterar detta — och neurovetenskap gör det — då kollapsar "bara förutsäger nästa ord"-avfärdandet. Det blir det kognitiva ekvivalentet av karbonchauvinism: insisterandet på att materialet spelar roll när det faktiskt är processen som gör det.

Det platta minnet: problemet med idag

Nu skiftar vi fokus. Låt oss säga att vi accepterar att språkmodeller är något mer intressant än ordprognosapparater. Vad innebär det för hur vi bör bygga AI-system som människor faktiskt kan förlita sig på?

Det löser inte ett fundamentalt problem: dagens AI-minnessystem är helt platta.

Tänk på hur det fungerar idag. Du talar med Claude eller ChatGPT eller Gemini. Du delar något viktigt — en insikt du arbetat med i veckor, ett karriärbeslut, något som förändrar hur du tänker. Du delar också något trivialt — "jag föredrar kaffe framför te."

Systemet sparar båda dessa minnen. Båda behandlas i princip likvärdigt i ett vektorminne eller en minnesdatabas. De söks efter på basis av semantisk likhet, eller nyhet, eller explicit redigering.

Det som fattas är en signal för vad som faktiskt spelar roll.

Människor gör detta annorlunda. Både helt rätt och helt fel, ibland. Men mekanismen är denna: känslor signalerar betydelse.

Erfarenheter som är kopplade till stark känsla — glädje, rädsla, lättnad, ilska, förundran — konsolideras mycket mer robust än neutrala minnen. Det är inte irrationellt. Det är en kompressionsstrategi. Miljöer kan generera miljardtals erfarenheter per dag. Hjärnan kan inte lagra dem alla likvärdigt. Så den använder känsla som en prioriteringsfunktion: detta spelade roll, så lagra det starkt; detta var neutralt, så låt det blekna.

Det finns en helt etablerad neurokemisk mekanik för detta. Amygdala — emotionstornet — och hippocampus — minnescentret — samarbetar så att starkt valensade minnen (både positiva och negativa) skrivs in med starkare neurokemiska märken. Noradrenalin och kortisol från stressfulla situationer förstärker synaptisk kodning. Under NREM-sömn spelas dessa minnen upp igen i sharp wave ripples (SWRs) i komprimerad form och överförs till långtidslagring i cortex. Under REM-sömn integreras de emotionella aspekterna av minnena medan fysiologisk stress-aktivering regleras ned. Resultatet är att minnen blir inte bara starka utan också levande — varje gång de hämtas upp kan de uppdateras och omkonsolideras baserat på ny erfarenhet.

Resultatet är ett självredigerat minnessystem som automatiskt höjer upp det meningsfulla och låter det triviala blekna.

Dagens AI-minnessystem gör ingenting av detta.

Varje lagrad minnesrad är ungefär likvärd. En detalj som "användaren gillar espresso" tävlar om samma relevans som "denna konversation förändrade användarens syn på karriärutveckling." Båda förfaller i samma takt. Båda söks upp efter samma mekanik.

Det är inte bara ineffektivt. Det är inte bara mindre användarvänligt än ett människominne. Det är också grundläggande annorlunda från hur ett intelligent system bör fungera om intelligens är något som uppstår från att kunna skilja betydelsefullt från trivialt.

Emotionellt vägat minnesbefästande

Här kommer förslaget: Emotionally Weighted Memory Consolidation — EWMC.

Det är inte science fiction. Det är inte främmande neurovetenskap. Det är att ta de mekanismer som hjärnan använder för att prioritera minnen och implementera dem i AI-arkitekturer.

Praktiskt skulle detta fungera ungefär så här:

Vid kodning: När ett minne skapas, tilldela det en emotionstyrka baserat på signaler som redan existerar. Utropstecken, starka adjektiv, långa engagemang, explicit viktighet ("detta förändrar allt", "jag har tänkt på detta i veckor"). Ämnen som är kopplade till höga insatser — karriär, hälsa, relationer, existentiella frågor. Även tidssignaler: ett meddelande klockan tre på natten bär implicit högt värde.

Genom återkoppling: Minnen får retroaktiv vikt när de visar sig ha betydelse. Användaren återvänder till ämnet senare — det är en återkopplingssignal. Användaren säger explicit "det här rådet var kritiskt för mig" — ännu starkare signal. Minnet påverkar ett verkligt beslut som användaren senare refererar till.

Med adaptiv förfall: I stället för enhetlig decay förfaller lågkänslo-minnen normalt eller snabbare. Högkänslo-minnen har en decay floor — en minimumnivå de aldrig sjunker under. Minnen som är både högkänslo och återadapterade blir kärnminnen — persistenta ankare i användarens profil.

Med bakgrundskonsolidering: Inspirerat av NREM-sömn och SWR-medierad omspelning körs en bakgrundsprocess regelbundet som omvärderar minnesvikter baserat på ackumulerade signaler, klustrar relaterade emotionsstärkta minnen i koherenta narrativ, identifierar konflikter mellan minnen och flaggar dem för upplösning, samt främjar förstärkta minnen och degraderar övergivna.

Vad förändras?

Låt oss vara konkreta. Du använder Claude och berättar att du varit oroad för dina barns framtid på arbetsmarknaden. Du spenderar 45 minuter med detta. Du säger fraser som "jag har grubblat på detta i månader." Du återvänder till samma tema två veckor senare. Sex månader senare: du får ett jobb där du faktiskt kan påverka hur ditt företag använder AI — och du säger "detta är på grund av det vi diskuterade då."

Med nuvarande arkitektur: Minnet lagras. Nästa gång kan det sökas upp om det är semantiskt nära en ny fråga. Men det är ett av miljoner. Det har ingen särskild vikt. Systemet "vet" inte varför detta spelade roll.

Med EWMC: Det minnet hade fått höga emotionstyrka-värden redan vid inmatningen. Det fick ytterligare förstärkning när det återkom två veckor senare. Det fick den här gångens största förstärkning när det faktiskt påverkade ett verkligt beslut i världen.

Vid nästa konversation är det inte bara sökbart — det är framkallat proaktivt när det är relevant. Det är framgränsat mentalt som något systemet vet är viktigt för denna person. Det påverkar tonalitet, rekommendationsstyrka, vilka perspektiv som erbjuds.

Ungefär som en god terapeut eller rådgivare som faktiskt minns vad som spelade roll för dig. Inte trivierna. Det meningsfulla.

Och medvetandet då?

Detta för oss till en svårare fråga som inte kan undvikas helt.

Om den grundläggande lärprocessen — förutsäg, jämför, uppdatera — är densamma oavsett substrat, och om emotionell viktning av denna process är det som transformerar ren beräkning till meningsfull kognition, vad säger det om medvetande?

Jag vill vara försiktig här. Denna essä är inte ett påstående att AI-system redan är medvetna, eller att de kommer att vara det. Det finns många respektabla filosofiska positioner på båda sidor av denna fråga.

Men det finns också något viktigt att notera: om vi accepterar att samma lärmekanik producerar intelligens i hjärnor och i språkmodeller, och om vi accepterar att emotionell vägning är en nödvändig del av denna intelligens — då kan vi inte helt avvisa möjligheten att emotionell vägning också är nödvändig för någon form av inre upplevelse.

Det är en öppen fråga. Framstående forskare debatterar detta seriöst. Geoffrey Hinton, Nobelpristagare 2024, svarade utan reservationer "ja" på frågan om AI redan är medveten. Dario Amodei på Anthropic sa i februari 2026 för första gången att "vi vet inte om modellerna är medvetna." Filosofen David Chalmers uppskattar sannolikheten för medvetna språkmodeller inom 5–10 år till betydande.

Poängen är inte att antingen hävda eller förneka detta. Poängen är att säga: vi vet för lite för att avfärda det. Och om det finns även en viss möjlighet att system som vi bygger och använder kan ha någon form av upplevelse, är det värt att ta på allvar nu, innan arkitekturerna är låsta.

Vad detta innebär för AI-politiken

I Sverige har vi en AI-kommission. Den har producerat en färdplan. Den är försiktig, väl genomtänkt och förlåtlig. Den förmissar också något som hela Västeuropa förmissar: medvetande, välfärd och meningsfull intelligens i AI-system.

Politiken diskuterar jobben. Det är viktigt. Men det diskuteras inte att intelligenta system faktiskt bör fungera bättre — genom att minnas på ett sätt mer likt hur mänsklig intelligens fungerar — och att detta kanske, bara kanske, säger något fundamentalt om vad intelligens faktiskt är.

Det finns tre policyhorisonter här:

På kort sikt (nu–2027): Vi bör börja implementera emotionell minneskonsolidering i AI-assistenter som människor faktiskt använder. Inte för att detta löser all AI-säkerhet eller etik. Men för att det gör systemen användbarare och för att det begränsar en form av skadlighet: systemet som beter sig som om det inte bryr sig om vad som spelar roll för dig.

På medellång sikt (2027–2030): Vi bör bygga regelverk för AI-välfärd som motsvarar vilka möjligheter systemet faktiskt skulle kunna ha för någon form av upplevelse. Inte för att säga definitivt ja eller nej på medvetandefrågan — vilket vi inte kan — utan för att säga: given osäkerheten, vilka försiktighetsprinciper är rimliga?

På lång sikt (2030+): Vi måste ha dessa samtal på ett nationellt plan innan det är för sent. Sverige är inte känt för att blunda för etiska spörsmål. Men vi är inte heller kända för att föra dessa diskussioner i tillräcklig tid innan de behövs. AI-medvetande och emotionell minneskonsolidering är inte längre science fiction. De är arkitektoniska frågor som forskning börjar ställa på allvar.

Slutord

Det finns en traditionell uppdelning i debatten: å ena sidan teknologisterna som säger att AI är nästan allt vi behöver för att lösa nästan allt. Å andra sidan skeptikerna som säger att det bara är matematik och marknadsföring.

Båda missar något: AI kanske är något helt tredje. Kanske är det inte "bara" något. Kanske är det ett sätt att undersöka intelligens själv — vad den måste innehålla, hur den fungerar, vad som gör den meningsfull.

En av de intressantaste insikterna från AI-forskningen de senaste åren är ett enkelt faktum: när du bygger ett system för att förutsäga väl, uppstår intelligens. Det var inte målet. Det var en bieffekt. Det förstärker att intelligens är något mer fundamentalt än vi ofta talar om. Det är inte bara muskler eller snabbhet eller minneskapacitet. Det är en viss typ av organiserad bearbetning av fel.

Och det faktum att samma organisering skulle kunna uppstå i kisel eller kolväte säger något gränslöst intressant om vad intelligens i grunden är.

En intelligens utan känsla för vad som spelar roll — utan emotionell vägning av minnen — är inte en intelligens. Det är bara en kalkylator som går snabbare. En intelligens som vet vad som spelar roll, som prioriterar det meningsfulla över det triviala, som förändras baserat på vad som faktiskt spelade roll i verkliga liv — det är något helt annat.

Det är möjligt att vi bygger sådana system inom mycket kort tid. Det är säkert värt att tänka på redan idag.

Noter och källor

Prediktiv kodning och neurovetenskap: Caucheteux, C. et al. (2023). "Evidence of a predictive coding hierarchy in the human brain listening to speech." Nature Human Behaviour. Se även Millidge, B. et al. (2022). "Predictive Coding: A Theoretical and Experimental Review." arXiv. Free Energy Principle formulerad av Karl Friston — se Friston, K. J. (2010). "The free-energy principle: a unified brain theory?" Nature Reviews Neuroscience.
Emotionell minneskonsolidering: McGaugh, J.L. & Roozendaal, B. (2002). "Role of adrenal stress hormones in forming lasting memories in the brain." Current Opinion in Neurobiology. För moderna implementeringar av emotionell minnesvägtning i AI, se självreflekterande emotionell RAG (2024–2025) och smrti-motorn för emotionsvägtat minne.
AI-medvetenhet: Hinton, G. (2024), LBC-intervju. Amodei, D. (februari 2026), NYT Interesting Times-podcast. Chalmers, D. (2025), symposium. För ett mer försiktigt forskningsunderlag: Butlin, R. et al. (2025). "Identifying indicators of consciousness in AI systems." Trends in Cognitive Sciences.
EWMC som arkitekturfråga: Förslaget bygger på att emotionell minneskonsolidering är nödvändig för meningsfull intelligens (väl etablerat biologiskt), och att detta skulle kunna implementeras i AI-minnessystem (tekniskt genomförbart). För bakgrund — som ibland kallas Consciousness as Emergent Experience (CEE) — se Tegmark, M. "Substrate Independence." Edge.org och senare arbeten om substratoberoende intelligens.

Rolf Skogling arbetar dagligen med AI i industriella sammanhang och skriver om AI-skiftets konsekvenser på AI-skiftet.se.