Mental rotation
Shepard & Metzler (1971) introducerade begreppet mental rotation inom kognitionsvetenskapen med vad som har blivit ett av de mest kända experimenten inom området. Denna berömmelse kan delvis bero på att experimentet är förknippat med en uppsättning minnesvärda grafiska bilder (t.ex. figur 1), varav några hamnade på omslaget till det nummer av Science där det först publicerades. Men det är också ett anmärkningsvärt elegant experiment som gav några slående tydliga resultat. Resultaten tycktes direkt motbevisa den behavioristiska doktrinen, som fortfarande hade stort inflytande bland psykologer vid den tiden, att tankeprocesser helt och hållet är beroende av språket. Genom att föreslå att analoga representationer har en viktig roll att spela i tänkandet, gav resultaten också upphov till prima facie svårigheter (om än inte nödvändigtvis oöverstigliga) för den (digitala) datormodell av sinnet som låg till grund för det nyligen framväxande området kognitionsvetenskap (Block, 1983a).
Figur 1
Några av de stimulusfigurpar som användes av Shepard & Metzler (1971).
A- Identiska objekt som skiljer sig åt genom en rotation i sidans plan
B – Identiska objekt som skiljer sig åt genom en rotation i djupled
C – Spegelbildsobjekt (också roterade i djupled)
Shepard & Metzler presenterade sina försökspersoner för par av teckningar av tredimensionella, asymmetriska sammansättningar av kuber, som visas i figur 1 A, B och C. I varje par visade den högra bilden antingen en sammansättning som var identisk med den som visades till vänster, men roterad från den ursprungliga positionen med ett visst belopp, eller så visade den en sammansättning som inte bara var roterad, utan också var en spegelbild av den till vänster (figur 1 C). Den experimentella uppgiften var att så snabbt som möjligt (genom att trycka på en knapp) avgöra om de två avbildade föremålen faktiskt var identiska (förutom rotationen) eller om de var spegelbilder. Shepards hypotes var att uppgiften skulle utföras genom att skapa en tredimensionell mental bild av ett av de avbildade föremålen och rotera hela denna bild i fantasin för att se om den kunde bringas i överensstämmelse med den andra bilden. De experimentella resultaten stödde tydligt denna idé, eftersom man fann att den tid det tog för varje försöksperson att bekräfta att båda objekten i ett par faktiskt var identiska ökade i direkt proportion till den vinkelmässiga rotationsskillnaden mellan dem. Det var som om försökspersonerna roterade sin mentala bild i en jämn takt (även om detta kunde vara olika för varje försöksperson), så att ju längre de var tvungna att gå för att få sin bild att överensstämma med referensbilden, desto längre tid skulle det ta dem. Vid en förfrågan efter experimentet bekräftade de flesta av försökspersonerna att det verkligen var så de trodde att de hade utfört uppgiften. (Intressant nog gjorde det ingen skillnad om rotationen skedde i sidans plan eller i djupled.)
Trots experimentets elegans och de tydliga resultaten (fina linjära plottar av reaktionstiden i förhållande till rotationsvinkeln) var Shepards tolkning av det som ett bevis för irreduktivt analoga och intrinsikaliskt rumsliga processer i tänkandet, och för vad han kallade en ”andra ordningens isomorfism” mellan bild och objekt (Shepard, 1975, 1978b, 1981, 1984), verkligen inte oemotsagd. Vissa forskare ifrågasatte Shepards påstående att hans resultat visar att bilder roteras som en helhet, snarare än att deras delar jämförs bitvis (Hochberg & Gellman, 1977; Pylyshyn, 1979a; Yuille, 1983). På ett mer radikalt sätt har vissa ifrågasatt om rotationsuppgiften verkligen involverar bilder överhuvudtaget (Marks, 1999). Till skillnad från i experimenten med mnemoteknik med bilder fick försökspersonerna trots allt aldrig uttryckligen veta att de skulle använda bilder när de utförde jämförelseuppgiften, och alternativa förklaringar till resultatet (dvs. det linjära sambandet mellan reaktionstid och rotationsvinkel) är tänkbara. Just & Carpenter (1976; Carpenter & Just, 1978), som följde försökspersonernas ögonrörelser medan de utförde en version av Shepard & Metzler-uppgiften, hävdade till exempel att den linjära ökningen av reaktionstiden inte uppstod på grund av den inre rotationen av en bild, utan på grund av att man behövde göra fler ögonrörelser mellan de två bilderna (för att jämföra deras egenskaper) ju mer de roterades relativt till varandra. I den ikonofobiska kultur som fortfarande rådde inom psykologin i början av 1970-talet var en sådan ”bildlös” tolkning av resultaten fortfarande ett mycket levande alternativ. Naturligtvis innebar det att alla påståenden från försökspersonerna om att de hade bildat och roterat mentala bilder måste avfärdas, men behaviorismen hade för länge sedan lärt psykologerna att lägga mycket liten vikt vid denna typ av subjektiva, introspektiva uppgifter.
Hursomhelst, argumentet för mental rotation vilar inte enbart på detta enda hyllade experiment. Shepard och hans studenter (särskilt Lynn Cooper) kunde senare påvisa mental rotation och andra relaterade effekter i ett stort antal olika experimentella utformningar (se Shepard & Cooper et al., 1982) som mestadels var utformade för att blockera alternativa tolkningar av resultaten som skulle undvika behovet av att postulera roterande bilder. De flesta av dessa andra experiment innefattade inte någon jämförelse av två samtidigt synliga bilder, vilket inte ger något utrymme för den typ av ögonrörelseförklaring som Just & Carpenter hade föreslagit. Cooper & Shepard (1973) presenterade till exempel för sina försökspersoner en bokstav i alfabetet som var roterad från sin normala, upprättstående orientering och bad dem återigen att ange om bokstaven var i sin normala form eller i sin spegelbild (bakåt) (se figur 2). återigen visade det sig att svarstiden ökade ju längre stimulusbokstaven roterades från den upprätta positionen (även om förhållandet, av skäl som inte behöver uppehålla oss, inte var lika tydligt linjärt som i det tidigare experimentet). Den underförstådda förklaringen är att försökspersonerna roterar sin bild av den icke upprättstående bokstaven som de visas till dess kanoniska upprättstående orientering, för att jämföra den med sitt minne av hur bokstaven normalt skulle se ut.
Figur 2
Rotade bokstavsstimuli av det slag som användes av Cooper & Shepard (1973).
Cooper (t.ex, 1975, 1976) gjorde också flera experiment om mental rotation av komplexa oregelbundna polygoner, som de i figur 3, och en del av detta arbete berodde på att försökspersonerna uttryckligen uppmanades att bilda och rotera mentala bilder av polygonerna (vars form de tidigare hade memorerat). Återigen fann man ett linjärt beroende av reaktionstiden på vinkeln, vilket tyder på en jämn, regelbunden rotation av en bild. En fördel med de explicita bildinstruktioner som användes i dessa experiment är att det skapar en tydligare koppling mellan de uppmätta resultaten och bildinstruktion som en medvetandeupplevelse under frivillig kontroll. Å andra sidan öppnar det upp för den mycket reella möjligheten att resultaten kan bortförklaras som ett resultat av ”experimentell efterfrågan” (i huvudsak försöker försökspersonerna medvetet producera de resultat som de tror att försöksledarna vill ha, utan hänsyn till de faktiska underliggande kognitiva processerna som är inblandade – se tillägget: Problemet med kravkaraktärer i bildförsök). Psykologer vet att detta är ett mycket verkligt problem inom många områden av experimentell psykologisk forskning (Orne, 1962), och det har visat sig vara särskilt problematiskt i bildforskning av denna typ (Intons-Peterson, 1983). Men när dessa experiment av Cooper tas tillsammans med de andra rotationsexperiment som inte använde sig av explicita bildinstruktioner och som gav föga fotfäste för att experimentella krav skulle kunna påverka resultaten (t.ex. Shepard & Metzler, 1971; Shepard & Cooper, 1973) (och andra experiment som inte diskuteras här: se Shepard & Cooper m.fl, 1982) utgör de ett kraftfullt argument för att det mentala rotationsfenomenet är verkligt och robust.
Figur 3
Exempel på oregelbundna polygoner som Cooper (1975, 1976) använde i sina mentala rotationsexperiment.
Mentala rotationsexperiment av den ursprungliga Shepard & Metzler (1971) designen (eller varianter av den) är nästan unika bland bildförsök eftersom de varken är beroende av verbala rapporter från försökspersonerna eller av explicita verbala instruktioner om att använda bilder för att utföra försöksuppgiften. De kan därför anpassas för användning med djurförsökspersoner, vilket ger möjlighet att ge direkta bevis för förekomsten av bilder hos icke-mänskliga djur. Resultaten av försöken att göra detta med både fåglar (duvor) och olika arter av apor har dock varit minst sagt blandade och till stor del nedslående (Hollard & Delius, 1982; Rilling &Neiworth, 1987, 1991; Georgopoulos et al, 1989; Hopkinset al., 1993; Vauclair et al., 1993; Delius &Hollard, 1995; Köhler et al., 2005; Burmann etal., 2005; Nekovarova et al., 2013). Det är anmärkningsvärt att det mest trovärdiga beviset för att alla djur kan använda den mentala rotationsstrategin, och därmed troligen uppleva bilder, kommer från arbete med sjölejon (Mauck & Dehnhardt, 1997; Stich et al.,2003).
Å andra sidan verkar effekten inte vara specifikt beroende av visuella bilder: den har visats hos medfödda blinda människor (Marmor & Zaback, 1976; Carpenter &Eisenberg, 1978), som i allmänhet inte anses uppleva visuella och mentala bilder, och som därför troligen roterar haptiska eller kinestetiska bilder. Mental rotationsförmåga har också studerats hos spädbarn(Örnkloo & von Hofsten, 2007), äldre (Dror etal., 2005) och personer med neurologiska problem (Courboiset al, 2004; Hinnell & Virji-Babul, 2004), och ålders-, köns- och till och med könsorienteringsrelaterade skillnader i dess prestanda har undersökts (t.ex. Richardson, 1994; Terlecki &Newcombe, 2005; Levin et al., 2005; Quaiser-Pohl etal.,. 2006; Maylor et al., 2007; Joanisse etal., 2008). Dessutom har begreppet mental rotation tillämpats på praktiska frågor som sträcker sig från förbättring av kirurgisk teknik (Conrad et al., 2006) till förståelse och behandling av dyslexi (Russeler et al,
Det råder fortfarande oenighet om de underliggande mekanismerna för mental rotation (liksom för bildspråk i allmänhet), men dessa har nyligen undersökts med hjälp av flera neurovetenskapliga tekniker, t.ex. mätningar av ögonrörelser (de’Sperati, 2003), direkta registreringar från elektroder som implanterats i hjärnan (Georgopoulos m.fl., 1989), och med hjälp av en rad olika tekniker som kan användas för att mäta den mentala rotationen.), funktionell magnetisk resonanstomografi (fMRI) (t.ex. Cohenet al., 1996; Richter et al., 2000; Creem etal., 2001; Koshino et al., 2005; O’Boyle etal., 2005), EEG (Prime & Jolicoeur, 2010) och transkraniell magnetisk stimulering (Ganis et al., 2000). En del av denna forskning har varit inriktad på ”motoriska bilder” (Jeannerod, 1994) snarare än visuella bilder. Det har faktiskt föreslagits att motoriska processer och motoriska områden i hjärnan kan vara involverade i mental rotation helt generellt (Kosslyn, 1994; Wexler, Kosslyn &Berthoz, 1998; Wohlschläger, 2001; Tomasino et al.,2005; Amorim et al., 2006; Eisenegger et al., 2007; men se Flusberg & Boroditsky, 2011).