Varje gång vi skapar något nytt går vi från 0 till 1. Skapandet är unikt, liksom ögonblicket för skapandet, och resultatet är något nytt och märkligt.
Peter Thiel, Zero to One
I en studie från 1992 som publicerades i Nature arbetade man med fem månader gamla spädbarn för att fastställa deras förmåga att förstå addition och subtraktion. Experimentatörerna visade spädbarnen ett föremål, gömde det bakom en skärm och lät sedan spädbarnen titta på när de lade till ett extra föremål bakom skärmen. Under vissa försök tog försöksledarna i smyg bort det extra föremålet. Redan vid den åldern visste spädbarnen att något var fel när de såg att ”noll fler” föremål lades till gruppen i stället för ”ett fler” föremål.
För det mesta är detta den medfödda intuition som förde oss genom våra tidiga matematiklektioner. Om vi hade tur (eller otur, beroende på vem du frågar) fick vi vår första smak av att formalisera denna intuition i geometri på mellanstadiet eller gymnasiet. Med utgångspunkt i satser som kallas ”axiom” – saker som vi tog för givet som sanna – tvingades vi fundera över hur vår intuition härrörde från dessa axiom, och konstruerade formella, om än enkla, matematiska ”bevis” för resultat som kosinussatsen eller kongruensen av två trianglar.
Om du har glömt det så säger kosinuslagen att c2=a2+b2-2abcos(C)c^2 = a^2 + b^2 – 2ab\cos(C)c2=a2+b2-2abcos(C), där aaa, bbb och ccc är sidlängder i en triangel och CCC är vinkeln motsatt till sidan ccc. Om man sätter in 90 grader för CCC får man Pythagoras sats.
I den första geometriundervisningen fick vi veta vad vi kunde anta att det var sant – men stannade vi någonsin upp och frågade oss varför?
Vem bestämde exakt vad vi kunde ta för givet? Varför just dessa axiom? Varför kunde vi inte anta att cosinuslagen var sann, och varför måste vi bevisa den?
Matematiker har funderat länge och hårt på dessa frågor, och det råder samförstånd i samhället inte nödvändigtvis om specifika axiom som vi tar för givet som sanna, utan om en princip: att hålla antalet antaganden till ett minimum. Detta liknar en berömd teknik för problemlösning som kallas Occams rakkniv: ”När man ställs inför konkurrerande hypoteser för att lösa ett problem bör man välja den lösning som innehåller minst antal antaganden.”
Fastställande av axiom
Problemet med att komma fram till en minimal uppsättning axiom som all matematik följer av är svårare än vad det ser ut. Matematiker har arbetat i åratal för att göra det, och det mest kända försöket var Principia Mathematica, som publicerades 1913 av matematikerna Alfred North Whitehead och Bertrand Russell. År 1931 bevisade dock logikern Kurt Gödel att ett sådant system var omöjligt – kort sagt, alla val av axiom skulle antingen vara ofullständiga och oförmögna att bevisa hela matematiken, eller inkonsekventa och kunna användas för att bevisa motsägelser.
Matematiken måste ändå börja någonstans, och därför har matematiker definierat specifika axiom för de specialiseringar som de arbetar med, som geometri (tänk på Euklids axiom). Dessa specialiserade axiom är vad geometriker, algebraiker och så vidare har bestämt sig för att vara den minimala uppsättning antaganden som de behöver för att kunna utföra ett produktivt arbete och dra giltiga slutsatser.
Det är med hjälp av dessa axiom som vi rigoröst kan visa att 1 i själva verket är större än 0 – inte utifrån nebulösa föreställningar som ”intuition”, utan utifrån en solid matematisk grund som bygger på den axiomatiska konsensus som råder inom det matematiska samfundet.
Kanske är det just detta som skiljer vår mentala kapacitet från fem månader gamla barns.
Som en sidoanteckning kan nämnas att det har lett till skapandet av helt nya grenar av matematiken att man har brutit mot konventioner och utforskat konsekvenserna av alternativa axiom. Ett exempel är sfärisk geometri, som kastar ut de traditionella euklidiska grunderna genom fönstret. På en sfär kan till exempel vinklarna i en triangel summera till mer än 180 grader.
De axiom vi behöver
”Gud skapade de naturliga talen; allt annat är människans verk.”
Leopold Kronecker, tysk matematiker
När jag säger ”minimal uppsättning antaganden” finns det många olika nivåer av ”minimal” som vi kan börja med. Vår grundläggande abstraktionsnivå skulle eventuellt kunna vara att allt vi har att arbeta med är de naturliga talen – 1,2,3, …1, 2, 3, …1,2,3, …1,2,3, …. – som Kronecker verkar förespråka. Alternativt kan vi helt enkelt ta 1>01 > 01>0 som ett axiom.
Vi skulle kunna gå i några riktningar med den första metoden. Det finns Peanoaxiomen, som är en uppsättning axiom om de naturliga talen som syftar till att fullständigt beskriva deras beteende. Dessa axiom är nästan som Newtons lagar – de är inte konstruerade utan snarare en beskrivning av de ”naturliga” egenskaperna hos de naturliga talen. I detta tillvägagångssätt definierar vi helt enkelt de naturliga talens ordning, så vi drar slutsatsen 1>01 > 01>0 genom konstruktion.
Vi definierar de naturliga talens ordning på följande sätt: för de naturliga talen aaa och bbb gäller att a≤ba \leq ba≤b om och endast om a+c=ba + c = ba+c=b för något naturligt tal ccc.
Det är giltigt, men i viss mån verkar det vara lite billigt – vi definierar i huvudsak vårt resultat till existens.
Å andra sidan skulle vi kunna försöka bevisa 1>01 > 01>0 i de verkliga talen. Att börja från grunderna i denna riktning är dock nästan ”för nära hårdvaran”, och för att gå från de naturliga talen (1,2,31, 2, 31,2,3 osv.) till de reella talen (t.ex. 2,π,3\sqrt{2}, \pi, 32,π,3) krävs användning av sådana begrepp som Cauchys sekvenser, ekvivalensklasser med mera – verktyg som kräver en grundlig bakgrund i modern algebra (vilket jag tyvärr saknar).
Att ta det sista tillvägagångssättet, att axiomatisera vår slutsats att 1>01 > 01>0 till sanning, skulle vara liktydigt med att äta dessert före middagen.
Det tillvägagångssätt som jag fann mest upplysande – lättillgängligt men ändå tillfredsställande rigoröst – presenterades i min introduktionskurs i analys vid University of Michigan av professor Stephen DeBacker. Vi börjar på en abstraktionsnivå som är lättförståelig – men ändå tillräckligt logiskt åtskild från vårt resultat – så att vi fortfarande kan se med egna ögon hur våra grundläggande antaganden kan användas för att formalisera den till synes enkla slutsats vi strävar efter. Dessutom kommer våra grundantaganden att vara samma antaganden som används av specialister inom områdena modern algebra och realanalys – så jag skulle säga att vi har rätt att välja denna plats som utgångspunkt.
Vårt ”minimala antagande” är att de reella talen uppfyller nedanstående egenskaper, där aaa, bbb och ccc är godtyckliga reella tal. Den term som vanligen används av det matematiska samfundet för att hänvisa till varje egenskap anges inom parentes bredvid varje egenskap.
- a+ba + ba+b är ett reellt tal (dvs. addition av två reella tal resulterar i ett annat reellt tal, även kallat ”closure under addition”)
- a×ba \times ba×b är ett reellt tal (”closure under multiplikation”)
- a+b=b+aa + b = b + aa+b=b+a (dvs.d.v.s. vi kan byta ordning på addenderna, så kallad ”commutativity of addition”)
- (a+b)+c=a+(b+c)(a + b) + c = a + (b + c)(a+b)+c=a+(b+c) (d.v.s. vi kan lägga till i vilken ordning som helst, kallas ”associativitet för addition”)
- Det finns ett verkligt tal 000 så att a+0=aa + 0 = aa+0=a (000 är ett ”additivt identitetselement”)
- Det finns finns ett reellt tal xxx så att a+x=0a + x = 0a+x=0 (xxx är ett ”additivt omvänt element”)
- a×b=b×aa \times b = b \times aa×b=b×a (”kommutativitet av
- (a×b)×c=a×(b×c)(a \times b) \times c = a \times (b \times c)(a×b)×c=a×(b×c) (”associativitet av multiplikation”)
- Det finns finns ett verkligt tal 111 så att a×1=aa \times 1 = aa×1=a (1 är en ”multiplikativ identitet”)
- Det finns ett verkligt tal yyy så att a×y=1a \times y = 1a×y=1, när aaa inte är noll (yyy är en ”multiplikativ invers”)
- a×(b+c)=a×b+a×ca \times (b + c) = a \times b + a \times ca×(b+c)=a×b+a×c (”distributivitet”)
- 1≠01 \neq 01=0
- De reella talen är uppdelade i positiva och negativa delmängder
- Addera och multiplicera positiva tal (i.e. tal större än 000) tillsammans ger ett positivt tal
- Alla reella tal aaa är antingen positiva (a>0a > 0a>0), negativa (a<0a < 0a<0), eller noll i sig själv (a=0a = 0a=0=0)
För tillfället kan vi sätta in några värden för aaa, bbb och ccc för att få en uppfattning om varför var och en av dessa egenskaper gäller. Återigen, det finns sätt att bevisa att de reella talen uppfyller alla ovanstående egenskaper med hjälp av verktyg från modern algebra, men utan den bakgrunden är det vi har ovan en mycket lättillgänglig utgångspunkt.
Och vi kommer inte heller att behöva använda alla de givna egenskaperna ovan i vårt bevis, men jag har listat dem alla här eftersom en (potentiellt oändlig) samling av tal som uppfyller de första tolv egenskaperna har ett speciellt namn bland matematiker – ett ”fält”. Om denna samling tal också uppfyller de tre sista egenskaperna kallas den för ett ”ordnat fält”. I huvudsak är vårt antagande att de reella talen bildar ett ordnat fält.
Beviset
För att börja vårt bevis utgår vi från vårt axiom – att de reella talen bildar ett ordnat fält och följaktligen uppfyller de femton egenskaperna ovan.
För att börja vet vi genom egenskaperna (5) och (9) ovan att de reella talen 000 och 111 finns. Genom egenskap (15) vet vi att 111 är antingen positivt, negativt eller noll. Genom egenskap (12) vet vi att 1≠01 \neq 01=0. Det lämnar två möjligheter: antingen är 111 positivt och 1>01 > 01>0; eller 111 är negativt och 1<01 < 01<0.
Vi går nu vidare med en teknik som kallas ”bevis genom motsägelse”. I huvudsak antar vi att något som vi vill visa är osant är sant, och använder den antagna sanningen för att bevisa något som vi med säkerhet vet är osant. Den logiska konsekvensen av denna typ av manöver är att det måste vara omöjligt att det som vi antog vara sant verkligen är sant, eftersom det ledde till en omöjlighet. Därför måste det vara falskt.
Om vi har några möjligheter att välja mellan, varav en måste vara sann, är denna taktik ett bra sätt att eliminera de omöjliga valen och begränsa omfattningen av vad som är den verkliga möjligheten.
Om bevis genom motsägelse låter komplicerat är det det – men det är också ett viktigt matematiskt verktyg. Ibland gör komplexiteten i att bevisa något direkt – utan motsägelse – problemet tillräckligt svårt för att det faktiskt kan vara lättare att visa att de alternativa möjligheterna helt enkelt inte kan vara sanna.
Låt oss anta att 1<01 < 01<0 – att 111 är negativt – och visa att det leder till en omöjlighet. En potentiell omöjlighet som vi skulle kunna visa är att detta antagande innebär att 1≥01 \geq 01≥0, eftersom 111 enligt egenskap (15) inte kan vara både mindre än noll och större än eller lika med noll samtidigt.
Enligt egenskap (6) finns det ett reellt tal xxx så att 1+x=01 + x = 01+x=0.
Vi kan addera xxx till båda sidorna för att få 1+x<0+x1 + x < 0 + x1+x<0+x.
Då egenskapen (5) talar om att 0+x=x0 + x = x0+x=x, kan vi förenkla ojämlikheten till 0<x0 < x0<x.
Vi kan dock inte säga ännu att xxx måste vara -1-1-1-1 – egenskap (6) säger bara att det finns ett reellt tal xxx. Vi måste bevisa det.
Ett lemma är en mellanliggande sanning som vi kan använda för att visa ett bevis för ett större resultat. Huruvida något kallas teorem eller lemma är inte nödvändigtvis väldefinierat, men i allmänhet ”hjälper” lemman oss att bevisa det vi egentligen vill ha.
Lemma: Additiva inverselement är unika
I vårt fall, för att bevisa att xxx i egenskap (6) är unikt – närmare bestämt att det bara finns ett verkligt tal xxx så att 1+x=01 + x = 01+x=0 (och följaktligen att det verkliga talet xxx måste vara -1-1-1), kan vi återigen gå vidare genom motsägelse.
Antag att det finns ett annat verkligt tal zzz, där z≠xz \neq xz=x, så att 1+z=01 + z = 01+z=0. Betrakta nu uttrycket x+1+zx + 1 + zx+1+z. Eftersom likhet är reflexiv – det vill säga a=aa = aa=a för alla aaa – vet vi att x+1+z=x+1+zx + 1 + z = x + 1 + zx+1+z=x+1+z=x+1+z.
Med hjälp av egenskapen (4), additionens associativitet, kan vi gruppera termerna som (x+1)+z=x+(1+z)(x + 1) + z = x + (1+z)(x+1)+z=x+(1+z).
Med hjälp av egenskap (3), additionens kommutativitet, kan vi omorganisera den första kvantiteten så att vi får (1+x)+z=x+(1+z)(1+x)(1+x) + z = x + (1+z)(1+x)+z=x+(1+z).
Då 1+x1 + x1+x och 1+z1 + z1+z båda är lika med noll har vi 0+z=x+00 + z = x + 00+z=x+0, och genom egenskap (5), det additiva identitetselementet, z=xz = xz=x. Vi antog dock att z≠xz \neq xz=x, så vi har en motsägelse!
Det kan alltså bara finnas ett verkligt tal xxx så att 1+x=01 + x = 01+x=0. Om vi ersätter varje fall av 111 i raderna ovan med ett godtyckligt verkligt tal aaa, visar detta lemma att det för varje verkligt tal aaa finns ett unikt xxx så att a+x=0a + x = 0a+x=0. Eftersom detta xxx är unikt kan vi säkert ge detta xxx ett unikt namn, -a-a-a, vilket resulterar i det välkända begreppet negationer, där a+(-a)=0a + (-a) = 0a+(-a)=0. I vårt specifika fall visar detta att xxx måste vara lika med -1-1-1.
Lemma: Negativa tecken ”annullerar”
Använder man resultaten från ovanstående lemma blir vår ojämlikhet från tidigare, 0<x0 < x0<x, till 0<-10 < -10<-1.
Enligt egenskap (14) är produkten av positiva tal positiv, så 0<(-1)(-1)0 <(-1)(-1)0 <(-1)(-1)0<(-1)(-1). Vi kan dock inte säga ännu att ”två negativa tal upphäver varandra” – inget av axiomen innebär det! Vi måste bevisa att (-1)(-1)=(1)(1)(1)(-1)(-1) = (1)(1)(1)(-1)(-1)=(1)(1)(1). Vi behöver ett annat lemma.
I det allmänna fallet, för varje reellt tal aaa, behöver vi visa att (-a)(-a)=(a)(a)=a2(-a)(-a)(-a) = (a)(a)(a) = a^2(-a)(-a)(-a)=(a)(a)=a2. Egenskap (6) – antagandet att varje element har en additiv invers – handlar om negativa tecken och kan vara en intressant väg att visa detta.
Om du känner att du börjar få grepp om saker och ting, kan du gärna sluta här och försöka använda axiomen för att bevisa några av de mellanliggande resultaten på egen hand. Om du fastnar kan du alltid bläddra ner!
Då additiva inverser är unika vet vi att det finns ett unikt reellt tal -a2-a^2-a2 så att a2+(-a2)=0a^2 + (-a^2) = 0a2+(-a^2)=0a2+(-a2)=0.
Med hjälp av egenskap (3), additionens kommutativitet, har vi -a2+a2=0-a^2 + a^2 = 0-a2+a2=0.
Det tidigare lemmat berättade att om -a2+x=0-a^2 + x = 0-a2+x=0, så är xxx unikt, så om vi har ett uttryck av formen -a2+x=0-a^2 + x = 0-a2+x=0, så måste vi ha x=a2x = a^2x=a2. Om vi kan visa att -a2+(-a)(-a)=0-a^2 + (-a)(-a) = 0-a2+(-a)(-a)=0, vet vi med säkerhet att (-a)(-a)=a2(-a)(-a) = a^2(-a)(-a)=a2.
Låt oss arbeta med uttrycket -a2+(-a)(-a)-a^2 + (-a)(-a)-a2+(-a)(-a)(-a). Vi måste på något sätt dela upp -a2-a^2-a2 i sina ingående termer för att faktorisera det, så vi behöver ännu ett lemma – för att bevisa att -a2=-a(a)-a^2 = -a(a)-a2=-a(a).
Lemma: Produkt av negativ och positiv är negativ
För det här lemmat tar vi ett liknande tillvägagångssätt som det vi började med ovan, där vi använder unika additiva inverser för att visa att en produkt måste vara lika med en annan produkt. Eftersom -a2-a^2-a2 är den unika additiva inversen av a2a^2a2, om vi visar att a2+(-a)(a)=0a^2 + (-a)(a) = 0a2+(-a)(a)=0, så är (-a)(a)=-a2(-a)(a) = -a^2(-a)(a)=-a2.
Notera att a2=a(a)a^2 = a(a)a2=a(a), så genom egenskap (7), multiplikationens kommutativitet, har vi a2+(-a)(a)=a(a)+a(-a)a^2 + (-a)(a) = a(a) + a(-a)a2+(-a)(a)=a(a)+a(-a).
Med hjälp av egenskap (11) kan vi faktorisera a(a)+a(-a)a(a) + a(-a)a(a)+a(-a) till a(a+(-a))a(a+(-a))a(a+(-a))a(a+(-a)).
Med stöd av egenskap (6) är a+(-a)=0a + (-a) = 0a+(-a)=0, så vi har a2+(-a)(a)=a0a^2 + (-a)(a) = a0a2+(-a)(a)=a0.
Vi skulle vara klara om a0=0a0 = 0a0=0, men det har vi inte bevisat ännu!
Lemma: Produkt med 0 är 0
Med stöd av egenskap (5) är 0+0=00+0+0 = 00+0=0. Således kan vi skriva a0=a(0+0)a0 = a(0+0)a0=a(0+0).
Med hjälp av egenskap (11) distribueras detta till a0=a0+a0a0a0 = a0 + a0a0=a0+a0.
Enligt egenskap (6) finns det en unik additiv invers -a0-a0-a0-a0 till a0a0a0, så vi kan addera den till båda sidorna av vår ekvation för att få a0+(-a0)=a0+a0+a0+(-a0)a0+(-a0) = a0 + a0 + a0+(-a0)a0+(-a0)=a0+a0+(-a0).
Vid förenkling får vi 0=a00 = a00=a0.
Sätt ihop det hela
Med detta kan vi dra slutsatsen att a2+(-a)(a)=a0=0a^2 + (-a)(a) = a0 = 0a2+(-a)(a)=a0=0, så (-a)(a)=-a2(-a)(a) = -a^2(-a)(a)=-a2.
Om vi för in detta i föregående lemma har vi -a2+(-a)(-a)=-a(a)+(-a)(-a)-a^2 + (-a)(-a) = -a(a) + (-a)(-a)-a2+(-a)(-a)=-a(a)+(-a)(-a).
Med hjälp av egenskap (11) kan vi sedan faktorisera detta uttryck till -a2+(-a)(-a)=-a(a+(-a))-a^2 + (-a)(-a) = -a(a + (-a))-a2+(-a)(-a)(-a)=-a(a+(-a)).
Med egenskapen (6), genom att sätta ihop de additiva inverserna, har vi -a2+(-a)(-a)=-a0-a^2 + (-a)(-a) = -a0-a2+(-a)(-a)=-a0, så -a2+(-a)(-a)=0-a^2 + (-a)(-a) = 0-a2+(-a)(-a) = 0-a2.
Därmed är (-a)(-a)(-a)(-a)(-a)(-a)(-a) den unika additiva inversen av -a2-a^2-a2, och därmed är (-a)(-a)=a2(-a)(-a)(-a) = a^2(-a)(-a)=a2.
Om vi packar upp hela vägen till toppen, så slutade vi vid 0<(-1)(-1)0 < (-1)(-1)0<(-1)(-1)(-1). Detta sista lemma säger oss att (-1)(-1)=(1)(1)(1)(-1)(-1)(-1) = (1)(1)(1)(-1)(-1)=(1)(1)(1). Enligt egenskap (9) är det multiplikativa identitetselementet, (1)(1)=1(1)(1)(1) = 1(1)(1)=1. Således har vi 0<10 < 10<1, så 1>01 > 01>0.
Detta är en motsägelse, eftersom vi antog att 1<01 < 01<0! Enligt egenskap (15) är varje reellt tal antingen positivt, negativt eller noll – inget tal kan vara både positivt och negativt samtidigt! Vi har alltså en omöjlighet, och vårt ursprungliga antagande – 1<01 < 01<0 – kan inte hålla. Vi kan eliminera denna möjlighet, vilket gör att det bara återstår ett fall: Eftersom vi vet att varje verkligt tal måste falla in i något av de tre fallen, och vi har eliminerat två av dem, måste vi ha 1>01 >01 > 01>0.
Som Peter Thiel så fint uttryckte det, hur fräscht och märkligt.