fredag 21. desember 2012

The Solar Cycle Model and the HadCRUT4 NH temperatures

In earlier blog posts I often used the HadCRUT3 temperature series when testing the Solar Cycle Model. I am asked whether the results would have been different if I had applied the new HadCRUT4 temperatures. The answer is no.  This is not surprising, because I have earlier seen that the NASA GISS NH temperatures also fit with the model approximately in the same way as the HadCRUT3 NH temperatures do.

I now show how the model predicts the temperature for Solar Cycle 21 and 24. In both cases I show an old plot based on the HadCRUT3 NH temperatures followed by a new plot based on the HadCRUT4 NH temperatures. I refer to an earlier blog post for explanation of the plots. Now I just comment on any differences between HadCRUT 3 and 4.

onsdag 12. desember 2012

Solar Cycle Model, comparison of results

Jan-Erik Solheim, Kjell Stordahl and Ole Humlum (hereafter SSH) have recently published two articles about the relationship between the mean temperature in a solar cycle and the length of the previous solar cycle [1, 2]. I have discussed these articles in earlier blog posts, see [3]. I assume that the reader is familiar with this.

In this blog post I directly compare some of SSH's results with my results. I put special emphasis on the plots showing the predictions for solar cycle 23 and for the current cycle 24. I also comment on the robustness check that SSH use to test the model; a check that in my opinion fails.

fredag 21. september 2012

Solar Cycle Model fails after mid-1970s

Updated 17  December 2012.




Abstract.


Jan-Erik Solheim, Kjell Stordahl and Ole Humlum (hereafter SSH) have recently published two articles about the relationship between the mean temperature in a solar cycle and the length of the previous solar cycle [1, 2]. For the northern hemisphere, they found a negative correlation between those two variables. A long solar cycle is followed by a solar cycle with a low temperature, and a short solar cycle is followed by a solar cycle with a high temperature. SSH call this the Previous Solar Cycle Length Model. For simplicity, in this note I refer to it as the Solar Cycle Model.

When a solar cycle has ended, its length is known, and the model can predict the mean temperature in the next solar cycle.

The temperatures fitted well with the Solar Cycle Model until the mid-1970s, but not later. The mean temperatures during the last solar cycles have been much higher than predicted by the Solar Cycle Model. The mean temperature so far in the current solar cycle 24, which has lasted for about 3.5 years, is much higher than the Solar Cycle Model predicts.

lørdag 28. juli 2012

Solsyklusmodellen feiler etter midten av 1970-tallet

Jeg har i de foregående innleggene omtalt solsyklusmodellen til Jan-Erik Solheim, Kjell Stordahl og Ole Humlum (SSH). Jeg har sammenfattet og utvidet dette i notatet Solsyklusmodellen feiler etter midten av 1970-tallet. Du ser notatet i Google document viewer ved å klikke på linken. Du kan laste det ned på PC-en din ved å velge Save kommandoen i File menyen, og deretter åpne det i en annen pdf leser. Adobe Acrobat Reader viser kapitelloversikt (bookmarks) over  notatet i sin venstre ramme, noe jeg synes er nyttig og som jeg savner i Google document viewer.


Notatet viser at temperaturene passet bra med solsyklusmodellen frem til midten av 1970-tallet, men ikke etter det. Temperaturene etter midten av 1970-tallet har vært mye høyere enn solsyklusmodellen predikterte for dem. Solsyklusmodellen kan derfor ikke brukes til å prediktere fremtidige temperaturer slik SSH hevder.

Noen bruker solsyklusmodellen som en av flere hypoteser for å motbevise og/eller så tvil om konsensuset blant verdens klimaforskere om at menneskeskapte drivhusgasser nå har blitt det dominerende klimapådrivet. Den inngår i argumentasjonen bak "It's the sun, stupid" og at det bare er de naturlige syklusene som er dominerende klimapådriv. Det er derfor viktig å dokumnetere at solsyklusmodellen har sviktet totalt etter midten av 1970-tallet, og at den ser ut til å svikte totalt også for inneværende solsyklus.

I resten av innlegget gjengir jeg noen avsnitt fra notatet Solsyklusmodellen feiler etter midten av 1970-talletUtfyllende kommentarer for å binde avsnittene sammen er skrevet i kursiv. Alt er begrunnet i notatets 22 sider, bl.a. i 10 figurer, og i flere tabeller med statistikkinformasjon.

fredag 22. juni 2012

Durbin-Watson test for autokorrelasjon

Jan-Erik Solheim, Kjell Stordahl og Ole Humlum (SSH) predikterer sterkt fallende temperatur i tiåret som vi er inne i nå [1, 2]. De bruker Durbin-Watson testen for å sjekke om prediksjonene svekkes av autokorrelasjon i dataene, noe de mener ikke skjer. De forrige innleggene mine er om prediksjonene til SSH, som jeg mener er ekstremt usannsynlige. Nå går jeg gjennom Durbin-Watson testen og SSH's buk av den. 


SSH slår seg til ro med OK verdier fra Durbin-Watson testen selvom enkle vurderinger av dataene tilsier at modellen deres ikke lenger fungerer. I innlegget som du leser nå viser jeg plot som visualiserer disse enkle vurderingene.

Innlegget er delt opp i 4 deler.

1.    Durbin-Watson testen og statistisk signifikant autokorrelasjon.
2.    Konsekvensen av autokorrelasjon for konfidensintervallet rundt en prediksjon.
3.    Durbin-Watson testen anvendt på en typisk temperaturserie.
4.    Durbin-Watson testen anvendt på Anscombes kvartett.

fredag 8. juni 2012

Solsyklus lengde og globale temperaturer


I innleggene mine 22. mai og 3. juni gikk jeg gjennom modellen til Jan-Erik Solheim, Kjell Stordahl og Ole Humlum, senere omtalt som SSH. SSH har beskrevet modellen i [1, 2]. Kort sagt påviser SSH en negativ korrelasjon mellom middeltemperaturen i en solsyklus og lengden på den forrige solsyklusen. SSH bruker denne korrelasjonen til å prediktere en sterkt fallende temperatur i solsyklus 24, begrunnet med at solsyklus 23 var lang. Solsyklus 24 startet i desember 2008 og vil vare frem til ca 2020. Prediksjonen gjelder først og fremst for Grønnland, Svalbard og i Nord-Europa. I mine to innlegg bekrefter jeg den påviste negative korrelasjonen, men jeg argumenterer for at modellen ikke lenger fungerer. Jeg mener at det er ekstremt lite sannsynlig at SSH's prediksjoner om sterkt fallende temperatur i inneværende solsyklus vil slå til. Jeg begrunner det med at modellen har bommet totalt for solsyklusene med start etter 1976.

I mine 2 foregående innlegg analyserte jeg, som SSH, lokale temperaturer. Jeg så også på HadCRUT3 og NASA GISS temperaturene for den nordlige halvkulen. Alle disse temperaturseriene viser den omtalte negative korrelasjonen. I innlegget som du leser nå, undersøker jeg om dette også gjelder for de globale temperaturene.

søndag 3. juni 2012

Solsyklus lengde og lokale temperaturer


I mitt forrige blogginnlegg omtalte jeg notatet Solar Activity and Svalbard Temperatures, [1]. Jan-Erik Solheim, Kjell Stordahl og Ole Humlum, heretter omtalt som SSH, skrev i notatet om en kobling mellom solsyklus lengde og Svalbard temperatur.

SSH har også skrevet et annet notat om det samme emnet, The long sunspot cycle 23 predicts a significant temperature decrease in cycle 24  [2]. Jeg går gjennom det notatet i innlegget som du leser nå.

Solsyklus 23 er den forrige solsyklusen. Den varte i 12.2 år, som er lenger enn gjennomsnittet på ca 11 år. Nåværende solsyklus 24 begynte i desember 2008. SSH predikterer en fallende temperatur i solsyklus 24. De begrunner det med en påvist negativ korrelasjon mellom temperatur i en solsyklus og lengden på den foregående solsyklusen. Som i mitt forrige innlegg bekrefter jeg SSH's beregninger av trender og standardfeil, men jeg regner ut litt andre konfidensintervall for prediksjonene. Jeg mener at det er ekstremt lite sannsynlig med fallende temperatur i inneværende solsyklus, noe jeg begrunner i innlegget som du leser nå.

tirsdag 22. mai 2012

Solsyklus lengde og Svalbard temperatur


Jan-Erik Solheim, Kjell Stordahl og Ole Humlum har i løpet av det siste året skrevet flere artikler der de predikterer lave temperaturer i Norge og i Arktis i inneværende solsyklus 24. De, senere omtalt som SSH, begrunner dette med at forrige solsyklus var lang, og at det er en negativ korrelasjon mellom temperaturen i en solsyklus og lengden på den forrige solsyklusen. SSH har analysert mange temperaturserier fra den nordlige halvkulen, og de har for alle påvist negativ korrelasjon mellom solsyklus lengde og temperaturen i den påfølgende solsyklusen. Solsyklus 23 sluttet i november 2008, og hadde da vart i 12.2 år. Gjennomsnitlig lengde på solsykluser er ca 11 år.

I innlegget som du leser nå, kommenterer jeg notatet "Solar Activity and Svalbard Temperatures", som SSH fikk publisert i november 2011. Jeg kommer frem til den samme negative korrelasjonen som SSH beskriver. Men jeg mener at prediskjonen deres om fallende temperatur i den inneværende solsyklusen er ekstremt lite sannsynlig, noe jeg begrunner i innlegget som du leser nå.

mandag 14. mai 2012

Korrelasjonskoeffisient og Anscombes kvartett

Korrelasjon mellom 2 variabeler eller datasett betyr at det kan være en kobling mellom dem. Det er positiv korrelasjon når variabelene har en tendens til å endre seg i samme retning, eksempelvis at når x øker i verdi gjør y det samme. Det er negativ korrelasjon når variabelene har en tendens til å endre seg i motsatt retning. Korrelasjon mellom to variabeler kan bety at den ene variabelen er en funskjon av den andre, men det er ikke nødvendigvis slik. Korrelasjonen kan være helt tilfeldig, eller det kan være noe annet som styrer de to variabelene som vi undersøker.

I dette innlegget vil jeg gå gjennom hvordan korrelasjonskoeffisienten regnes ut. Jeg vil også gå gjennom et kjent eksempel som viser at både korrelasjonskoeffisient og en lineær regresjonsanalyse kan være misvisende. Jeg gjør dette som bakgrunn for en senere omtale av to artikler som jeg mener gir misvisende konklusjoner fordi lineær regresjonsanalyse og korrelasjonskoeffisienter brukes ukritisk.

onsdag 9. mai 2012

Konfidensintervall for estimat og prediksjon

I lineær regresjonsanalyse tar vi utgangspunkt i et sett med xy verdier. X er den uavhengige variabelen, og y er antatt å være en lineær funksjon av x. Observasjonene av y er antatt å ha overlagret en tilfeldig støy. I et tidligere blogginnlegg gikk jeg gjennom noen av formelene for statistikk tilknyttet dette. Her var tiden den uavhengige variabelen x, og global temperatur var den avhengige variabelen y. Standardfeilen til regresjonsanalysen, SEregression, ble definert. Den angir hvor godt de observerte y verdiene passer til den beregnete regresjonslinjen. Den var basis i utregningen av p-verdien, som angir graden av statistisk signifikans for regresjonslinjen.

Resultatet fra en lineær regresjonsanalyse kan brukes til å estimere (prediktere) y gitt en x verdi. Prediksjoner om noe som kan observeres eller måles en gang i fremtiden, har en iboende usikkerhet. Prediksjoner basert på en lineær regresjonsanalyse er intet unntak. Innlegget som du leser nå, går gjennom denne usikkerheten. Jeg gjør det som bakgrunn for en omtale av to artikler som Solheim, Storholt og Humlum (SSH) har skrevet, der de predikterer sterkt fallende temperatur i solsyklusen som vi er inne i nå. Av forskjellige grunner mener jeg at prediksjonene deres er svært lite sannsynlige, noe jeg kommer tilbake til i et senere innlegg. Jeg vil først gå gjennom noe av det matematiske grunnlaget for usikkerhetene til estimater og prediksjoner.

fredag 6. april 2012

Kirsebærplukke globale temperaturdata

Dette innlegget er også lagt ut på Dagsavisen Nye meninger.

Å kirsebærplukke data er å bruke data som støtter egne synspunkter og å se bort fra data som ikke gjør det. Det er en utbredt virksomhet.

Jan-Erik Solheim, Kjell Stordahl og Ole Humlum (SSH) publiserte nylig innlegget Den globale temperaturen har flatet ut. Jeg mener at de  konkluderer feil pga. en kombinasjon av kirsebærplukking og for korte tidsserier, noe jeg begrunner i innlegget som du leser nå.

søndag 18. mars 2012

Klimarealistene misbruker IPCC rapport

IPCC rapporten om ekstremvær sier klart at våre utslippene av drivhusgasser har skapt og vil skape mere ekstremvær. Klimafornektere tolker rapporten til at menneskelig aktivitet ikke vil påvirke klimaet.

Mitt forrige innlegg handlet om en rapport om ekstremvær fra FNs klimapanel IPCC. Jeg avsluttet innlegget med å skrive at mange klimafornektere trekker ut en setning fra rapporten og mistolker den til at IPCC har snudd i synet på CO2. Jeg går nærmere inn på dette nå.

onsdag 14. mars 2012

IPCC Summary rapport November 2011

FNs Klimapanel IPCC utga i november 2011 et sammendrag av rapporten Managing the risks of extreme events and disasters to advance climate change adaptation. Rapporten handler mest om hvordan vi mennesker bør håndtere risikoen for ekstremvær og klimaendringer.

Rapporten handler også om allerede påviste sammenhenger mellom klimaendringer og ekstremvær, og om hva vi kan forvente oss av endringer i ekstremvær i resten av dette århundret. Rapporten er forsiktig, noe flere andre også kommenterer. Dette er for å ha er vitenskapelig dekning for det som skrives.

Rapporten handler ikke om effekten av de enkelte drivhusgassene i atmosfæren. Det kan virke rart å nevne hva rapporten ikke handler om. Jeg gjør det fordi noen, basert på denne rapporten, trekker feilaktige slutninger om IPCCs syn på CO2. Jeg kommer tilbake til det, både i slutten av dette innlegget og i et senere innlegg.

I resten av dette innlegget går jeg gjennom hva rapporten skriver om sammenhengen mellom ekstremvær, klima og menneskelig aktivitet. Menneskelig aktivitet er i denne sammenhengen primært utslipp av drivhusgasser og bruken av landjorda (skog, landbruk, byer, infrastruktur, etc.).

onsdag 7. mars 2012

Oppdaterte temperaturplot

En ny statisk side på Klimabloggen inneholder temperaturplot oppdatert t.o.m. desember 2011. Du kommer dit ved enten å klikke på fanen Temperaturplot eller ved å klikke her.

Intensjonen er å ajourføre plotene på den statiske siden i begynnelsen av hvert år, når temperaturene for det foregående året er tilgjengelige.

BEST temperaturene inneholder temperaturer bare frem til våren 2010, og de er derfor ikke tatt med på den statiske siden med oppdaterte temperaturer. Du kan lese om BEST temperaturene her. BEST temperaturene er bare basert på landtemperaturer. Berkeley jobber nå med å undersøke endringer i varmemengden i verdenshavene, som de skriver om her.

Temperaturdata endres

NASA skriver her at de i desember 2011 gikk over til versjon 3 av Global Historical Climatology Net (GHCN) dataene. NASA viser plot med temperaturer basert på både versjon 2 og versjon 3, men jeg finner ikke plot som viser hvordan deres globale månedlige temperaturer for land og havoverflate ble endret. Jeg skrev derfor et program som sammenligner temperaturene som jeg lastet ned sommeren 2011 med de som jeg lastet ned i februar 2012. Figuren under viser forskjellene for de månedlige NASA GISS temperaturene siden 1970.
Figur 1.  Endringer fra NASA GISS gamle temperaturer basert på GHCN versjon 2
til den nye serien basert på GHCN versjon 3.

Endringene vist i figur 1 påvirker ikke beregnete trender i merkbar grad. En stikkprøve med de 21 årlige temperaturene f.o.m. 1990 t.o.m. 2010 viser at de nye temperaturene gir en oppvarmende trend 0.01887 °C/år med p-verdi 0.00003, mens de gamle gir en oppvarmende trend 0.01938 °C/år med p-verdi 0.00002.

onsdag 29. februar 2012

Lagged scatterplot og autokorrelasjonskoeffisienter

Vi har tidligere sett på definisjonen av autokorrelasjonskoeffisient, se ligning (1) her.

Vi så at det er en sterk positiv autokorrelasjon mellom temperaturer i nabomåneder, noe som er forventet. Kalde måneder har en tendens til å etterfølge kalde måneder, og tilsvarende for varme måneder.

Men vi så også at det er en betydelig negativ autokorrelasjon mellom temperaturer ca 2,5 år fra hverandre i tid. Figur 1 i et tidligere innlegg viser 6 forskjellige lag autokorrelasjonskoeffisienter for tilsammen 265 tjue-års intervaller. Lag 29 måneders koeffisientene varierer mellom 0 og -0,3. I innlegget som du leser nå velger vi ut intervallet f.o.m. januar 1991 t.o.m. desember 2010 som et typisk intervall for nærmere analyse.

Lagged scatterplot
For hver tidsserie og hvert lag er autokorrelasjonskoeffisienten ett tall. Det er nyttig å se detaljer bak tallet, fordi mange forskjellige sammenhenger kan gi det samme tallet. Lagged scatterplot viser slike detaljer, og det gir mye innsikt i hva som ligger bak dette ene talllet. Figur 1 viser lagged scatterplot for lag 1, dvs. for nabomåneder. Figur 2 viser tilsvarende plot for lag 30, dvs. for måneder som er adskilt 2,5 år. Begge figurene viser residualene (restfeilene) etter at en lineær regresjonsanalyse er gjort på de månedlige NASA GISS temperaturene i 20-års intervallet fra 1991 til 2010.
Figur 1. Lag 1 måneds lagged scatterplot for de månedlige NASA GISS temperatune f.o.m. 1991 t.o.m. 2010.
Legend skjuler ingen blå punkter.

De blå punktene i figur 1 og 2 forklares best med et eksempel fra figur 1. Prikken lengst til høyre har horisontal verdi 0,50°C og vertikalverdi 0,21°C. Det betyr at residualet med verdi 0,50°C etterfølges av et residual på 0,21°C. Figuren sier ikke noe om hvor i x vektoren disse to residualene er. Den røde streken i figur 1 og 2 passer best mulig alle de blå punktene. En helning oppover, som i figur 1, viser en positiv autokorrelasjon, mens en helning nedover viser en negativ autokorrelasjon. 

mandag 27. februar 2012

Når er autokorrelasjonskoeffisient statistisk signifikant ?

Dette innlegget handler om statistisk signifikans for autokorrelasjonskoeffisienter, og det vurderer koeffisientene presentert i det forrige innlegget i så henseende. Jeg bruker formel for statistisk signifikans hentet fra et forelesningsnotat skrevet av Dave Meko fra University of Arizona.

Nullhypotesen
Som vanlig i signifikanstesting operer vi med en nullhypotese og en alternativ hypotese.

Nullhypotesen er at dataene ikke har noen iboende autokorrelasjon, og at det bare er tilfeldig støy på dataene som gjør en  beregnet autokorrelasjonskoeffisient forskjellig fra null. Nullhypotesen antar at temperaturresidualene etter en trendberegning er normalfordelte.

Den alternative hypotesen er at dataene har en iboende autokorrelasjon, og at det ikke er tilfeldig støy som gjør en beregnet autokorrelasjonskoeffisient forskjellig fra null. En beregnet autokorrelasjonskoeffisient er statistisk signifikant hvis det er mindre enn 5% sannsynlig at data uten en iboende autokorrelasjon gir en i tallverdi like stor eller større autokorrelasjonskoeffisient.

Konklusjon
Dette innlegget inneholder detaljer om statistikk og simuleringer som mange nok ikke er så interesserte i. Derfor starter jeg med konklusjonen mht. statistisk signifikans for autokorrelasjonskoeffisientene beregnet i det forrige innlegget.

Det forrige innlegget viste at lag 1 til 5 måneders autokorrelasjonskoeffisientene er positive, mens lag 30 måneders autokorrelasjonskoeffisientene er negative, alt når vi analyserer 20 års temperaturserier. Innlegget som du leser nå viser at:
  • Lag 1 til 5 måneders koeffisientene er alle statistisk signifikante med veldig god margin. Dvs. at det skyldes ikke tilfeldig støy på temperaturmålingene at det er sammenheng mellom temperaturene innenfor ca et halvt år. Sagt med andre ord; en varm eller kjølig periode varer gjerne minst et halvt år.
  • Lag 30 måneders koeffisientene er på grensen til å være statistisk signifikante. For noen 20-års intervaller er 30 måneders koeffisienten statistisk signifikant, og for andre er den det ikke. Dvs. at det med ca 95% sannsynlighet er en iboende autokorrelasjon i global temperatur som tilsier at en varm periode etterfølges av en kjølig periode ca 2,5 år senere.
  • Autokorrelasjonskoeffisientene regnet ut basert på de årlige temperaturseriene er langt unna å være statistisk signifikante.

mandag 6. februar 2012

Autokorrelasjonskoeffisienter i temperaturserier

Det forrige innlegget handlet om autokorrelasjon i de månedlige temperaturseriene, og om hvordan vi kan justere for autokorrelasjon når vi vurderer statistisk signifikans for en beregnet trend. I innlegget skrev jeg at det er nødvendig med denne justeringen når vi regner på de månedlige temperaturene, men ikke når vi regner på de årlige temperaturene. Det begrunnes nærmere i innlegget som du leser nå. Jeg skrev også at det i de månedlige temperaturseriene er en negativ autokorrelasjon mellom måneder som ligger drøye 2 år fra hverandre i tid. Dvs. at når en måned er varm, så er det sannsynlig at måneden drøye 2 år tidligere var kald, og omvendt.  I det forrige innlegget viste jeg ett eksempel på det, og i innlegget som du leser nå vil jeg vise at det gjelder generelt for de siste 40 årene for NASA GISS, HadCRUT3, NCDC og BEST temperaturseriene.

mandag 30. januar 2012

Autokorrelasjon i temperaturserier

I innlegget Når er global oppvarming statistisk signifikant ? gikk jeg gjennom ligningene som avgjør om en beregnet temperaturtrend er statistisk signifikant. I tabell 1 i det nevnte innlegget regnet jeg ut p-verdien for trenden fra 1998 til 2010 beregnet både på grunnlag av de årlige og de månedlige temperaturene. Det var mye lettere å få statistisk signifikans med de månedlige temperaturene enn med de årlige temperaturene. Jeg konkluderte med å bruke p-verdien regnet ut basert på de årlige temperaturene, både fordi jeg så at andre gjør det og fordi p-verdien basert på de årlige temperaturene var mest troverdig.

Beregningen av p-verdi i det nevnte innlegget forutsetter at temperaturene er statistisk uavhengige av hverandre. Dvs. at den vertikale avstanden fra en temperaturmåling til trendlinjen er statistisk uavhengig av de tilsvarende avstandene for temperaturmålingene før og etter i tid. For de årlige temperaturene stemmer det ganske bra. Men for de månedlige temperaturmålingene stemmer det ikke. Hvis f.eks. temperaturen i februar ligger over trendlinjen, ligger vanligvis også temperaturene for både januar og mars også over. Vi ser det klart i figur 1.
Figur 1.  NASA GISS månedlige temperaturavvik 1998 - 2010
I resten av innlegget går jeg gjennom hvordan vi kan kompensere for mangelen på statistisk uavhengighet.