
Vattenövervakning med felkällor
Dagens forskare arbetar ofta med oerhört stora datamängder. Det borde få genomgripande konsekvenser för deras arbetssätt, säger forskarna i tillämpad statistik vid Linköpings universitet. De talar till och med om behovet av ett paradigmskifte inom forskningen. (2007-05-31)
Professor Anders Grimvall och hans kollegor börjar bli vana vid hetluften. Det skrällde till ordentligt i våras när de avslöjade några avgörande svagheter i den svenska miljöövervakningen. Föroreningarna i vatten och luft har övervakats i flera decennier. Nu visade linköpingsforskarna att flera av de förändringar som uppmätts i de långa tidsserierna av vattenprover med största sannolikhet handlar om rena mätfel.
- De här variationerna är skapade någonstans mellan provtagningen och rapporteringen av mätvärden. De har aldrig ägt rum ute i naturen, sade Anders Grimvall, och drog med det uttalandet igång en vetenskaplig batalj.
Det hela började i oktober 2006 när doktoranden Kalle Wahlin gjorde några datakörningar utifrån en ny metod som gruppen konstruerat, en tredimensionell graf gjord just för att kunna upptäcka mönster i många långa parallella serier av data.
- Kalle bad mig komma och titta, det såg lustigt ut tyckte han, berättar Anders Grimvall. Och sedan blev jag sittande framför datorn i bortåt tjugo timmar. Jag kunde inte tro vad jag såg.
- Övervakningen av vattenkvalitet är ju kronjuvelen i den svenska

miljö-
övervakningen. Vi hade valt att arbeta med dessa data just för att vi ville ha något med bra kvalitet. Och så hittade vi det här. Enstaka fel förekommer i alla miljö-
databaser och några felkällor har redan dokumenterats av SLU, men det här var omskakande.
Det forskarna hittade var en så stor samvariation i fosforhalten i vattenprover tagna på olika ställen i landet, att de blev misstänksamma (se figuren ovan där enheterna på y-axeln är mikrogram fosfat per liter).
- Att fosforhalterna varierar kraftigt från år till år är i sig inte anmärkningsvärt. Det beror oftast på vädret. Men det verkade märkligt att samma variationer uppträdde över hela Sverige.
När även proverna från Vättern visade exakt samma svängningar började de definitivt ana oråd. Det tar 80 år för vattnet i Vättern att omsättas så det är svårt att tro att halterna av fosfor kan variera så kraftigt från år till år.
Till slut kom de fram till att det till stor del handlar om rena mätfel. Frågan är förstås hur det har kunnat hända. Anders Grimvall vill inte lägga skulden på laboratoriet, utan menar att man underskattar svårigheten i uppgiften.
- Mängden av data är ett stort problem, säger han. De blir helt enkelt svåra att överblicka och analysera.
Problemet är inte begränsat till miljödata.
- Så länge forskarna samlade in måttliga datamängder kunde de själva hantera alla leden. Men idag är datoriserade instrument varje forskare egendom. Allt mer kan mätas och registreras. De flesta forskare arbetar med oerhört mycket mer data än de gjorde för sådär tio år sedan. Det ställer nya krav.
Biologer, hydrologer, oceanografer med flera arbetar med modeller som kräver just stora mängder indata.
- Hydrologer bygger upp oerhört komplicerade modeller på en mycket detaljerad nivå, där de kan följa förändringar i vattenflödena timme för timme.
Men ju mer detaljerad man gör en modell, fortsätter Anders Grimvall, desto större blir risken för felkällor i indata. Det är omöjligt att ha full kontroll.
- Vi ifrågasätter detaljeringsgraden om man vill analysera utvecklingen över en längre tid, kanske tio år eller mer. Då kan man ta hänsyn till färre faktorer, vilket gör sambanden enklare. Men det kräver statistiska metoder och modeller.
Att tala om för andra forskare, i andra discipliner, hur de bör arbeta är förstås inget sätt att bli populär på. Men Anders Grimvall är inte bara statistiker, han är tämligen hemmastadd inom miljökemi också och har i många år arbetat på Tema Vatten. Så hans kritik, just när det gäller miljöstatistik, är svår att bara skaka av sig.
- Vi har väl tagit på oss lite av rollen som buse när det gäller att ifrågasätta och kritiskt granska det som andra forskare gör, särskilt inom miljöområdet.
Just miljöstatistik är Linköpingsforskarnas specialitet. De leder forskningsprogrammet ENGO, Environmental Goal Achievement under Uncertainty. Uppgiften är att hitta mätmetoder för att se hur Sverige klarar av att uppfylla de 16 nationella miljömålen. Anders Grimvall är också engagerad i ett samarbete mellan 15 europeiska länder för att se hur äldre tidsserier över klimatdata kan korrigeras.
- När det gäller klimathotet bygger ju mycket av vår kunskap på många och långa klimatdataserier, säger han. Och här finns ett stort problem med datakvaliteten.
Text: ANIKA AGEBJÖRN
Bilder: VIBEKE MATHIESEN m fl
(2007-05-31)
Miljöstatistik en LiU-profil
Avdelningen för statistik hör numera till Institutionen för datavetenskap vid LiU. Forskning bedrivs inom tre områden, miljöstatistik, trafikstatistik och Internetbaserade undersökningar.
Linköpings universitet har landets enda utbildningsprogram i Statistik- och dataanalys, en integrerad utbildning i statistik, matematik och data/IT och med en stark inriktning på tillämpningar.
Avdelningen leds av professor Anders Grimvall.

Professor Anders Grimvall trodde först inte sina ögon när han fick se vad . . .

. . . doktoranden Kalle Wahlin upptäckt i materialet från decennier av vattenundersökningar.
ENGO - Assessment of environmental goal achievement under uncertainty
Sidansvarig:
birgitta.weibull@liu.se
Senast uppdaterad: Mon Oct 24 10:01:16 CEST 2011


