Data er ikke kun guld og grønne skove

Klimabevidsthed vil medvirke til en mere selektiv og bevidst håndtering af data. Virksomhederne skal ikke bare bevidstløst samle data i en stor datapøl, for nogle data har ikke værdi, og data sætter klimafodspor.  

Verdens internet-aktivitet lægger efter sigende beslag på 10 pct. af klodens elektricitetsforbrug og udleder over to pct. af det menneskeskabte CO2-udslip. Med andre ord koster det på klimakontoen, når virksomheder og individer deler data, streamer, e-mailer, googler og deltager i den digitale økonomi.

Datamængderne og internetaktiviteten buldrer frem, og klimaftrykket fra de store datacentre vokser i samme takt. Internettrafikken udleder allerede nu lige så meget CO2 som flytrafikken. Den afgørende forskel er, at vores aktivitet på internettet vokser med 25 pct. om året. Befolkningens voksende klimabevidsthed er allerede zoomet ind på vores forbrug af flyrejser, og jeg tror, at vi over tid vil se et tilsvarende fokus på ansvarlig brug af data.

Datasøer eller datasumpe?

I en professionel sammenhæng kan virksomhederne bidrage med ikke at gentage fejlen fra data warehouse epoken. Troen på, at ”data er den nye olie”, fører mange steder til, at vi samler og lagrer eksplosivt voksende datamængder. Et fænomen som ”data lakes”, der opsamler strukturerede og ustrukturerede data i rigelige mængder, er en konsekvens af den filosofi. Vi gemmer altså data uden at have en ide om anvendeligheden. Disse datasøer bliver ofte til datasumpe, hvor uoverskueligheden og uensartetheden i data reelt gør dem værdiløse.

Hvor vi som enkeltindivider kan arbejde med hvor meget og hvor ofte vi bruger, deler og streamer, kan virksomheder bidrage med en mere intelligent og bevidst sortering af data. Vi lærte i data warehouse epoken, at mange data ikke ved et trylleslag skaber bedre beslutninger. Tre år gamle data er eksempelvis i mange tilfælde svære at drive værdi ud af, fordi verden hele tiden udvikler sig. Konteksten for data fordufter over tid, og dermed mister ”guldet” sin evne til at skinne.

Et godt princip er at bruge data tæt ved kilden og at eksperimentere med værdiskabelsen så hurtigt som muligt. Det kræver datadisciplin, og det kræver, at vi har holdning til værdien i data, så snart vi begynder at føde og fange dem. Vi oplever at virksomheder trækker data ud af de dataskabende systemer (hvor data jo i sagens natur har et formål og en kendt struktur og kontekst) og lægger dem i datasøerne med en forventning om kommende værdiskabelse. Men denne adfærd er også et udtryk for rådvildhed.

Ideen er flaskehalsen

Vi tror, at data er guld i sig selv, men det er jo faktisk kombinationen af en forretningsmæssig ide og dataunderstøttelsen, som skaber den værdifulde automatisering, innovation eller nye forretningsmæssige ide. Der kan sagtens være god mening i rå opsamling af data med henblik på identifikation af sammenhænge, som muligvis kan bruges i forretningsudvikling (altså bottom-up). Men ideerne og kompetencerne til at virkeliggøre en forbedring er faktisk en større flaskehals end data. Lad os tage udgangspunkt i den gode idé frem for ukritisk at fylde sumpen op.

Klimabevidsthed kommer til at bidrage til denne voksende private og professionelle datahygiejne.

Thomas Madsen, Leder af SAP Experience Center Copenhagen

 

Denne blog er oprindelig publiceret i Computerworld