Data integration er stadig det nye sort

Det er naivt at tro på komplet data integration. Vi må nødvendigvis skabe integrationen i takt med de forretningsmæssige behov, og så – naturligvis – fremover høste data så intelligent som overhovedet muligt.

I de sidste par år har jeg været fritaget for at arbejde på kundesager for at være leder af SAP Experience Center. Nu er hverdagen vendt delvist tilbage, og jeg har igen meldt mig på banen som en konsulentressource, der går med ud til kunderne.

Samtlige sager, som jeg har arbejdet på, har handlet om data integration. Slående. Virksomhederne har fortsat et stort behov for at samle og organisere data for at kunne aktivere dem. Uanset om data nu kommer fra egne applikationer, cloud, SAAS eller lignende.

Nye datatyper samme problem

Tilbage i forrige årtusinde var data integration det nye sort. For eksempel i visionen om et samlet ERP-system til at dække styringsbehovet i alle grene af virksomheden. Og nu viser det sig så at det nye sort stadig er data integration. Nu opstår integrationsbehovet måske mellem ERP-systemet og nye cloud-løsninger, sociale medier, webshop eller sensordata.

I forhold til business intelligence har vi snart i flere årtier arbejdet med data integration i data warehouse løsninger. Ekkoet af den filosofi støder man også på nogle steder, fordi mange it-afdelinger har som ambition at samle alle data ét sted i det komplette miljø, så man er klar til at servicere forretningen med snart sagt ethvert behov for data og analyse.

Sisyfos og data warehouse

Tal om Big Data. Data knopskyder. Antallet af datakilder vokser. Kompleksiteten stiger.

Jeg tror ikke på den komplette opsamling af data. Slet ikke bagudrettet. Dertil er hele feltet for dynamisk. For langt de fleste virksomheder vil det være dyrt og krævende at skabe integrationen uden at have et konkret behov. Ligesom fortidens langstrakte data warehouse projekter er det et Sisyfos-arbejde.

Man kan sammenligne det med personen, der flytter fra hus til lejlighed og opmagasinerer de overskydende fem kubikmeter bohave i et lagerhotel. I den tro at han vil få brug for sagerne ved lejlighed. Fem år senere og mange tusind kroner fattigere er der stadig ikke behov for tingene. Og udsigten til at datteren eller sønnen vil have interesse for de gamle bøger er også ganske lille.

Der er i mine øjne to tommelfingerregler at styre efter fremover.

Den ene handler om data centricitet. Data skal opsamles og organiseres i et miljø, som med det samme giver alle muligheder for at bruge dem til både operationel styring og til analyse. Hastighed og kvalitet i databaser eliminerer behovet for at skelne mellem dag-til-dag-styring på den ene side og ledelsesinformation og analyse på den anden. Det hele skal være real time. Data er den centrale ressource, som skal være klar til alle de applikationer, behov og analyser, som vi ikke har en jordisk chance for at kende på forhånd. Det er idealet.

Den anden handler om at overkomme kompleksiteten her og nu. Når man skal bygge data integration mellem separate data (fordi der nok altid er et stykke til idealtilstanden), så vent til behovet er klart og artikuleret. Selvfølgelig opstår der behov for at hente, transformere og loade data fra forskellige kilder fremover. Dette arbejde skal gøres, men det skal først gøres, når vi kan svare på, hvorfor vi gør det.

Thomas Madsen, Head of SAP Experience Center Copenhagen

 

Denne blog er oprindelig publiceret i Computerworld