drie personen waarvan de middelste wijst naar een dashboard weergegeven op een digi-board

Geef waarde aan gegevens in je data lake zonder kopje onder te gaan

Een los datapunt is niets waard. Zo’n datapunt krijgt pas waarde als het context heeft. Maar hoe geef je context aan eindeloze hoeveelheden onbewerkte gegevens in data lakes zonder kopje onder te gaan? Niels van der Kam legt het uit.

Data is het nieuwe goud, hoor je weleens. Toch is een datapunt of een dataset niet per definitie waardevol. Want wat die getallen of gegevens precies zeggen, wordt pas duidelijk als je ze voorziet van de juiste context. Als je de gegevens beziet in de business context waarin zij tot stand kwamen, komen ze tot leven. Op dat moment veranderen gewone gegevens in waardevolle informatie waar een organisatie iets mee kan.

Het belang van context wordt nog eens benadrukt als je bedenkt dat veel organisaties data verzamelen buiten hun bedrijfssysteem om. Naast de gestructureerde data in hun ERP-oplossing, produceren en verzamelen ze ook allerlei andere informatie. Denk bijvoorbeeld aan sensordata uit het track & trace systeem.

Goedkope opslag
Dergelijke gegevens worden over het algemeen opgeslagen in een data lake, een cloud platform ter ondersteuning van big data analytics. Azure Data Lake van Microsoft is daar een goed voorbeeld van. Ook geschikt voor het creëren van data lakes is Amazon S3, een platform dat je informatie op laat slaan in zogenaamde Buckets. Voor het bewaren van grote hoeveelheden ruwe data is dergelijke goedkope opslag een prima medium. Op het moment deze data geanalyseerd moet worden, wordt het lastiger. Dan ontstaat namelijk de noodzaak voor contextuele informatie.

Neem nou het eerdergenoemde track & trace systeem. Bij het verzenden van een pakketje wordt de zending voortdurend gescand. Elke scan zegt iets over de locatie waar een bepaalde barcode zich bevindt. Zonder de bijbehorende gegevens uit je bedrijfssystemen zijn die afzonderlijke scans zijn niets waard. Wanneer je de scans echter koppelt aan verzenddata, orderdata, klantgegevens en andere informatie uit je ERP-omgeving, krijgen die scans waarde. Dan ontstaat er immers een beeld van de precieze reis die een zending aflegt. Bovendien wordt het mogelijk om te berekenen wanneer het pakketje precies afgeleverd wordt.

Hoe breng je nou ál die gegevens op zo’n manier samen dat je ermee kunt gaan werken? Je zou ervoor kunnen kiezen om informatie uit je bedrijfssysteem te exporteren naar het data Lake. Als je de informatie uit je SAP omgeving haalt en samenvoegt met al die andere gegevens, zou je ermee kunnen gaan rekenen. Het is technisch zeker mogelijk. Toch is die oplossing niet ideaal. Want bij het exporteren van gegevens uit je bedrijfssysteem, gaan contextuele zaken zoals het onderliggende model, relaties, historie en generieke meta data niet mee. Daarmee verliest die informatie zijn waarde.

Daarom wordt de geëxporteerde data vaak opnieuw gestructureerd, opnieuw gefilterd en opnieuw geaggregeerd. Dat is echter een behoorlijk bewerkelijk en daarmee ook behoorlijk duur proces dat bovendien gevoelig is voor fouten. Het komt er in de basis op neer dat datgene wat SAP van nature meelevert, opnieuw opgebouwd wordt. Hoewel er scenario’s zijn waarin het exporteren van data uit een SAP landschap noodzakelijk is, is het in veel gevallen ongewenst en onnodig.

SAP BTP brengt alles samen
Gelukkig is er een oplossing: het SAP Business Technology Platform. Dit platform stelt organisaties in staat om alle noodzakelijke stappen te doorlopen om data – zowel SAP data als externe gegevens – te analyseren. Maar dan wel mét behoud van de oorspronkelijke business context. Door slim gebruik te maken van de mogelijkheden van SAP HANA, SAP Data Warehouse Cloud, SAP Data Intelligence en SAP Analytics Cloud wordt het mogelijk om volledige data-to-value ketens op te zetten. Zo’n keten zorgt er stap voor stap voor dat een datapunt daadwerkelijk waarde krijgt. Dat begint bij het verzamelen, combineren en analyseren van gegevens en wordt gevolgd door het verrijken, opslaan en inzetten ervan.

Meer weten?
Vind je dit interessante materie? Bekijk dan een korte impressie van onze Data to Value Day die plaatsvond op 20 april 2022. Of download de presentaties van die dag. Deze boeiende presentaties geven je onder meer inzicht in de datastrategieën van Philips Domestic Appliances en AkzoNobel. We zijn druk bezig met de organisatie van de volgende Data to Value Day. Wil je deze dag bijwonen? Laat het ons weten!