【專家觀點】建構虛實整合的混合雲數據平台,提升智慧企業核心價值

建構虛實整合的混合雲數據平台,提升智慧企業核心價值

SAP 平台解決方案總監向質彬撰稿


企業核心數據價值最大化

現今的企業正處於一個高度競爭和全球環境迅速變革的時代,疫情對工作方式造成的改變,以及地區的衝突對原物料與供應鏈造成的衝擊,讓以往企業的營運模式必須進行數位轉型,當企業將核心系統轉化為「數位核心」,透過對運營數字化並利用雲端技術優化服務時,企業將會以新的方式來連接、協作,並簡化未來的業務增長戰略,像是開發新產品和服務,提高獲利能力,多渠道加強營收,或是吸引和留住新的潛在客戶和客戶等等,而這一切都會因為大數據與人工智慧等創新技術來提供數據驅動(data driven)來支持上述智慧轉型情境。

企業核心「ERP」系統上的數據是非常有價值的,新一代的ERP 將運營公司所需的所有核心流程(如財務、客戶、產品、製造和供應鏈等) 都協同作業在該企業核心系統,因此如何能將ERP 數據價值最大化,如何透過數據說話來優化營運流程,如何透過敏捷營運快速因應市場變化,這都會是企業高階經理人感興趣的課題,也因此各行各業都需要開始「數據驅動化」,並且將其轉化為優化營運場景與營運洞察來支持企業數位轉型之路。

雖然「數據驅動」隨著大數據(Big data)、物聯網(IoT)、AI 人工智慧、機器學習(Machine Learning) 等技術逐漸成熟,已是時勢所趨,透過新一代的ERP 系統結合進階分析,企業可以隨時查詢即時數據並透過強大的分析演算法,從而在當下做出最佳決策,但是其中最大的問題就是傳統的數據平台已經無法跟上時代的腳步。

試想一下:您的營運與財務數據在雲端ERP、客戶與銷售的數據在雲端CRM、但生產的MES系統在地端主機,與此同時生產設備的物聯網大數據正以TB等級成長,而您傳統的資料倉儲系統還是花幾個小時,才能把不同的雲、地數據來源一個一個儲存到資料倉儲資料庫,再花幾個小時將儲存的數據進行建模與數據轉換,這樣子的數據平台是沒有辦法做到「即時」與「敏捷分析」,更別提以現在的企業都需要「以快打慢」,立即因應市場的變化。

Data Fabric 與數據虛擬架構

國際研調機構Gartner 發現在大數據與Data Lake的時代,傳統的數據平台必須要與時俱進,因此提出了下一代的數據平台架構 「Data Fabric」。那什麼是 Data Fabric 呢?

從Gartner的說明「Data fabric democratizes data access across the enterprise, at scale. It is a single, unified architecture」,進一步的來說,Data Fabric 結合了關鍵數據管理技術,例如數據目錄(data catalog)、數據治理(data governance) 與Metadata管理、數據整合 (data integration)、數據管道 (data pipelining)和數據編排(data orchestration),其目地透過Data Fabric 架構平台可以在正確的時間(Right Time)、以正確的方法(right method) 向正確的數據消費者 (right data consumer) 提供整合的數據 — 以支持運營和分析工作負載。Data Fabric 為什麼可以提升智慧企業的核心價值呢?我們可以從三大面向來思考:

  • 驅動創新業務

透過可靠、快速的將數據傳輸到數據湖 (Data Lake)和資料倉儲 (Data Warehouse),可以讓企業更快地獲得洞察和決策,舉例來說,Data Fabric數據平台可以為企業高階決策者提供「即時」的360 度戰情室,例如零售業營運長可即時看到客戶、理賠、訂單、設備或零售店的重大KPI指標,以實現微細分、減少客戶流失、警告運營風險或提供個性化的客戶服務。

試想一下,萬一這些數據存在於現行的legacy systems,這些數據要怎麼整合呢? Data Fabric 架構建議可透過數據虛擬化「Data Virtualization」技術來完成(後面文章會提到Data Virtualization)。

  • 驅動組織敏捷

您一定聽過這個故事:為了透過機器學習來協助企業工作,資料科學家往往要從不同的部門取得來源數據,而且在建模時都需要和 Business User大量溝通,可是這樣子的數據工程造成效率低落,最後公司花大錢請的資料科學家們都沒有辦法即時提供該有的成效。

您一定也聽過另外一個故事,ERP相關的財務人員為了提供老闆更有價值的洞察報告,需要匯整ERP Finance Data 與工廠的生廠數據,如果找IT 的人來幫忙整合數據並且產出報表,IT 的人光是要把 ERP 的財務資料建模,再匯整工廠的生產數據就要花很多時間,所以財務部門甘脆就養了自己的「小IT」,來滿足自身部門的需求,如此一下,企業將會有很多的「小IT」而且數據重複和分散的問題就更嚴重了。

Data Fabric資料架構提供了「Data Hub」和「Metadata」的功能,資料科學家師和數據消費者之間有共享的通用語言改善了數據和業務團隊之間的協作。簡單的來說,過去的數據建模都是以「資訊人員」的角度,而現在Data Fabric 非常重視從 Business User也應該要有相對應的 Business Data Model與之對應的 Metadata 元數據,而且透過 Data Fabric 架構平台還可以對業務使用者提供「自助數據存取」功能,讓數據消費者可以在需要時獲取他們需要的數據,從而提高業務敏捷性和速度。

  • 驅動數據優化管理

現行的資料平台都是「你要什麼數據我再想辦法建新的Data Mart」,這是一種疊床架屋的做法,現在的市場變化之大,等到數據花大量時間準備數據,然後發現市場又發生新的變化,傳統準備數據的方法已經不切實際。

Data Fabric 希望資料科學家、數據工程師和其他 IT 資源免於執行繁瑣的重複數據轉換、清理和豐富任務,所以Data Fabric 架構平台可以任何數據交付方法來存取企業數據,除了傳統的批量數據處理 (ETL),更要考慮數據虛擬化(Data Virtualization)、變更數據捕獲(Change Data Capture)和敏捷建模(Agile Data Model)。

SAP 客戶案例與 Data Virtualization/Federation 技術分享

  • 保時捷(Porsche 客戶案例背景

保時捷致力於以「the most intelligent way possible (盡可能以最智能的方式)」將性能轉化為成功。這種創新的動力可以從該公司在全球銷售的高性能汽車中看出, 而其中數據是保時捷智慧創新使命的重要組成部分。

然而在過去,保時捷公司不同的業務線和地區都有自己的數據解決方案。由於數據由個人卸載和上傳,IT 部門經常會被蒙在鼓裡。這導致了報告治理的缺失。

另一個問題是保時捷有 600 多家經銷商網絡,用傳統的方法來取得這些銷售數據非常耗時。保時捷嚴重依賴從多個不同系統來源提取數據,然後將數據插入電子表格以尋找洞察力。這種手動過程意味著準備銷售會議可能需要數天時間,並且會減慢交易的完成速度。

  • 保時捷的解決之道

保時捷使用新的數據架構「混合數據倉庫和分析轉換數據」 ,透過建立數據虛擬層來連接所有 SAP和非 SAP的系統並敏捷化數據建模流程(Agile Data Model),而他們採取的方案就是SAP Data Warehouse Cloud SAP Analytics Cloud

  • 導入的成效

透過新一代的混合數據倉儲使保時捷的員工能夠在安全且受管控的環境中連接和建模數據。從銷售部門開始,IT 管理員授予對 Spaces 功能的訪問權限。在這裡,用戶可以通過虛擬化試驗數據 並跨空間共享模型,讓 IT 知道原始數據是安全的。

透過使用 SAP Analytics Cloud 設置可視化儀表板,保時捷的經銷商可以即時查看銷售數據、潛在客戶信息以及細粒度的管道中的內容。經銷商可以快速提取並了解與他們相關的數據,而銷售主管則可以更廣泛地了解銷售趨勢。所有這些都將銷售會議的準備時間從幾天縮短到幾個小時。

這些儀表板也對日常運營產生了影響。現在,銷售人員可以在早上第一件事就是檢查儀表板,以實時了解需要完成的工作。隨著該項目的成功,SAP Analytics Cloud 現在在整個組織中使用,從客戶關係到控制再到人力資源等部門的 3,000 名用戶。

 


圖說/更多保時捷成功案例說明,請造訪 SAP 網站:https://www.sap.com/taiwan/about/customer-stories/porsche.html

 

  • 保時捷成功的關鍵技術數據虛擬化與敏捷開發

保時捷擴展統一數據管理和分析的力量,其關鍵就在於Data Virtualization(數據虛擬化) ,Data Virtualization與傳統的 ETL 數據倉儲模型不同,數據虛擬層避免了「搬移和複製」數據的需要,相反的,數據虛擬層的資料模型是在許多分散的數據源之間的虛擬層中定義的。

這允許使用者在需要的時「抽像化」所需要的數據,從而確保它是即時或接近即時的資料分析,而不是他們從 ETL 工具取靜態數據。隨著數據量的不斷增長,「資料搬移和複製」模型變得越來越昂貴,並且隨著數據變得越來越分散,使用數據虛擬化成為現代高性能數據架構的明顯選擇。

SAP 在資料平台上持續創新,其相關的企業智慧套件(例如 ERP、CRM、Data Warehouse等等)都是其於 SAP HANA 資料平台,而SAP HANA 資料平台內含了資料庫管理、資料整合、敏捷資料建模等功能,透過SAP HANA可以建立虛擬表(virtual table)映射到遠端資料來源,進而透過虛擬表來存取遠端資料來源中的資料。

除此之外,SAP HANA 也提供了創新的「Calculation View」敏捷資料建模 , 對於從不同的資料來源,藉由使用虛擬表與實體資料建置即時的資料模型,資料不需二次加工而且不落地就可透過 in-memory 的運算提供最即時的分析結果。


圖說/
SAP HANA Smart Data Access 可對遠端資料來源像是OracleMS SQL ServerHadoop大數據等建立虛擬表,並且透過 SAP HANA Calculation View 進行虛實資料建模,提供記憶體運算的高效能分析。

 

另外就是現在很多企業需要更快速的建置雲端資料倉儲,並且打造即時分析的 Data Lake,SAP 基於 SAP HANA 的技術,為企業提供了更容易使用的 SAP Data Warehouse Cloud (簡稱 SAP DWC)。簡單的說,SAP DWC 資料倉儲雲是一個專為企業和 IT 設計的「資料倉儲即服務」雲端解決方案,其功能包含資料整合與連接、資料儲存、資料分析建模,過去企業在建立Data Fabric 數據分析架構所需的工具都直接統合在SAP DWC 產品功能之中。

  • 雲端架構的彈性擴充自助服務功能,可依照企業的需求調整規模,靈活配置資料倉儲雲端資源,降低營運成本與管理成本
  • 內建多個不同Connection Adapter取得來源資料,可以快速連接 SAP 與非 SAP系統(例如Oracle、MS SQL、Hadoop、AWS等資料來源),而且還可以地端的SAP 資料倉儲模型轉換為雲端的 DWC 資料模型
  • 結合商業語意層,轉換複雜的資料語言,讓 Business User 也非常容易閱讀,一看就懂
  • 靈活擴展的開放式架構,資料來源可彈性定義為虛擬化或是實體數據
  • 提供更容易的虛實數據建模圖型工具


圖說/
SAP DWC 內含多個資料來源 Connection,包含雲端的Azure Data Lake StoreAWS Athena、或是Google BigQuery等主流雲端大數據來源。


結論

企業在數位轉型的過程中,透過「數據驅動」智慧企業核心價值一直是企業重中之重,SAP DWC 是SAP 雲數據分析平台並且提供多來源業務語意服務,該解決方案不但提供跨企業的資料模型化、連線、虛擬化和存取,並且最棒的是,商務使用者(Business User)也可以在SAP DWC上探索資料、整合新資訊和共用洞察,讓企業規劃新一代的數據分析平台在可以不浪費現有投資情況下,在雲端中創新。


歡迎您與我們聯繫