所有部落格

推動資料探索與可靠性,提供更佳的業務決策能力

Liam Yu
Senior Product Solutions Marketing Manager, Integrated Systems

2023 年 9 月 25 日


現代企業正淹沒在大量的資料中。結構化、半結構化及非結構化資料,對以資料為導向的現代企業來說,是其核心資產。這些資料無處不在且呈爆炸式增長。然而,對於希望將資料轉化為可操作資訊以推動業務成功的企業而言,也構成了一項重大挑戰。

龐大的資料量挑戰企業在業務決策中尋找可信賴資料的能力。傳統的資料目錄僅限於結構化資料的探索,無法涵蓋所有資料型別。缺乏端對端解決方案,企業難以全面探索和管理所有資料型別的可靠性。

我們需要的解決方案必須整合資料挑戰的三個關鍵要素:資料探索、資料可觀察性和資料可靠性。

這三個要素也越來越符合企業的需求,幫助企業運用資料來提升工作績效、做出正確的商業決策,並從現有資料中獲取價值。

資料探索

無論資料存在於 PDF 文件、Word 文件、關聯式資料庫、記錄檔,或是來自電腦記錄的遙測數據中,一般企業通常都擁有大量資料。根據最近的一項研究opens in a new tab,企業儲存的總資料量約為 10 PB(相當於超過 230 億個檔案),其中超過一半(52%)被視為暗資料,即這些資料未被賦予任何實際用途或價值。

造成如此大量未分類資料的原因很簡單:在日常營運中,企業內部很難找到足夠的時間讓員工去深入了解資料對企業的實際價值。資料的收集與整合通常需要手動從多個來源、格式、系統供應商及不同地點擷取,並跨越多重雲端與邊緣架構進行處理。

資料探索的概念可視為讀取或分析資料的過程。新的人工智慧和機器學習軟體工具,例如 Pentaho Data Catalog,能夠幫助企業自動化資料檔案的分類、標籤和管理,從而了解資料的品質。這些工具不僅能夠幫助企業掌握資料的內容,還能夠生成有關資料或其詮釋資料的深入見解。例如,資料可以顯示某人在醫院病歷中被提及的次數,或者找出客戶財務記錄中「利率」一詞的出現頻率。

這對於想要判斷哪些資料對企業有價值、能正面影響客戶成果或促進更佳業務流程的企業而言非常重要。只有將資料探索過程自動化,企業才能邁出第一步,掌握資料的深入見解。

資料可觀察性

成功資料策略的第二大支柱是確保資料對企業使用者而言既可見又具意義。資料可觀察性可監控整個企業的資料使用狀況。監控對於回答以下問題非常重要:誰在使用資料?資料的來源是什麼?資料是否被修改過?如果有變更,變更的時間、地點、原因及修改者是誰?

資料可觀察性為企業提供追蹤與記錄每個資料檔案、文件或記錄的功能。藉由這些資訊,企業能夠建立正常行為的基準,這對於保護企業免受網路攻擊非常重要,使企業能夠更輕易地識別出具有潛在威脅的異常或不尋常行為。

資料的可觀察性也使企業能夠識別出自收集以來從未被使用或消耗的資料。這些「黑暗」或「死亡」資料可能對企業而言毫無價值,企業可決定是否將未使用的資料移至成本較低的儲存媒體,或進行歸檔或淘汰。最終,資料的可觀察性使企業能夠瞭解資料在日常營運中的實際使用情況,幫助企業即時監控資料,並靈活調整業務流程,甚至促進永續性目標的達成。

資料可靠性

成功資料策略的第三個支柱是判斷資料是否可靠。資料是否足夠可信,以支援關鍵任務決策?資料的可靠性則依賴於策略的其他兩大支柱來實現:

  • 資料探索:了解資料內容的自動化。
  • 資料可觀察性:監控整個企業的使用狀況。
  • 資料可靠性:資料的來源是什麼?品質是否達標且準確?我是否信任該資料的提供者?是否有被他人更改的跡象?端到端流程是否保持一致性?

單一版本的真相

建立在這三大支柱基礎上的資料策略,使企業能有效運用所掌握的資料,從而提升業務營運效率、改善決策過程,並推動企業內部的人工智慧輔助自動化。

關鍵的第一步是啟動資料探索的自動化。企業只有透過自動化的資料探索,才能挖掘所有資料中的智慧。這一過程透過確保使用正確且最精確的資料版本,幫助建立單一的真實資料版本。企業將能夠信賴並依賴這些資料,為更佳的業務決策提供支持,並推動未來的業務成功。

Liam Yu 是 Hitachi Vantara 資料管理部門資深產品行銷經理。