<object id="3iwlw"><noframes id="3iwlw"></noframes></object>

      <th id="3iwlw"></th>

    1. <rp id="3iwlw"></rp>
      <rp id="3iwlw"></rp>

    2. <button id="3iwlw"></button>
      云計算·大數據 頻道

      “云、數、智”三位一體,大數據和機器學習融合帶來商業價值提升

        數字化時代,很多人都在提“數智融合”概念,“數”是指大數據,“智”是指AI、機器學習,最終實踐都是在云中進行。至于,為什么要進行數與智的融合?數智融合能為用戶帶來哪些價值?

        答案是,現代化業務環境需要重塑數據洞察力,而將數據(大數據技術)和智能(機器學習技術)進行融合和統一,可以打破數據孤島,實現商業價值提升!

        數據分析和機器學習融合面臨挑戰

        ▲亞馬遜云科技大中華區產品部總經理 陳曉建

        “圍繞數智融合構建和實施項目,可以讓數據在數與智之間無縫流轉,推動企業數字化轉型邁向更高階段?!痹趤嗰R遜云科技大中華區產品部總經理 陳曉建 看來,雖然數據已經成為企業最重要的資產,但數據價值并沒有充分利用,所以越來越多的企業希望成為數據驅動型組織,通過融合大數據和機器學習能力來提升業務產出。

        為了滿足業務發展需求,有越來越多的公司從組織架構層面進行調整,把原來分散在各個部門的機器學習實踐進行整合,并與大數據項目進行統一協調和資源配置。但現實情況是,僅依靠傳統的大數據技術,無法全方位提供充足的數據見解,需要機器學習的模型能力的補充。

        從戰略目標實現的角度看,如何通過技術創新實現數、智統一與融合目標?企業開始補充人員與技術的支撐!

        在人員能力層面,企業要求把原有大數據實踐者,或者掌握機器學習技術的人員,應用到大數據具體項目中去,或承接新的機器學習相關的項目需求;同時,機器學習從業者也要掌握大數據處理能力,要能更好、更便捷地完成模型所需的數據準備和加工。而在工具支撐層面,企業要面向大數據技術和機器學習構建統一的開發平臺和基礎技術能力,包括對已有大數據平臺進行改造,增加機器學習相關場景和能力,或是完全推倒,重新構建一個面向兩者的通用的平臺。

        撇開大數據和機器學習背后各種技術不談,只從用戶需求角度看,二者融合是必然發展趨勢。但從實際技術發展來看,大數據和機器學習其實走的是完全不同的道路。大數據技術的側重點在于怎么完成海量數據的采集、清洗、查詢等功能,但機器學習則更看重算法本身的優化。

        大體來看,大數據和機器學習融合存在三大挑戰:

        第一,數據和機器學習分而治之,數據及技術孤島制約敏捷迭代。

        第二,數據處理能力不足。在生產制造企業,希望通過機器學習幫助客戶對產品售后維修需求進行預測,由被動響應變為主動規劃。但由于不具備足夠的大數據處理能力,模型開發成功后 ,不能有效收集處理海量的運營數據,致使預測不準確,無法達到預期業務目標。

        第三,據分析人員參與度低。很多模型在實驗環節效果良好,但實際使用中卻不盡人意,這是因為實驗環境只是對真實環境的簡單模擬,生產環境要復雜得多,導致實驗模型無法應用于生產。

        如何滿足深度融合需求?亞馬遜云科技的觀點是,企業在云中要打造統一的數據基礎底座,實現大數據和機器學習的“雙劍合璧”,為企業發展提供創新引擎,這是實現數智融合最有效途徑。

        在云中構建統一的基礎底座

        亞馬遜云科技大中華區產品部技術專家團隊總監 王曉野 認為,在企業業務現代化進程中,需要的不是單一的產品,而是靈活、開放的架構。

        要想獲得可擴展、安全可靠的數據服務,構建可高效分析的數據分析引擎,以及通過更便利AI的工具,為企業提供極致的性能,必須采用有效的技術路徑。首先,要建立統一融合的治理底座,包括數據質量、數據權限、數據開發、數據工作流、可視化等能力。其次,在大數據和機器學習之間,好形成高效充分的雙向互動,互為支撐,互為因果,形成正向循環。

        具體而言,亞馬遜云科技“云、數、智三位一體”服務不僅滿足技術融合趨勢,還能帶來更多組合優勢。

        首先,構建云中統一的數據治理底座,打破數據及技能孤島。

        企業可采用Amazon Lake Formation推出的諸多新功能,實現數據網格跨部門的數據資產共享,以及基于單元格的最細粒度的權限控制機制。其中,Amazon SageMaker Studio可一站式地完成數據開發、模型開發及相關的生產任務,該服務基于多種專門構建的服務,如交互式查詢服務Amazon Athena、云上大數據平臺Amazon Elastic MapReduce (Amazon EMR)、云數據倉庫服務Amazon Redshift、Amazon SageMaker等,為大數據和機器學習提供統一的開發平臺。

        其次,由機器學習實驗轉為實踐,提供生產級別的數據處理能力。

        機器學習項目成功的關鍵是對復雜的數據進行加工和準備,亞馬遜云科技提供多種靈活可擴展、專門構建的大數據服務,幫助客戶把機器學習推向業務實踐中。

        其中,Amazon Athena能夠對支持多種開源框架的大數據平臺,包括Amazon EMR、高性能關系數據庫Amazon Aurora、NoSQL數據庫服務Amazon DynamoDB、Amazon Redshift等多種數據源,對這些數據源進行聯邦查詢,快速完成機器學習建模的數據加工。 以Amazon Redshift、Amazon Managed Streaming for Apache Kafka (Amazon MSK)和 Amazon EMR 為代表的無服務器分析能力,可以讓客戶無需配置、擴展或管理底層基礎設施,即可輕松地處理任何規模的數據,為機器學習項目提供兼具性能和成本效益的特征數據準備。

        其三,讓數據分析智能化,為業務創新賦能。

        亞馬遜云科技一直通過智能數據分析服務,賦能業務人員進行智能分析、模型效果驗證以及自主式創新。例如,在日常分析工具中集成機器學習模型預測能力,其中深度集成機器學習Amazon SageMaker模型預測能力的Amazon QuickSight 、在分析結果中添加基于模型預測的Amazon Athena ML,可幫助用戶使用熟悉的技術,甚至通過自然語言來使用機器學習。

        亞馬遜云科技還提供如Amazon Redshift ML、可視數據準備工具Amazon Glue DataBrew、零代碼化的機器學習模型工具 Amazon SageMaker Canvas等服務,讓業務人員探索機器學習建模。

        所謂“授人以魚,不如授人以漁”,亞馬遜云科技通過技術、產品和方案的不斷創新,以及更專業化的服務,助推更多企業成為數據驅動型組織。亞馬遜云科技擁有面向快速算法原型的數據實驗室的應用科學家,面向生產精度模型指導的機器學習解決方案實驗室,以及提供端到端咨詢及交付的專業服務團隊,并把與大數據分析和機器學習相關的所有專家結合在一起,全面探索和應對機器學習與大數據融合帶來的挑戰。

      0
      相關文章
        漂亮的苏酥全文阅读