投稿入口|熱門專題|網站地圖|移動官網|微信編輯器|螞蟻搜索
您的當前位置:網站首頁 > 網站分析 > 數據分析 > 正文

數據科學家、數據工程師、數據分析師,有啥不一樣?

來源:未知 編輯:狂奔小螞蟻 時間:2016-01-29 12:04:04 閱讀:
  與其他一些相關工程職位一樣,數據科學家的影響力與互聯網同進同退。數據工程師和數據分析師與數據科學家攜手共同完成這幅“大數據時代”巨作。他們共同努力擬定數據平臺要求,基礎和高級算法,提供數據分析和展示所需的可視化工具,并將價值創造以易于理解,富于見解的方式反饋給其他部門。
  三者之間的定義又是如何界定的呢?
  數據科學家是什么樣一個存在呢?
  通常情況下,數據科學家有數學或物理方面的高等學位。有博士學位的情況并不少見,碩士學位僅是一個前提條件。數據科學家精通統計建模以及如何構建與定制高級數學算法。這既在他們專業范圍內,也是他們所擅長的地方。我聽到過有人這樣形容一個數據科學家“ 軟件工程技能牛過多數人的酷炫統計學家”。但是,當你問這些數據科學家怎么會從事這個職業時,途徑是多種多樣的。這是一個相對較新的職位,因而我們也無法根據時間歷史來追蹤一個數據科學家專業技能是如何進步的。數據科學家和數據工程師的定義有點相互重疊。
  除了研究先進算法,數據科學家對AB測試親力親為并且擁有博學的多變量測試和實驗設計知識。一個專業能力非常強的數據科學家能在模型建成后對其進行改進和改制,而能力鶴立雞群的數據科學家則能根據你的商業問題定制合適模型。
  我結合加工的說:所謂數據科學家,是指運用統計分析、機器學習、分布式處理等技術,從大量數據中提取出對業務有意義的信息,以易懂的形式傳達給決策者,并創造出新的數據運用服務的人才。
  數據工程師如何定義呢?
  數據工程師一般被定義成“深刻理解統計學科的明星軟件工程師”。如果你正為一個商業問題煩惱,那么你需要一個數據工程師。這些伙計就是那些能提供可建模數據所需平臺的人。他們的核心價值在于他們借由清晰數據創建數據管道的能力。充分了解文件系統,分布式計算與數據庫是成為一位優秀數據工程師的必要技能。
  數據工程師對演算法有相當好的理解。因此,數據工程師理應能運行基本數據模型。商業需求的高端化催生了演算高度復雜化的需求。很多時候,這些需求超過了數據工程師掌握知識范圍,這個時候你就需要打電話尋求數據科學家的幫助。
  數據分析師如何理解呢?
  數據分析師能洞悉一個方程式的商業意義。他們知道如何提出正確的問題,非常善于數據分析,數據可視化和數據呈現。不管是給另一個數據分析師還是C級執行做演講,數據分析師都是數據提取,模式識別以及從大量數據中洞察問題方面的能手。
  如果你或者你的公司正考慮順應這股大數據浪潮的發展,你應該從明確你想利用大數據解決所面臨的商業問題處下手。接著找出你真正的需求:是數據采集,檢索,倉儲還是數據分析?然后編寫相應的職位描述并做好準備,為了在這場大數據游戲中脫穎而出,你可能需要雇傭不止一個人。
  從事這三者都要具備哪些技能呢?
  數據科學家所需的技能
  計算機科學
  一般來說,數據科學家大多要求具備編程、計算機科學相關的專業背景。簡單來說,就是對處理大數據所必需的Hadoop、Mahout等大規模并行處理技術與機器學習相關的技能。
  數學、統計、數據挖掘等
  除了數學、統計方面的素養之外,還需要具備使用SPSS、SAS等主流統計分析軟件的技能。其中,面向統計分析的開源編程語言及其運行環境“R”最近備受矚目。R的強項不僅在于其包含了豐富的統計分析庫,而且具備將結果進行可視化的高品質圖表生成功能,并可以通過簡單的命令來運行。此外,它還具備稱為CRAN(The Comprehensive R Archive Network)的包擴展機制,通過導入擴展包就可以使用標準狀態下所不支持的函數和數據集。
  數據可視化(Visualization)
  信息的質量很大程度上依賴于其表達方式。對數字羅列所組成的數據中所包含的意義進行分析,開發Web原型,使用外部API將圖表、地圖、Dashboard等其他服務統一起來,從而使分析結果可視化,這是對于數據科學家來說十分重要的技能之一。
  數據工程師需具備的技能
  數學及統計學相關的背景

圖文精選:

Copyright?2012-2030小螞蟻信息網版權所有 站長QQ:1614558876 粵ICP備14061018號-1


鄭重聲明:本網站資源、信息來源于網絡,完全免費共享,僅供學習和研究使用,版權和著作權歸原作者所有,如有不愿意被轉載的情況,請通知我們QQ1614558876刪除已轉載的信息。

知道創宇云安全
Top 韩国2分彩全天计划