數據分析師
當下最火的互聯網職位,不少求職報告顯示
數據相關工作已經是互聯網公司內部最為高薪的崗位之一
例如:
國際人19屆應屆生薪資報告顯示
? 數據分析及算法類崗位的平均應屆生就業薪水是250000
? 互聯網產品經理是192640
? 運營是142000
本篇文章就跟大家聊聊什么是數據分析師,如何成為數據分析師。
一、SQL/Python是基礎,統計學知識應用是關鍵
數據分析工作流程可分為:數據獲取、儲存提取、預處理、建模與分析、可視化這五個流程,每個流程需要的知識技能在下圖已經標出。
總結:想成為數據分析師,你需要掌握
1 | Python基礎和爬蟲; |
2 | SQL語言; |
3 | 回歸分析; |
4 | Python科學計算包:pandas, numpy, scipy, scikit-learn; |
5 | 統計學基礎(獨立事件,貝葉斯,置信區間等基本概念); |
6 | 數據可視化工具seaborn和matplotlib; |
7 | 高級的數據分析師必須要懂得數據挖掘的基本算法例如分類聚類和特征提取。 |
2、 數據分析必須以業務驅動為根本目的
百度百科定義:
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。
數據分析拆成兩個詞
數據 & 分析
數據的關鍵點在于如何低成本獲得更精確,更及時,更多維度的數據;
分析的關鍵點在于如何讓這些數據通過處理加工產生價值。
而對企業來說:
只有對其實際業務經營有幫助的行為才可以產生價值,數據分析的好不好有沒有用,就在于其分析出的結論能否作為企業管理者為其業務經營做下一步行動規劃的依據。
也就是說:即便你學會了python和sql并不代表你能夠做好數據分析的崗位,你必須要對企業的經營業務有獨特的觀察視角才能夠讓你手中的數據發揮價值。
例如:啤酒與尿布的故事
20世紀90年代的沃爾瑪的超市管理人員分析銷售數據時發現了一個令人難于理解的現象:在某些特定的情況下,“啤酒”與“尿布”兩件看上去毫無關系的商品會經常出現在同一個購物籃中,這種獨特的銷售現象一般出現在年輕的父親身上。
在美國有嬰兒的家庭中,年輕的父親前去超市在購買尿布的同時,往往會順便為自己購買啤酒,這樣就會出現啤酒與尿布這兩件看上去不相干的商品經常會出現在同一個購物籃的現象。如果在賣場只能買到兩件商品之一,則他很有可能會放棄購物而到另一家商店。沃爾瑪發現了這一獨特的現象,開始在賣場嘗試將啤酒與尿布擺放在相同的區域甚至打包成套餐,從而獲得了很好的商品銷售收入。
這個故事里如果數據分析人員只看到了啤酒和尿片的銷量關聯但并沒有找出奶爸的行為是其根源,就不會讓這些數據產生價值,從而提升沃爾瑪的銷售收入。
所以,數據分析師需要數學統計專業學到概率統計的知識,也需要計算機專業學到的python,更需要市場營銷企業管理專業看待企業業務經營的獨特視角。所以這是一個需要多種領域技能的崗位,沒有人是專業對口的。
三、 面試知識點羅列
數據分析崗位面試考察的知識點主要有三大類,
1, 工具使用:excel,python,sql三大最基本工具的各項功能應用。
Excel 必須掌握vlookup,透視表,各種常見函數的應用和圖標制作,最經常問到的問題是,你在以前的實習中做過什么報表。
Python 一般會考核基本語法和數據分析包(numpy, pandas和matplotlib)的應用,能夠使用python操作結構化數據,做數據清洗,抽取和可視化。這些問題隨便找一本python的入門書籍都可以學到。
SQL 基本要求有會利用開源數據庫MySQL進行查詢,會分組,聚合和排序。在網上有很多SQL面試題筆試題合集,大家需要可以自行查閱。
當然基礎的工具還有SPSS,其實會用Excel想學SPSS分分鐘的事兒,就不多介紹了。
2, 理論知識:就是上面提到的統計概率基本知識,如果你會機器學習會加分。
面試官在面試中會直接問置信區間是更怕I型錯誤還是II型錯誤這種考察概念的問題。
機器學習的基本算法類如邏輯回歸,貝葉斯,決策樹,隨機森林,線性回歸,K-means等在大多數基礎數分崗位不是必須項,但掌握的越多越加分。
3, 業務知識是最大頭:如果對算法和數據分析的思維有很深的理解,能把其和業務需求實際結合起來,只用excel就能做絕大多數的數據分析。
常用的分析思維比如漏斗思維,分類思維,平衡思維,金字塔原理,ABtest等,多看一些案例。
面試官會經常問,我們公司接下來要新推出一款app,為了xx目的你會監測哪些運營指標,或者直接拿現在的運營數據讓你直接分析,并說出有價值的結論。
最后關于面試的細節要提醒大家,不同的公司業務部門以及不同的面試官關注的點是不一樣的。
例如:
數學統計學專業出身的面試官會著重與統計概率和建模的能力;
計算機專業出身或者之前做過產品運營職位的面試官會更看重SQL,Python甚至Hive等工具的使用。
被問到到不懂的知識點不要慌,上文說過這個崗位沒人是專業對口的,包括面試官都是轉行來干這個,你只要表達出自己快速學習能力即可。