┊文章閱讀:次
最近經(jīng)常被問到怎么入門數(shù)據(jù)分析,可能很多同學(xué)對怎么開始學(xué)習(xí)還是比較困惑的。我回想自己學(xué)習(xí)數(shù)據(jù)分析的經(jīng)歷,總結(jié)了一些建議,希望能給到大家?guī)椭?/p>
打好概率與統(tǒng)計的基礎(chǔ)
概率與統(tǒng)計是數(shù)據(jù)分析的基石,像一些概率分布、抽樣、線性回歸、時間序列都是數(shù)據(jù)分析當(dāng)中經(jīng)常會用到的,可以說日常碰到的大部分的分析需求都可以用統(tǒng)計分析來解決。
理工科專業(yè)的同學(xué)大多在本科期間就學(xué)過概率與統(tǒng)計這門課,這部分的基礎(chǔ)應(yīng)該還是比較扎實的。對于沒有基礎(chǔ)的同學(xué),有一本叫《深入淺出統(tǒng)計學(xué)》的書非常值得一讀,豆瓣上的評分8.5分
這本書非常通俗易懂,講理論知識的時候結(jié)合了很多案例,把統(tǒng)計學(xué)應(yīng)用到解決實際問題當(dāng)中,讓原本枯燥的統(tǒng)計學(xué)原理變得有趣起來,適合非專業(yè)人士入門學(xué)習(xí)。
掌握數(shù)據(jù)庫技能
做數(shù)據(jù)分析離不開查詢數(shù)據(jù)庫,這里主要涉及的是SQL。對于傳統(tǒng)的數(shù)據(jù)庫如MySQL,SQL Server,Oracle,或者大數(shù)據(jù)平臺Hadoop,都可以通過SQL查詢的方式來獲取數(shù)據(jù)。入門SQL的書推薦一本《MySQL必知必會》,豆瓣評分8.4分。
這本書實踐性很強(qiáng),教你怎么用SQL語句操作MySQL??梢宰约涸陔娔X上裝一個MySQL,跟著書中的案例操作一遍。
掌握Python或者R
Python和R是數(shù)據(jù)分析當(dāng)中最常用的兩門語言。R是為數(shù)據(jù)分析而生的一門語言,但Python在數(shù)據(jù)分析方面有后來居上的趨勢。公司里的數(shù)據(jù)科學(xué)團(tuán)隊在幾年前還是用R做的分析,最近一年已經(jīng)轉(zhuǎn)向Python了,身邊的朋友也聽到很多R轉(zhuǎn)Python的。性能上來說,Python的速度更快,可以處理上G的數(shù)據(jù),而R不行。所以長遠(yuǎn)來說,我還是看好Python的。
講Python基礎(chǔ)的有一本《A byte of Python》非常推薦,我當(dāng)初就是看這本書入門的,讀起來很輕松,兩三天就可以讀完。網(wǎng)上已經(jīng)有人把這本書翻成中文,地址在這兒:https://bop.mol.uno/
數(shù)據(jù)分析相關(guān)的,推薦這本《利用Python進(jìn)行數(shù)據(jù)分析》,豆瓣評分8.5分。
作者是廣受好評的pandas庫的開發(fā)者。讀完這本書,可以對用Python做數(shù)據(jù)分析涉及到的一些工具、怎樣用pandas、怎樣做數(shù)據(jù)可視化有比較詳盡的了解。
Copyright @ 2013-2018 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。