(2018) 資料科學線上課程總彙 – 資料科學數學基本功

%e8%a1%a8%e6%a0%bc123

最近有位讀者透過粉專私訊詢問:

讀了一篇你寫的資料科學三個面向,覺得自己在資料科學領域對 ‘解釋’ 最有興趣,由於目前所學多半著重在 Machine Learning Algorithms ,雖然上過初統但要解釋時卻還覺得自己的了解有點模糊,想請教你在這一塊有沒有推薦的課程呢?

突然發現,資料科學領域線上課程大彙整(全部免費) 是一年半前的文章了!在這段時間,我也看了不少新課程,也有一些課程已經沒有在開課了,所以我決定來更新一下課程分享。我會陸續更新以下幾個主題的課程分享:

  • 資料科學基本功(數學、機率、統計等)篇
  • 解釋性建模(實驗設計、問卷調查、迴歸分析、機率圖模型等)篇
  • 機器學習(機器學習、深度學習、增強學習、相關應用)篇

裡面可能有些課程是以前推薦過的,有些課程是我新發現的(不一定已經開課/我完全看完),分享給大家參考!其實解釋性建模跟機器學習都在半年前好了,這篇文章卻拖了好久… (跪)!

 

Btw, 由於大鼻的程式設計都是在學校學的(我有修過:程式設計、資料結構、演算法,還有一些有的沒的像是寫 app),或是在專案中現學現賣,所以好像不知道怎麼推薦。如果有同學有推薦的程式設計課程,可以幫忙寫一篇推薦文!

 

微積分與線性代數

 

在資料科學的領域,微積分跟線性代數可說是不可或缺的工具!在許多估計方法(如:最大概似法 Maximum Likelihood Estimation、最小平方法 Least Square Estimation 等),或是機器學習的方法(如:梯度下降法 Gradient Descent、反向傳播法 Backpropagation)等等,都會用到大量的微積分與矩陣運算。因此,微積分跟線性代數可說是一定要會的數學工具!

 

微積分 (非理工科) (台大 翁秉仁)

  • 連結:http://ocw.aca.ntu.edu.tw/ntu-ocw/ocw/cou/103S121/
  • 推薦度:4 顆星 / 5 顆星
  • 難易度:大一等級
  • 預先知識:高中數學
  • 說明:如果你已經是社會人士,離這些數學已經非常遙遠,我覺得翁老師這門課其實就會 cover 到大部分常用的方法了,適合給沒有時間想要速成微積分的朋友們學習。

 

微積分一、二 (清大 高淑蓉 教授)

  • 連結:(一) http://ocw.nthu.edu.tw/ocw/index.php?page=course&cid=7 (二) http://ocw.nthu.edu.tw/ocw/index.php?page=course&cid=34
  • 推薦度:4 顆星 / 5 顆星
  • 難易度:大一等級
  • 預先知識:高中數學
  • 說明:這是大鼻當初在學微積分時看得向上課程(遙遠的大一阿 QAQ)雖然高老師當人都是 50% 起跳,而且我大二還莫名被他嗆過(根本沒修過他的課 XD)但高老師的微積分教得很棒,從觀念的建立到定理的證明都很有力,尤其是在建立高維度空間的觀念非常清楚易懂,缺點是應用跟計算著墨的比較少,比較適合對數學證明有興趣的同學修。

 

線性代數 (交大 巫木誠 教授)

  • 連結:http://ocw.nctu.edu.tw/course_detail.php?bgid=3&nid=50#.WCcJ07J97IU
  • 推薦度:5 顆星 / 5 顆星
  • 難易度:大一等級
  • 預先知識:高中數學
  • 說明:這門課程就是線性代數的基本觀念及相關定理與運算,算是比較計算與應用的課程,作為對理論不大有興趣的人這門課程算滿不錯的,而且老師講得很簡單易懂,很適合初學者!

 

線性代數一、二 (交大 莊重 教授)

  • 連結:http://ocw.nctu.edu.tw/course_detail.php?bgid=3&nid=50#.WCcJ07J97IU
  • 推薦度:3.5 顆星 / 5 顆星
  • 難易度:大一等級
  • 預先知識:高中數學
  • 說明:如果大家想要學理論一點的線性代數 (尤其是你需要做機器學習或統計的研究),那我個人會建議大家修莊重老師的線性代數,我個人很喜歡這門課的課本,寫得滿難的,但內容很豐富,對於向量空間的描述也很清楚。其實資料分析中對於空間的掌握是滿重要的,畢竟很多資料都是可以用空間的想法去做分析的!

 

機率論與數理統計

 

機率與統計可以說是資料科學的基礎,就算你是純做機器學習,還是逃不掉的,比如說:機器學習的理論基礎、很多機器學習的估計方法等,都是建立在機率與數統上的。在這裡大鼻推薦以下的課程給大家學習:

 

機率論 (清大 鄭少為老師)

  • 課程連結:http://www.stat.nthu.edu.tw/~swcheng/Teaching/math2810/index.html
  • 推薦度:5 顆星 / 5 顆星
  • 難易度:大二等級
  • 預先知識:微積分
  • 說明:鄭少為老師真的教的非常非常非常的好!會讓你很系統性、觀念很清楚地學完大學部的機率論,包含:機率分佈、期望值、一些收斂定理等。如果之後想要學更高深的統計跟機器學習方法,我覺得這門課算是必修吧!要注意的是,這是一門需要微積分基礎的機率論課程,建議要熟悉微分、積分、求極大極小值再來上課!

 

Probability (Prof. Joe Blitzstein, Havard University)

  • 課程連結:http://projects.iq.harvard.edu/stat110/home
  • 推薦度:4 顆星 / 5 顆星
  • 難易度:大二等級
  • 預先知識:微積分
  • 說明:會知道這門課,其實是之前曾經接到一個生意,要寫這個課程的期末考考卷。跟鄭老師的課程比起來,這門課程更強調「隨機思考」−如何針對一個隨機實驗 / 事件做機率分析。這堂課的缺點是:架構稍微零散一些,內容的連貫性稍微差了一些。

 

統計學 (清大 鄭少為老師)

  • 課程連結:http://www.stat.nthu.edu.tw/~swcheng/Teaching/math2820/index.html
  • 推薦度:5 顆星 / 5 顆星
  • 難易度:大三等級
  • 預先知識:微積分、機率論
  • 說明:鄭少為老師真的教的非常非常非常的好!(再說一次 XD) 這門課程雖然叫做統計學,但其實是數理統計/高等統計學的難度。我很喜歡點估計與假設檢定的部分,觀念分常清楚扎實,而且還有講到貝氏!唯一的缺點是,我不大喜歡這本課本的符號表達。

 

總結,其實沒什麼好總結的

 

之前有人問大鼻是不是都把這些課程看完了,of course not!我平常也是有工作和個人生活的,不是整天都在專研這些知識 XD 通常我是挑一門課中幾個有興趣的主題看,除非我對於這個領域完全不熟悉才會一堂一堂看!

 

有關 David’s Perspective 的最新文章,都會發布在大鼻的 Facebook 粉絲專頁,如果你喜歡大鼻的文章,還請您不吝嗇地按讚或留言給我喔!

大鼻觀點:https://www.facebook.com/davidperspective/

About David Huang

外商科技公司資深資料科學家,前外商公司分析顧問,國立臺灣大學統計碩士,喜愛運用資料科學解決複雜的商業問題,改善商業決策的品質。過去的專案經歷包括:客戶分群、消費者終生價值預測、市場實驗學習與測試、新產品上市測試、推薦系統、使用者觀看行為預測、聊天機器人機器學習開發、文字探勘與產品分析、企業儀表板建立等。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *