資料科學領域線上課程大彙整(全部免費)

表格123

因為之前寫的「如何成為資料科學家」大哉問 1:當資料科學家數學是不是要很好?頗受好評,大概是我的部落格文章中點擊率最高,觸及人數最多的人一篇,大家都很需要線上學習資源,因此我決定來跟大家說,怎麼樣一毛錢不花,全部看免費的,把很多資料科學家的知識補齊!當然,實務經驗是比較難在課程中學會的,因此這邊文章的課程只能幫大家補足學術上的知識。 (如果想花錢學,大家可以匯100萬台幣給我,我會把這篇文章製作精美的pdf檔寄給您 XD)

 

微積分與線性代數

 

 

  • 初階課程 (難易度:2星,推薦度:5星)
    線性代數 (交大 巫木誠 教授)
    http://ocw.nctu.edu.tw/course_detail.php?bgid=3&nid=50#.WCcJ07J97IU
    這門課程就是線性代數的基本觀念及相關定理與運算,算是比較計算與應用的課程,作為對理論不大有興趣的人這門課程算滿不錯的,而且老師講得很簡單易懂,很適合初學者!

 

 

機率論

 

  • 中階課程 (難易度:3.5 星,推薦度:5星)
    機率論 (清大 鄭少為老師)
    http://www.stat.nthu.edu.tw/~swcheng/Teaching/math2810/index.html
    鄭少為老師真的教的非常非常非常的好!會讓你很系統性、觀念很清楚地學完大學部的機率論,當然這不算是一門簡單的課程,需要一定的微積分基礎。儘管我沒上過鄭老師現場的課程,但是啟發我走向統計這條路的老師!

 

  • 中階課程  (難易度:3.5星,推薦度:4 星)
    Probability (Prof. Joe Blitzstein, Havard University)
    http://projects.iq.harvard.edu/stat110/home
    這門課程滿有趣的,其實是之前我曾經接到一個生意,要寫這個課程的期末考考卷,才發現知道原來有這門課。跟鄭老師的課程比起來,他是一個更偏「機率學」的課,許多習題都是對隨機實驗描述在做機率計算的,這堂課的缺點是比較難去了解機率論的全貌。

 

統計與數理統計

 

  • 中階課程 (難易度:3.5 星,推薦度:5星)
    統計學  (清大 鄭少為老師)
    http://www.stat.nthu.edu.tw/~swcheng/Teaching/math2820/index.html
    鄭少為老師真的教的非常非常非常的好!(再說一次 XD) 這門課程雖然叫做統計學,但其實是數理統計/高等統計學的難度,針對估計與檢定的部分真是精采絕倫!

 

 

應用統計方法

 

在這裡列出的課程,全部都是鄭少為老師的上課內容!我只有上過線性模式(也就是迴歸分析)跟 多變量分析,都非常精彩有用喔!基本上這些都算是進階課程,難易度都有4.5顆星喔!

 

 

 

 

 

時間序列分析

 

  • 初階課程 (難易度:2星,推薦度:5星)
    Business Analytics Using Forecasting (Prof. Galit Shmueli, NTHU)
    https://www.futurelearn.com/courses/business-analytics-forecasting
    這門課程是清大的徐茉莉教授的時間序列預測課程,課程不需要任何數學或是程式背景,可以幫助你從無到有建立資料分析的觀念,並學習到時間序列預測的精神喔!

 

  • 中階課程 (難易度:3.5星,推薦度:5星)
    Forecasting: principles and practice (Prof. Rob J Hyndman, Monash University)
    http://robjhyndman.com/seminars/uwa/
    這門課程沒有影片檔,但有相關的講義、投影片、以及 R code,其實光看這些教材就完全可以搞懂了。  Hyndman 教授是時間序列(應該可以說是最有名)的套件 forecast 的作者,他也是莫莉老師的好朋友,他的課程內容非常豐富,但需要一點點數學跟coding的基礎。

 

 

機器學習 ─ 一般領域

 

  • 中階課程 (難易度:3.5 星,推薦度:4.5 星)
    Statistical Learning (Prof. Trevor Hastie and Prof. Rob Tibshirani)
    https://goo.gl/fTf4Tl
    這兩位是 Stanford 統計系的兩位大神教授,Tibshirani 是 LASSO 的發明人,Hastie則是 elastic net 的發明人,兩位都是高維度資料分析的大師,我自己看過機器學習的書中寫的最平易近人的應該就是他們的 An Introduction to Statistical Learning,這門課便是以這本書作為主要課本,裡面也有  R 語言的實作,非常棒!

 

  • 中階課程 (難易度:3.5 星,推薦度: 5 星)
    Coursera 機器學習專項課程 (University of Washington)
    https://www.coursera.org/specializations/machine-learning
    這系列的專項課程是我所有機器學習課程中最推薦的,除了老師上課的說明淺顯易懂外,作業也非常應用,但又不會太難,當初雖然我是為了學 Python 而看的,結果卻是所有機器學習課程中我最最最推薦的一門。

 

  • 進階課程 (難易度:4.5 星,推薦度: 4 星)
    大規模機器學習實務 (清大 吳尚鴻 教授)
    http://datalab-lsml.appspot.com/
    這門課程是清大吳尚鴻教授開的機器學習,雖然老師上課的投影片中數學量滿多的,但我覺得老師 lab demo 的 ipython notebook 非常棒,很推薦大家學習!之所以沒有 5 星推薦,是因為這門課程的網頁有可能在課程結束後會被老師關掉~

 

 

機器學習 ─ 其他主題

 

  • 深度學習 (難易度:4.5 星,推薦度:5 星)
    機器學習 ─ 結構化與深層化 (台大 李宏毅 教授)
    http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLSD15_2.html
    市面上比較少跟 Deep Learning 相關的課程,李宏毅老師的深度學習講解得非常清楚易懂,又有搭配 Theano 教學,雖然我還沒有時間看完,但修過的都說讚!

 

 

  • 增強學習 (難易度:5 星,推薦度:5 星)
    Reinforcement Learning (Prof. David Silver)
    課程影片:在 youtube上搜尋 David Silver 就可以找到
    課程講義:http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html
    David Silver絕對是大師中的大師,如果大家有看 AlphaGo 發在 Nature 的 paper,作者第一位就是他!!!這門課程是相對比較理論一點的課程,但能帶大家看到 reinforcement learning的很多面向,超棒的!

 

  •  機器學習理論 (難易度:爆表 6 星,推薦度:3 星)
    Statistical Machine Learning (Prof. Larry Wrassman)
    http://www.stat.cmu.edu/~larry/=sml/
    這門課程是我非常非常喜歡的一門課(對於統計的人來說超棒的),課程很漂亮的討論了各種機器學習議題背後的統計理論,包括:RKHS、Empirical Risk Minimization、Concentration of Measure、Minimax Theory,到常見的regression, classification, clustering等技巧,有很深入的介紹。這門課真的非常非常非常的難,所以並沒有非常推薦大家去看。

 

有關 David’s Perspective 的最新文章,都會發布在大鼻的 Facebook 粉絲專頁,如果你喜歡大鼻的文章,還請您不吝嗇地按讚或留言給我喔!

大鼻觀點:https://www.facebook.com/davidperspective/

About David Huang

目前於哈佛大學商學院攻讀量化行銷博士,曾任 Migo.tv Data Lead、Mastercard Data & Services 顧問、InrayTek 資料科學家。過去曾協助東南亞與大中華區的領先企業導入資料科學架構,解決使用者體驗優化、個人化推薦演算法設計、客戶偏好分析、新產品導入與訂價、客戶長期價值管理等重要商業問題。

22 Comments

  1. 太感謝了

    Coursera 機器學習專項課程 (University of Washington)
    這門課好像不是免費的啊?

  2. 謝謝分享!
    Convolutional Neural Networks for Visual Recognition (Stanford University)的影片好像沒了,有點可惜

  3. 請問機器學習這門學科

    跟應用統計的時間序列 , 應用多變量分析….等等這些應用統計的內容有什麼關係嗎

    1. 一般機器學習跟多變量會滿有關係的,因為分類、分群與降維過去一直是多變量分析的重要研究主題,時間序列通常是另外自成一格,跟隨機過程比較會有關係!

  4. 您好大鼻老師
    想請問線性代數跟微積分在機器學習需要會到什麼程度呢?多變量的微積分會很常用到嗎
    謝謝

  5. 您好!請問鄭少為老師的課程是不是不能觀看了呢?請問還有類似的替代課程嗎?
    線性模式 (迴歸分析)和多變量的課程~

  6. 版主您好
    我是目前大三生,想做機器學習方面相關的專題
    自己摸索了一個月 大概對機器學習是針對資料來擷取不同特徵
    以更好的分析做預測
    我看了 林軒田老師跟李宏毅老師的課 有慢慢進步中。
    但我的數學底子並不太好 因為還沒修過機率論 及一些統計的應用
    現在大概是學會實作感知機做二元分類跟用梯度下降法實現線性回歸兩種數學模型

    我想請問的是 有沒有一條"明確"的路 能學好機器學習 甚至是深度學習
    例如我應該依序學什麼樣的數學模型
    這些數學模型需要怎麼樣的數學基礎知識 例如機率 線性代數等等

    我很困惑 希望可以幫忙解答 謝謝

    1. 在機器學習的領域,最重要的數學基礎有:
      1. 多變數的微積分
      2. 線性代數 (Orthogonal Basis, SVD)
      3. 機率論 (隨機變數、機率分佈、收斂性)
      4. 數理統計 (MLE, EM Algorithm)

      當你有這些基礎之後,可以去學習 Covex Optimization,或者是更進階的機率理論。Funcional Analysis 可能也會有一點幫助。

  7. David 你好~~我在尋找統計學開放課程時,恰巧看到此心得推薦(目前在上高老師的微積分2,多變數函數部分),真的謝謝你的整理跟說明!!

    是說有一個問題不知道可不可以向你請教,我大學讀財政
    但這幾年來發現自己蠻喜歡數學的
    最近有申請到荷蘭的統計學主修資料科學的碩士,打算9月前往。
    但這段時間也有點徬徨,讀完大概31歲了,從你的經驗來看,這年紀投入資料科學的領域 ,會不會太遲呢><

  8. 謝謝分享,像是鄭少為老師的課不是透過你我完全沒有辦法接觸到,一聽了發現講得好好啊~

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *