rplot

[示範] 如何對Tag標籤的資料進行分析?

以前在 CHOCOLABS 實習的時候,常常要處理「Tag 標籤」的資料 ─ 因為 CHOCOLABS 的主打 app「追劇瘋」裡面是使用者看連續劇的紀錄,以及各個連續劇的「Tag 標籤」,比如說是古裝劇、職場劇之類的,所以時常要透過分析這兩種類型的資料來得到有用的商業洞見。之前有讀者說,想看看大鼻是分析資料的實際案例,所以就決定分享一些我常用的分析方法。當然,為了確保商業機密,我只示範非常簡單,沒有很多insight的方法給大家看 XD 這些方法也沒有實際應用在 CHOCOLABS 的專案中。

%e8%a1%a8%e6%a0%bc123

人工智慧與增強學習-2:多臂吃角子老虎機理論

「多臂式拉吃角子老虎機」是一個 MDP,而我們將動作集合簡化成 $latex \mathcal{A}(s) = \{1,2,\cdots,K\},~\forall s\in\mathcal{S}$,且假設執行動作得到的報酬僅跟執行的動作有關,也就是我們可以將狀態空間寫為$latex \mathcal{S}=\{S_1,\cdots,S_K\}$。

rplot

資料專案的完整流程 3:Information-out

在這篇文章中,我想要跟大家談談「Information-out」這件事,當資料科學家費盡大量的心力分析完資料,找出有用的洞見後,時常我們必須要向「有決策權的人」─客戶、主管、其他部門的同事─進行報告。此時,「有效地」呈現資料分析的結果將會影響著前面的分析究竟是白費了,還是能夠真正影響組織決策,讓自己的分析為組織帶來價值!

表格123

積木盒子:金融創新的P2P借貸平台

「積木盒子」的策略便是在多元化投資商品的同時,透過透明公開、信評調查、以及穹頂計畫等特色,成功吸引了大量的投資人在平台上進行投資,其策略是台灣P2P借貸平台得以借鑑的!

%e8%a1%a8%e6%a0%bc123

讀者提問:什麼是支持向量機 (SVM)

幾乎所有的機器學習課程,都會談到一個很經典的演算法,叫做支持向量機 (support vector machine) 。最近有個朋友在粉絲專頁上問到,「支持向量機到底是什麼?」所以我想要(嘗試) 用比較好理解的方法簡單介紹什麼是 SVM。

%e8%a1%a8%e6%a0%bc123

資料專案的完整流程 2:Information-process

在 Info-in 時資料科學家心中應該已經有個譜,大致上想好後續要怎麼樣建模,因此這一步算是整個資料分析中比較輕鬆的部分。常常就是「把資料塞進去→調整參數→看結果」的過程不斷循環,當然不同類型的資料會需要用到不同的統計或機器學習技法,這是建模過程中較為困難的地方。

%e8%a1%a8%e6%a0%bc123

人工智慧與增強學習 1:什麼是增強學習?

人類在進行決策時,常常會根據目前「環境」(environment) 的「狀態」 (state) 執行「動作」 (action),執行動作會造成兩個結果:一是人們會得到「環境」給我們的回饋,也就是人類會得到「報酬」 (reward) ,接著我們所執行的動作也會去改變「環境」,使得「環境」進入到一個新的「狀態」。