Home

Awesome

Data Mining(R programming language)

License: MIT

資料探勘課程 是國立成功大學工學院工程管理在職專班所開授的進階課程,開課教師為李家岩老師。

內容主要為資料科學(Data Science)與大數據(Big Data),鼓勵學生進行案例探討、分析與實作。 此 Github 網站為延伸教學資源,與 R 語言實作教學有關。

課程參考書目(Reference):

  1. Gareth James, Daniela Witten, Trevor Hastie and Robert Tibshirani, 2014. An Introduction to Statistical Learning with Applications in R. Springer.
  2. Hastie, T., R. Tibshirani, and J. Friedman, 2009. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed., Springer.

此 Github 網站內容主要為資料科學家 skydome20的R系列筆記 ,一併致謝。(若因 Rpubs 維修而無法閱讀文章,可參考 R系列筆記備份資源)

※好文分享:2019/08/17-What’s next for the popular programming language R?


助教群

擔任年份助教名稱暱稱LinkedInE-mail
2019下詹京哲Gingerhttps://www.linkedin.com/in/ginger-zhanbmw2142@gmail.com
2019上鄭宇翔Jackyhttps://www.linkedin.com/in/yu-hsiangCheng/zxcv9100207@gmail.com
2018洪佑鑫Jeffhttps://www.linkedin.com/in/hungyuhsin/p96064037@gs.ncku.edu.tw
2018吳昭賢Jameshttps://www.linkedin.com/in/iamjameswu/  new393988911@gmail.com
2017周百建Allanhttps://www.linkedin.com/in/iamallanchou
2017張博凱Bokaihttps://www.linkedin.com/in/bo-kai-Jang
2016洪紹嚴skydome20https://www.linkedin.com/in/skydome20

教學資源

:triangular_flag_on_post:環境建置

更新時間文章
2017-05-19安裝R與RStudio

:triangular_flag_on_post:基本觀念 & 語法

更新時間文章
2017-05-19基本資料型態
2017-05-19套件與函式
2017-05-19流程控制(for, while, ifelse, switch)

:triangular_flag_on_post:資料預處理  

更新時間文章
2017-05-19分割、合併、離群值、虛擬變數
2017-05-19遺漏值處理(Impute Missing Value)

:triangular_flag_on_post:資料視覺化

更新時間文章
2017-05-19繪圖–資料視覺化

:triangular_flag_on_post:模型建構

更新時間文章
2017-05-19線性迴歸與變異數分析(Linear Regression)
2019-12-04邏輯斯迴歸(Logistic Regression)
2017-05-19關聯式規則(Association Rule)
2018-03-03特徵選取(Feature Selection):逐步迴歸(Stepwise Regression)與套索迴歸(LASSO)      
2019-03-16特徵萃取(Feature Extraction):主成份分析(PCA)獨立成分分析(ICA)  
2017-05-19決策樹(Decision Tree):分類與迴歸樹CART  
2017-05-19類神經網路(Neural Networks):倒傳遞類神經網路(Backpropagation)
2017-05-19深度學習(Deep Learning)  
2017-05-19分群分析(Clustering):華德法(Ward)與K平均法(K-means)  
2019-07-24分群分析(Clustering):自適應共振理論(ART)
2017-05-19[分群分析(Clustering):自我映射組織(SOM)與模糊適應共振理論(Fuzzy-ART)]  
2017-05-19支援向量機(Support Vector Machine)  
2018-03-03集成算法(Ensemble Method):隨機森林(Random Forest)與梯度推進(Gradient Boosting)  
2019-02-21總結(Summary):Comparison of 13 Algorithms in 165 Datasets

:pushpin: Python

:triangular_flag_on_post: 其他介紹

更新時間文章
2019-11-14可解釋性人工智慧 Explainable Artificial Intelligence(XAI)
2019-11-14代價敏感 Cost Sensitive