Saturday, September 09, 2017

Python Spark ML(五):Decision Tree Survey - 問題討論

Python Spark ML(五):Decision Tree Survey - 問題討論

2017/09/09

作業五:

請將長篇的回覆,以文章的方式將連結回應到本篇文章在 Python Taiwan 的連結處:
https://www.facebook.com/groups/pythontw/permalink/10156862039173438/

短的意見則直接回應即可!

-----

前言:

Python Spark ML [1] 第一週,有很認真的同學,很認真地交了作業 [2],包含兩個回答 [3], [4]。

在 [2] 所附的參考資料中,[5] 是 MIT 教授的英文線上課程。這個教授的課程,之前我也聽過 SVM,講的非常好。[6] 則是有關決策樹很棒的中文簡介。

因應認真的同學,我特別把他交的作業 highlight 出來,作為課程的一部份,方便大家討論。當然,這個可能很多人都還不熟,包括我在內。我也會趕一下進度再參加討論!

-----

陳敬翔:學生讀了決策樹資料後有找範例(1)來做(純手工計算)。但是當同時使用到 Information Gain(資訊獲得量,針對類別型尺度)及計算 Gini Index(吉尼係數,針對連續型尺度)取得最佳解(切割點)時卻導致建構不出來決策樹;反倒再找了另一個簡單的只有類別型尺度的範例(2),使用相同的公式卻又可以順利建構出決策樹來。如果有學習過決策樹的同學也請不吝解惑,感謝你們:)

-----


Fig. 1. Decision tree example [4].

-----

[1] Python Spark ML(三):Decision Tree Survey
https://hemingwang.blogspot.tw/2017/09/python-spark-mldecision-tree-survey.html

[2] PythonSparkMLBookClub_Homework-PythonSparkML_03 at master · oneleo_PythonSparkMLBookClub · GitHub
https://github.com/oneleo/PythonSparkMLBookClub/tree/master/Homework-PythonSparkML_03

[3] Answer 01
https://github.com/oneleo/PythonSparkMLBookClub/blob/master/Homework-PythonSparkML_03/Homework-PythonSparkML_03-01.md

[4] Answer 02
https://github.com/oneleo/PythonSparkMLBookClub/blob/master/Homework-PythonSparkML_03/Homework-PythonSparkML_03-02.md

[5] Lecture 11  Learning  Identification Trees, Disorder _ Lecture Videos _ Artificial Intelligence _ Electrical Engineering and Computer Science _ MIT OpenCourseWare
https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-034-artificial-intelligence-fall-2010/lecture-videos/lecture-11-learning-identification-trees-disorder/

[6] AI - Ch14 機器學習(2), 決策樹 Decision Tree _ Mr. Opengate
http://mropengate.blogspot.tw/2015/06/ai-ch13-2-decision-tree.html

2 comments:

starfine said...

感謝老師!學生也才剛接觸決策樹領域
被老師 highlight 起來有點受寵若驚
學生還會再持續努力,並且還有很多不懂的地方,還多請老師指導!
再次謝謝老師!

Marcel said...

你的問題暫時我也難以回答,假以時日,應該是想的出來。