NCHC教育訓練網 回國網中心
課程總覽 最新消息 會員專區 問卷填寫 報名需知 常見問題 FAQ 住宿資訊 交通導引 電子報 聯絡我們  
 
        首頁 課程總覽 課程介紹
 
 
課程編號: NE-2018-CH02
課程名稱: Spark資料分析實務課程
課程領域: 電腦及網路
相關領域:
上課方式: 實體教室
上課地點: 台中    電腦教室 A    交通導引
上課時間: 2018/7/12 (四)  ~  2018/7/13 (五)     09:30 ~ 16:30
上課總天數: 2 天,共計 12 個小時
招生日期截止(含): 2018/07/05 (四)  17:00
最後繳費截止(含): 2018/07/11 (三)  05:00
最後回報繳費截止(含): 2018/07/11 (三)  17:00
提供午餐:
招生人數: 6 ~ 15  人
 
講師:
財團法人國家實驗研究院國家高速網路與計算中心 盧沛怡  佐理研究員
國家高速網路與計算中心 - 軟體發展組 陳威宇  副研究員
nchc, tsmc
 
報名費用:
一般人士3600 元
學生2800 元
課程介紹:
Apache Spark為一開放原始碼的叢集運算框架,由加州柏克萊大學所開發。由於Spark在記憶體內運算的特性,速度較Hadoop的Mapreduce快上許多,並可實現在MapReduce不容易實現的計算工作,例如反覆運算、互動式和串流工作等。另外,Spark也支援結構化的資料處理,以及常見的機器學習演算法。 本課程將會介紹Spark Dataframe的操作,以及Spark MLLib內建的多項機器學習演算法,並提供範例資料供學員實際演練,藉由上機操作的過程中,能夠了解Spark ML的操作方式,以及如何利用Spark分析資料。
課程內容安排:
(1) Spark簡介與簡易操作
(2) 資料前處理
(3) 迴歸分析(regression)
(4) 群組辨識(classification)
(5) 群聚分析(clustering)
(6) 特徵值提取(feature selection and trasformation)
 
  

服務專線 新竹  (03)5776085-351  賴小姐

國家高速網路與計算中心|建議最佳螢幕解析度 1024*768| 隱私保護及網站安全政策聯絡我們