HadoopTimes

ストリーミングアーキテクチャ Apache Kafka とMapR Streams による新しい設計手法
イベント

【2018年2月開催】Developing Apache Spark Applications

コース概要

このトレーニングコースでは、Apache Spark を用いたデータアプリケーションの開発方法を紹介します。また、Apache Spark の対話型シェルを用いたデータロード、シンプルな Apache Spark アプリケーションの作成、Apache Spark ストリーミングアプリケーションの作成、Apache GraphX によるグラフの並列分散処理、MLlib による機械学習を体験いただけます。 このコースを修了すると、MCSD MapR Certified Spark Developer を受験するための準備が行えます。

コース情報

受講日数

3日間

開始時刻~終了時刻

9:30-17:00

正規受講価格

298,500円 (税別)

コース詳細

・Apache Spark の概要
・Apache Spark データパイプラインの概要
・Apache Spark へのデータロード
・基本的なアプリケーションの作成
・RDD ( Resilient Distributed Dataset ) の構造
・Apache Spark データフレーム
・Apache Spark アプリケーションの監視
・Apache Spark ストリーミングアプリケーションの作成
・Apache GraphX の利用
・MLlib を使用した機械学習

対象者

・Apache Spark を用いてデータ活用されたい方
・Spark アプリケーションの設計と開発に興味を持っている開発者

前提知識

・viなどのテキストエディタの使用経験および一般的なLinuxのコマンド知識
・アプリケーション開発の知識
・SSHとWebブラウザによるHadoopクラスタへの接続
・これはプログラミングのコースです。
 演習を行うにはScala/Python/Javaプログラミングのご経験が必要です。
・テキストや演習はScalaベースになります。

言語

テキスト:英語
講義  :日本語

開催スケジュール

2018.02.19 〜 2018.02.21 (品川御殿山会場)

詳細、お申し込みはこちら