pdf

Spark Fast Big Data Analysis.pdf

  • 2018-02-08
  • 15.87MB
  • Points it Requires : 1

Today, the amount of data in all fields is growing rapidly. How can we make efficient use of this data? This book introduces Apache Spark, an open source cluster computing system that can accelerate the implementation and operation of data analysis. With Spark, you can quickly manipulate large data sets with simple APIs in Python, Java, and Scala. Written by Spark developers, this book allows data scientists and engineers to get started immediately. You can learn how to use short codes to implement complex parallel jobs, and learn about applications from simple batch jobs to stream processing and machine learning. Table of Contents Chapter 1 Introduction to Spark Data Analysis Chapter 2 Download and Get Started with Spark Chapter 3 RDD Programming Chapter 4 Key-Value Pair Operations Chapter 5 Data Reading and Saving Chapter 6 Advanced Spark Programming Chapter 7 Running Spark on a Cluster Chapter 8 Spark Tuning and Debugging Chapter 9 Spark SQL Chapter 10 Spark Streaming Chapter 11 Machine Learning Based on MLlib

unfold

You Might Like

Uploader
lcofjp
 

Recommended ContentMore

Popular Components

Just Take a LookMore

EEWorld
subscription
account

EEWorld
service
account

Automotive
development
circle

About Us Customer Service Contact Information Datasheet Sitemap LatestNews


Room 1530, 15th Floor, Building B, No.18 Zhongguancun Street, Haidian District, Beijing, Postal Code: 100190 China Telephone: 008610 8235 0740

Copyright © 2005-2024 EEWORLD.com.cn, Inc. All rights reserved 京ICP证060456号 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号
×