本课程宗旨是了解如何使用 Spark、Pyspark AWS、Spark 应用程序、Spark EcoSystem、Hadoop 和掌握 PySpark.
您将学到:
● 大数据的引入和重要性。
● 用PySpark进行实际解释和实时编码。
● Spark应用程序
● Spark生态系统
● Spark架构
● Hadoop生态系统
● Hadoop体系结构
● Pypark RDDs公司
● PySpark RDD转换
● Pypark RDD操作
● Pypark数据帧
● Pypark数据帧转换
● Pypark数据帧操作
● PySpark中的协同过滤
● Spark流
● ETL流水线
● CDC and Replication on Going
要求
有Python方面的知识。
● 对编程有初步的了解。
● 愿意学习和实践。
MP4 | Video: h264, 1280×720 | Audio: AAC, 44.1 KHz, 2 Ch
Genre: eLearning | Language: English + srt | Duration: 151 lectures (16h 14m) | Size: 4.91 GB
Learn how to use Spark, Pyspark AWS, Spark applications, Spark EcoSystem, Hadoop and Mastering PySpark
原文链接:https://vuesite.cn/16004.html,转载请注明出处。