与阿帕奇公园4号 和皮顿联播大数据 手举高! Taming Big Data with Apache Spark 4 and Python - Hands On!

最新为Spark 4的最新特征“大数据”分析更新, 这是非常热、极有价值的技能 — — 这个课程将教你最热的海量数据技术:阿帕奇火花,
包括亚马逊、埃拜、美国航天局JPL和雅虎等雇主都利用火花快速从大型数据组中获取意义,
在家里使用自己的Windows系统,学习同样的技术。
学习并掌握设计数据分析问题的艺术, 以作为火花问题通过20多个亲手例子来研究, 然后扩大它们, 从而在这个课程中运行云计算服务。
你会从一个前工程师 亚马逊和IMDb的高级经理那里学习
学习Spark DataFrames和弹性分布数据存储器的概念,开发并快速运行 Spark 工作,使用 Python 和 pyspark 将复杂的分析问题转换成迭接或多阶段的 Spak
学习其他火花技术, 如Spark SQL、Sprark
使用火花的最新特征,包括熊猫在火花上、火花连接和用户定义的表函数(UDTFs)等,进行串流和图X练习。
到了这个课程结束时,你将运行代码 分析千兆字节的信息价值 – 在云层中 –
学习这个课程使用熟悉的 Python 编程语言; 如果您宁愿用 Scala 来取得斯帕克最好的表演, 请看看我的“ Apache Spark with Scla- Land on with Big Data” 课程。
顺便说一下,我们将会在路上玩得很开心。你会得到一些简单的例子的温暖。
一旦你得到基本的东西 腰带下面, 我们将移动一些更复杂和有趣的任务。
我们用百万个电影评分 来寻找彼此相似的电影 你甚至可能发现一些新的电影
并开发一个系统来寻找超级英雄之间的“分离程度”。
所有的超英雄都和”不可思议绿巨人”有关吗?
课程非常亲手操作; 你会花大部分时间跟着老师一起写、分析、运行真实代码, 无论是在你自己的系统上,
地图浏览服务。 8小时的视频内容包含在内, 超过40个真实的例子, 您可以自己建立、 运行和学习复杂程度越来越高。 按您自己的进度, 以您的计划进行移动 。
课程总结了其他基于火花的技术,包括Spark SQL、Spoker结构型溪流和GreagX。 把大数据与Apache Spark串流断开是当今技术世界中的重要技能之一。
加入吧! 我和弗兰克·凯恩一起研究《与阿帕奇史派克和皮顿 测试大数据》, 帮我建了一个伟大的平台,
– ” 克里顿·桑帕约·德梅洛小分会 ” 关于利用皮顿在阿帕奇斯帕克经营大数据业务的优秀课程。
弗兰克一如既往地解释得非常清楚, 指出各种需要注意的物品, 确保你们设置正确。
斯派克的工作有许多方法可以失败或有问题,比如记忆用完,弗兰克非常努力指出其中的许多人。
安装火种并运行示例。 好例子和乐趣可以做。 提供一套很好的有用范例作为工具箱。 “汉斯耶夫“你最好去阿帕奇公园和皮顿!
Frank的演讲非常彻底,但毫无幻想;他对他提出的每一个新概念的解释都落到地上,很容易遵循。