构建Spark Application的运行环境(启动SparkContext),SparkContext向资源管理器(可以是Standalone、Mesos或YARN)注册并申请运行Executor资源 查看全文>>
大数据技术文章2018-09-11 |传智播客 |传智播客,Spark运行架构
Spark 在生产环境下经常会面临transformation的RDD非常多(例如一个Job中包含1万个RDD)或者具体transformation的RDD本身计算特别复杂或者耗时(例如计算时长超过1个小时),这个时候就要考虑对计算结果数据持久化保存 查看全文>>
大数据技术文章2018-09-11 |传智播客 |传智播客,spark
这个安装过程经历曲折,遇到了许多坑。 环境:Windows 7 Vm 我用了三台虚拟机 centos 192.168.188.128 hadoop1(作为主服务器) 192.168.188.129 hadoop2 192.168.188.130 hadoop3 查看全文>>
大数据技术文章2018-08-06 |传智播客 |传智播客,hadoop
目标1:熟练使用scala编写Spark程序;目标2:动手编写一个简易版的Spark通信框架;目标3:为阅读Spark内核源码做准备 查看全文>>
大数据技术文章2018-08-02 |传智播客 |云计算,Scala
传智播客黑马程序员作为一个IT学习平台,历经12年的成长,免费分享视频教程长达10万余小时,累计下载量超3000万次,受益人数达千万。免费公开课直播1000余次,听课人数近百万人!2018年我们不忘初心,继续前行!新版学习路线图上线,对云计算大数据感兴趣的同学们,赶紧学起来吧! 查看全文>>
大数据技术文章2018-05-14 |传智播客 |云计算大数据
大数据实时处理平台市场上产品众多,本文着重讨论spark与storm的比对,最后结合适用场景进行选型。 查看全文>>
大数据技术文章2018-01-23 |传智播客 |spark,storm
为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。 查看全文>>
大数据技术文章2018-01-10 |传智播客 |Java面试题