
pyspark
hungita
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
linux配置pyspark的问题解决
问题一:Service 'sparkDriver' failed after 16 retries (on a random free port)。。。 解决方案:ifconfig,查看ip,vi /etc/hosts改成与ifconfig的ip对应;vi /etc/sysconfig/network-scripts/ifcfg-eth0中的HWaddr对应ifconfig的HWaddr; ...原创 2019-03-18 10:07:00 · 608 阅读 · 0 评论 -
pycharm配置pyspark
1 、pycharm右上角“run”三角形的左边有一个run configurition,打开它。 2 、设置configurition---Environment--- Environment variables ---点击“...”,出现框框,点击+,输入两个name,一个是SPARK_HOME,另外一个是PYTHONPATH,设置它们的values,SPARK_HOME的value是安...原创 2019-03-18 11:10:20 · 662 阅读 · 0 评论 -
RDD与DSM的区别
RDD(Resilient Distributed DataSet)弹性分布式数据集,是Spark的核心数据结构。 DSM(Distributed Shared Memory)分布式共享内存,它是一种通用的内存数据抽象。在DSM中,应用可以向全局地址空间的任意位置进行读写操作。 RDD与DSM主要区别在于,不仅可以通过批量转换创建(即“写”)RDD,还可以对任意内存位置对写。RDD限制应用执行...转载 2019-03-19 10:19:51 · 717 阅读 · 0 评论