
AI Platform
文章平均质量分 82
深度学习平台/机器学习平台实践,在统一资源管理的基础上,简化深度学习任务的训练、推断、数据管理等过程,助力公司研发效率提升及资源成本节约,提升客户满意度。
chansonzhang
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Jax 中的 Autograd 和 PyTorch 中的 Autograd 有何联系?
其实都有 HIPS/autograd 血统原创 2022-09-28 07:33:48 · 569 阅读 · 0 评论 -
Tensorflow On Spark Troubleshooting
Troubleshooting已经在python中安装了tensorflow,并且zip包也已经提交到hdfs,运行后报错:no module named tensorflow可能是未正常使用zip包中的python,而使用了系统中其他版本的python在启动命令中加入以下选项,明确指示使用哪个python--conf spark.yarn.appMasterEnv.PYSPARK_PYTHON=./Python/bin/python \--conf spark.pyspark.python=.原创 2021-08-07 10:21:58 · 253 阅读 · 0 评论 -
在YARN上使用GPU
Use GPU on YARN环境信息hadoop-3.2.2Linux centos7 3.10.0-1160.24.1.el7.x86_64相关配置${HADOOP_HOME}/etc/hadoop/resource-types.xml <configuration> <property> <name>yarn.resource-types</name> <value>yarn.io/gpu</va原创 2021-07-18 13:04:15 · 679 阅读 · 0 评论 -
GPU调度方案
gpu 调度方案设置环境变量CUDA_VISIBLE_DEVICES$ deviceQuery |& grep ^DeviceDevice 0: "Tesla M2090"Device 1: "Tesla M2090"$ CUDA_VISIBLE_DEVICES=0 deviceQuery |& grep ^DeviceDevice 0: "Tesla M2090"如果这一步没有生效,再尝试设置os.environ["CUDA_DEVICE_ORDER"] = "PCI_B原创 2021-07-13 16:25:04 · 2266 阅读 · 0 评论