From 08b9f05ecaf6b61d9a184ff0914f0d92ee1bba2c Mon Sep 17 00:00:00 2001 From: zhangjunyi08 Date: Tue, 28 Sep 2021 03:03:47 +0000 Subject: [PATCH] =?UTF-8?q?update=20pytorch-train-guide/Pytorch=E8=AE=AD?= =?UTF-8?q?=E7=BB=83-FAQ.md.?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- .../Pytorch\350\256\255\347\273\203-FAQ.md" | 14 ++++++++++++++ 1 file changed, 14 insertions(+) diff --git "a/pytorch-train-guide/Pytorch\350\256\255\347\273\203-FAQ.md" "b/pytorch-train-guide/Pytorch\350\256\255\347\273\203-FAQ.md" index e9f03c7..730d8c8 100644 --- "a/pytorch-train-guide/Pytorch\350\256\255\347\273\203-FAQ.md" +++ "b/pytorch-train-guide/Pytorch\350\256\255\347\273\203-FAQ.md" @@ -57,6 +57,7 @@ - [FAQ51、centos环境安装PyAV报错](#faq51centos环境安装PyAV报错) - [FAQ52、arm环境安装torchvision 0.6.0版本](#faq52arm环境安装torchvision0.6.0版本) - [FAQ53、arm环境import sklearn和torch冲突](#faq53arm环境import-sklearn和torch冲突) + - [FAQ54、流水出现谷歌链接failed](#faq53流水出现谷歌链接failed) - [2.2 NPU模型分布式运行常见问题FAQ](#22-npu模型分布式运行常见问题faq) - [FAQ1、在模型分布式训练时,遇到报错 host not found.](#faq1在模型分布式训练时遇到报错-host-not-found) - [FAQ2、在模型运行时,遇到eval模式下loss值特别大,过万.](#faq2在模型运行时遇到eval模式下loss值特别大过万) @@ -1123,6 +1124,19 @@ arm环境先import sklearn,再import torch;对于模型文件,一般在入 ## [2.2 NPU模型分布式运行常见问题FAQ](#22-NPU模型分布式运行常见问题FAQ) ### FAQ1、在模型分布式训练时,遇到报错 host not found. +### FAQ54、流水出现谷歌链接failed +- 现象描述 +![输入图片说明](https://images.gitee.com/uploads/images/2021/0928/110308_ebd4df1d_7946721.png "流水问题.png") + +- 原因分析 +readme中不要出现google相关的链接 + +- 处理方法 +把Google链接相关位置都改成参考源码仓,并附上源码仓带commit的链接 + +## [2.2 NPU模型分布式运行常见问题FAQ](#22-NPU模型分布式运行常见问题FAQ) +### FAQ1、在模型分布式训练时,遇到报错 host not found. + * 现象描述 ![](https://gitee.com/wangjiangben_hw/ascend-pytorch-crowdintelligence-doc/raw/master/figures/model_faq11_1120.png) -- Gitee