diff --git "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" index aa3c9b8adfcc2f7490db4543f3beb219e023afa3..8c5a64ff8799b14149390092055cd661c84ef98a 100644 --- "a/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" +++ "b/Ascend-PyTorch\347\246\273\347\272\277\346\216\250\347\220\206\346\214\207\345\257\274/\344\270\223\351\242\230\346\241\210\344\276\213/\345\212\237\350\203\275\346\211\223\351\200\232/\347\233\256\346\240\207\350\267\237\350\270\252SiamMask-\347\275\221\347\273\234\345\210\206\346\256\265.md" @@ -1,5 +1,6 @@ [SiamMask](https://gitee.com/ascend/modelzoo/pulls/4105) -1.由于pytorch与onnx框架实现引起的bn算子属性epsilon,momentum在两种框架下略微不同,对本网络影响较大,onnx精度与pth精度差了一点,但是om与onnx精度一致。 +1.由于pytorch与onnx框架实现引起的bn算子属性epsilon,momentum在两种框架下略微不同,onnx精度与pth精度差了一点,但是om与onnx精度一致。 2.因为SiamMask是前后帧连续处理,即上一帧的输入作为下一帧的输出,在Refine模块中进行动态pad,因此模型需要拆分为两段。因为SiamMask部分卷积存在使用自定义kernel来对输入进行卷积操作,导致卷积存在kernel和input的双输入的情况,[issue](http://github.com/onnx/onnx-tensorrt/issues/645),故在线推理测试性能。计算的是拆分的两部分模型合在一起完整推理的性能。 3.因为SiamMask在corr部分固定了reshape之后的形状,并且针对前后帧连续处理,所以模型不支持多batch。 -4.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写,速度将会进一步加快。 \ No newline at end of file +4.推理速度较慢的问题目前出在io部分。如果`msame`支持将数据从内存中读写而不必须从`.bin`文件中读写,速度将会进一步加快。 +5.msame保存为bin格式并以float32加载比TXT格式精度高一些,性能也更好。 \ No newline at end of file