[debug] PyTorch报错:ConnectionResetError: [Errno 104] Connection reset by peer_pytorch issue connection reset by peer-程序员宅基地

技术标签: python  深度学习  pytorch  BUG解决  Python  

问题描述:

使用PyTorch 1.10.0,训练报错:

ConnectionResetError: [Errno 104] Connection reset by peer

问题解析

参见pytorch的issue

I believe the issue is only triggered for the case that both
persistent_workers and pin_memory are turned on and iteration is
terminated at the time that worker is sending data to queue. First,
persistent worker would keep iterator with workers running without
proper cleaning up (using __del__ in _MultiProcessingDataLoaderIter.
And, if any background worker (daemon process) is terminated when it
is sending data to the _worker_result_queue, such Error would be
triggered as the pin_memory_thread want to get such data from Queue.

I can send a PR

解决方法

目前的解决方法是增大batchsize,或者可以尝试issue中的其他方法

I have experienced this issue as well where the dataloader exits with a ConnectionResetError: [Errno 104] Connection reset by peer error. I observed that this error goes away away with either a) adding a sleep, or b) using larger batch sizes. I suspect there is race condition that is triggered if the dataloader completes very quickly. I am running Pytorch 1.10.

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/qq_41683065/article/details/122643637

智能推荐

【QT开发笔记-基础篇】| 第二章 常用控件 | 2.7 组合框 QComboBox_qt中组合框里的不同功能如何实现-程序员宅基地

文章浏览阅读3.1k次,点赞3次,收藏15次。(1) QComboBox属性:文本、图标、插入和删除 (2) 案例演示_qt中组合框里的不同功能如何实现

【Java】使用 HSSFWorkbook 生成 Excel 并导出步骤_java hssfworkbook-程序员宅基地

文章浏览阅读2k次。使用 HSSFWorkbook 生成 Excel 并导出步骤_java hssfworkbook

etl spring_Spring Batch与ETL工具比较-程序员宅基地

文章浏览阅读547次。在实际应用中,在批处理中用得较多的是场景是数据同步。在做数据集成工作中,常常需要从源位置把数据同步到目标位置,以便于进行后续的逻辑操作。在做这种批处理工具时,在网上查资料,发现用得比较多的是kettle及阿里的datax,对于这两款工具,各有各的优缺点。kettlekettle是一款可以可视化编程的开源ETL工具,把数据处理简化为Job和Transform,在Transform中,提供了各种数据读..._spring batch etl

109:vue+openlayers 定位动画(平移-弹性平移-飞行 示例代码)_vue openlayer飞行到某个点-程序员宅基地

文章浏览阅读821次。本示例的目的是介绍如何在vue+openlayers项目中来实现定位动画,实现平移,飞行,弹性动画等。_vue openlayer飞行到某个点

【Linux CentOS 配置国内阿里云yum源以及常见基础配置】_yum 阿里云-程序员宅基地

文章浏览阅读907次。5、将文件中的所有http开头的地址更改为https。2、找到yum源的配置路径。_yum 阿里云

pandas-DataFrame修改行索引-index和列索引-columns_pandas 改变行索引, 值不表-程序员宅基地

文章浏览阅读2w次,点赞10次,收藏39次。代码示例:import pandas as pdimport numpy as npdf = pd.DataFrame(np.arange(9).reshape(3, 3), index = ['TJ', 'BJ', 'SH'], columns=['q', 'w', 'e'])print(df)'''打印: q w etj 0 1 2bj 3 4 5sh 6 7 8'''df.index = ['TianJin', 'BeiJin', 'Shang_pandas 改变行索引, 值不表

随便推点

Android Studio 混淆_android studio 开启混淆-程序员宅基地

文章浏览阅读192次。android 混淆_android studio 开启混淆

专业学位计算机技术排名,山东师范大学计算机技术(专业学位)专业考研难度分析-专业排名-难度大小...-程序员宅基地

文章浏览阅读451次。山东师范大学计算机技术(专业学位)专业考研难度取决于很多因素,比如考研录取分数线、专业排名、学校排名,考研录取比例、招生人数、学校知名度等等很多因素,而且难度的大小直接影响到考生是否能够考研成功,所以考研难度大小是考研过程中不可忽略的一个因素。山东师范大学计算机技术(专业学位)专业排名是不可忽略的一个因素,专业排名靠前,专业热门意味着竞争的激烈,势必会增加考研的难度。另外跨专业也会增加考研的难度,..._山东师范大学计算机研究生容易被卡学历吗

idea配置tomcat环境_idea的tomcat,连接不显示explore-程序员宅基地

文章浏览阅读788次。打开idea–>点击项目Edit Configurations添加tomcat添加项目 war exploded(选择右边+号进行添加)特别注意如果项目pom文件的build中配置了finalName,则Application context中需配置对应的名称_idea的tomcat,连接不显示explore

说说内核与计算机硬件结构-程序员宅基地

文章浏览阅读502次。1.内核诸如51/ARM/90/PIC/AVR.....有好多种的,何况内核从来不分类,因为每一家常都可以改内核,你应该问的是架构!!只有懂架构才能用什么片子都驾轻就熟. 我详细的说一下吧. HARVARD(哈佛)架构:ROM(程序空间)与RAM(数据空间)分开,便于程序与数据的同时访问,减少程序运行时访问的瓶颈,提高数据吞吐. PRINCETON(普林斯顿)架构:采用通用计算机广泛使用的..._dcache和微处理器的接口 整个系统的层次结构如图1所示

数据结构应用案例——栈结构用于8皇后问题的回溯求解-程序员宅基地

文章浏览阅读862次。【说明】本文来自由周世平老师主编的《C语言程序设计》教材。我作为参编人员执笔了第7、8章。“第8章 问题求解与算法”中“8.6.1 回溯法”以8皇后问题的求解为例,介绍了回溯法的解题过程。这个解决方案中用到了“栈”,引用至此,作为栈应用的例子。需要说明的是,教材面向程序设计初学者,并全文中并未提出过任何关于“栈”的描述。这样做,隐藏了术..._八皇后栈回溯代码实现数据结构

c语言scanf中的分隔符的作用,C语言中scanf与分隔符(空格回车Tab)-程序员宅基地

文章浏览阅读2.5k次,点赞3次,收藏12次。众所周知,C语言中的scanf函数的作用是从标准输入设备(通常是键盘)读取输入值,并存储到参数列表中指针所指向的内存单元。下面从几个方面说一下一些稍微细节的东西。下面的实验都在vc6.0中通过。1、scanf的返回值scanf通常返回的是成功赋值(从标准输入设备赋值到参数列表所指定的内存区域)的数据项数,如果出错或是遇到end of file(注意,如果想从键盘输入EOF,在windows的DOS..._不同类型输入要分隔符吗c语言

推荐文章

热门文章

相关标签