卷积网络和卷积神经网络_卷积神经网络的眼病识别-程序员宅基地

卷积网络和卷积神经网络

关于这个项目 (About this project)

This project is part of the Algorithms for Massive Data course organized by the University of Milan, that I recently had the chance to attend. The task is to develop the Deep Learning model able to recognize eye diseases, from eye-fundus images using the TensorFlow library. An important requirement is to make the training process scalable, so create a data pipeline able to handle massive amounts of data points. In this article, I summarize my findings on convolutional neural networks and methods of building efficient data pipelines using the Tensorflow dataset object. Entire code with reproducible experiments is available on my Github repository: https://github.com/GrzegorzMeller/AlgorithmsForMassiveData

该项目是我最近有幸参加的由米兰大学组织的“海量数据算法”课程的一部分。任务是开发使用TensorFlow库从眼底图像识别眼睛疾病的深度学习模型。一个重要的要求是使培训过程具有可扩展性，因此创建一个能够处理大量数据点的数据管道。在本文中，我总结了有关卷积神经网络和使用Tensorflow数据集对象构建有效数据管道的方法的发现。我的Github存储库中提供了具有可重复实验的整个代码： https ： //github.com/GrzegorzMeller/AlgorithmsForMassiveData

介绍 (Introduction)

Early ocular disease detection is an economic and effective way to prevent blindness caused by diabetes, glaucoma, cataract, age-related macular degeneration (AMD), and many other diseases. According to World Health Organization (WHO) at present, at least 2.2 billion people around the world have vision impairments, of whom at least 1 billion have a vision impairment that could have been prevented[1]. Rapid and automatic detection of diseases is critical and urgent in reducing the ophthalmologist’s workload and prevents vision damage of patients. Computer vision and deep learning can automatically detect ocular diseases after providing high-quality medical eye fundus images. In this article, I show different experiments and approaches towards building an advanced classification model using convolutional neural networks written using the TensorFlow library.

早期眼病检测是预防由糖尿病，青光眼，白内障，年龄相关性黄斑变性(AMD)和许多其他疾病引起的失明的经济有效方法。根据世界卫生组织(WHO)的目前，全世界至少有22亿人有视力障碍，其中至少有10亿人本来可以预防[1]。快速和自动检测疾病对于减轻眼科医生的工作量并防止患者视力损害至关重要。提供高质量的医学眼底图像后，计算机视觉和深度学习可以自动检测眼部疾病。在本文中，我展示了使用使用TensorFlow库编写的卷积神经网络构建高级分类模型的不同实验和方法。

数据集 (Dataset)

Ocular Disease Intelligent Recognition (ODIR) is a structured ophthalmic database of 5,000 patients with age, color fundus photographs from left and right eyes, and doctors’ diagnostic keywords from doctors. This dataset is meant to represent the ‘‘real-life’’ set of patient information collected by Shanggong Medical Technology Co., Ltd. from different hospitals/medical centers in China. In these institutions, fundus images are captured by various cameras in the market, such as Canon, Zeiss, and Kowa, resulting in varied image resolutions. Annotations were labeled by trained human readers with quality control management[2]. They classify patients into eight labels including normal (N), diabetes (D), glaucoma (G), cataract (C), AMD (A), hypertension (H), myopia (M), and other diseases/abnormalities (O).

眼病智能识别(ODIR)是一个结构化的眼科数据库，包含5,000名年龄的患者，左眼和右眼的彩色眼底照片以及医生的医生诊断关键字。该数据集旨在代表由上工医疗技术有限公司从中国不同医院/医疗中心收集的“真实”患者信息集。在这些机构中，眼底图像由市场上的各种相机(例如佳能，蔡司和Kowa)捕获，从而产生不同的图像分辨率。注释由经过培训的人类读者进行质量控制管理来标记[2]。他们将患者分为八个标签，包括正常(N)，糖尿病(D)，青光眼(G)，白内障(C)，AMD(A)，高血压(H)，近视(M)和其他疾病/异常(O) 。

After preliminary data exploration I found the following main challenges of the ODIR dataset:

经过初步的数据探索，我发现了ODIR数据集的以下主要挑战：

· Highly unbalanced data. Most images are classified as normal (1140 examples), while specific diseases like for example hypertension have only 100 occurrences in the dataset.

·高度不平衡的数据。大多数图像被归类为正常图像(1140个示例)，而特定疾病(例如高血压)在数据集中仅出现100次。

· The dataset contains multi-label diseases because each eye can have not only one single disease but also a combination of many.

·数据集包含多标签疾病，因为每只眼睛不仅可以患有一种疾病，而且可以患有多种疾病。

· Images labeled as “other diseases/abnormalities” (O) contain images associated to more than 10 different diseases stretching the variability to a greater extent.

·标记为“其他疾病/异常”(O)的图像包含与10多种不同疾病相关的图像，这些图像在更大程度上扩展了变异性。

· Very big and different image resolutions. Most images have sizes of around 2976x2976 or 2592x1728 pixels.

·非常大且不同的图像分辨率。大多数图像的大小约为2976x2976或2592x1728像素。

All these issues take a significant toll on accuracy and other metrics.

所有这些问题都会对准确性和其他指标造成重大损失。

数据预处理 (Data Pre-Processing)

Firstly, al

本文链接：https://blog.csdn.net/weixin_26752765/article/details/108132559

智能推荐

C++编程技巧_c++获取 gcc的target-程序员宅基地

文章浏览阅读534次。这是编译器指令，告诉GCC编译器使用最大优化级别(O3)和循环展开(unroll-loops)进行编译，以提高程序的运行速度optimize这会告诉编译器尽可能地优化代码以提高运行速度，有时候甚至会牺牲浮点数的精度。这里的程序是计算一个整型数组的所有元素的和，然后输出。如果我们将其与没有优化指令的版本比较，可能会在大型数据集或者复杂的计算中看到明显的运行速度的差异。不过在小型程序和简单的计算中，可能看不出明显的区别。_c++获取 gcc的target

体积雾(dx9)-程序员宅基地

文章浏览阅读1.3k次。1.什么是体积雾? 这个问题通过图片来解答再合适不过了，下面是本文利用体积雾做的一个结果所谓体积雾：顾名思义就是被限制了形状的雾，本文表述如何通过ImageProcess(图象处理)的方式实现体积雾。 2.常规雾原理雾效最终体现在雾颜色与场景色的混合上。决定雾的浓度的关键就在这个混合因子上_体积雾

网站后台服务器,网站后台数据服务器-程序员宅基地

文章浏览阅读584次。网站后台数据服务器内容精选换一换华为云云市场搭建了包括基础软件市场、企业应用市场、建站市场、安全市场、服务市场、解决方案市场、人工智能市场、物联网市场8大子市场，种类丰富，产品众多，用户可以在华为云云市场找到适合自己业务的软件/服务。本文主要介绍了如何使用弹性云服务器的Linux实例搭建Magento电子商务系统。Magento是一款开源电子商务系统，设计灵活，具有模块化架构体系和丰富的功能，..._网站后台数据

详解＜ meta ＞标签常用的属性及方法_常用meta设置-程序员宅基地

文章浏览阅读1.4k次，点赞51次，收藏52次。`meta`标签在HTML中扮演着至关重要的角色，它能帮助开发者更好地控制网页的呈现方式、提升SEO效果、指导浏览器行为以及其他与网页相关的元数据管理。_常用meta设置

RabbitMq初识_guest user from anywhere on the network-程序员宅基地

文章浏览阅读145次。文章目录一、认识二、安装1.docker安装2. 配置文件2.RabbitMQ的简单指令三、分类1. Direct直连问题：2. Work queue3. Fanout4. Routing4.1 Direct（订阅）4.2 Topic四、SpringBoot整合RabbitMQ一、认识[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TJhBYPKI-1586753..._guest user from anywhere on the network

今天端午节了，哈哈。。。-程序员宅基地

文章浏览阅读425次。今天过端午了，记录一下。。。先从百度入手，百度一篇《【创意Logo】浓浓的端午味儿……》来叙解了一下她的logo。端一盘粽子，呈一枝艾叶，与你一起过——端午。自多了端午节假日，端午的“节”气立时浓了起来。这也让现时代的人们，体味到了旧时中国的传统意味。农历五月初五，端午。在中国，流传至今的节日“四大名旦”，当属春节、中秋、清明和端午。而这四者中，端午名气相..._csdn　今天端午了哈哈

随便推点

MBA核心课程-程序员宅基地

文章浏览阅读479次。一、经营战略　　这一门课可以说是MBA教学的一个整体基础，是需要花一整年即两个学期来学的课程。几乎所有的工商管理学院都开设了此类课程。这门课要求MBA学生设身处境地去学习和掌握如何去构筑企业战略的总体框架，如何逐一按照框架去制定并完成与企业目标有关的各项具体方针。学生必须站在总经理的立场，对企业的组织、市场、财务、人事、信息系统，以及政府有关部门的关系等各方面问题做通盘的..._managing employee attitude & behaviour课程mba会学吗

在C++类中使用dllimport和dllexport导出,-程序员宅基地

文章浏览阅读681次。在Windows平台下：您可以使用dllimport或dllexport属性声明C ++类。这些形式意味着导入或导出整个类。以这种方式导出的类称为可导出类。以下示例定义可导出的类。导出其所有成员函数和静态数据：#define DllExport __declspec( dllexport )class DllExport C { int i; ..._struct dllexport c++ 导出结构体

CMTime详解－AVFoundation视频操作必备基础_cmtimemake-程序员宅基地

文章浏览阅读1.1k次。CMTime 对于视频和音频操作比不可少，第一：CMTimeMake(a,b) a当前第几帧, b每秒钟多少帧.当前播放时间a/b第二：例如CMTimeMake(60, 30); 第二秒CMTimeMake(30, 15);第二秒两个都是代表第二秒的影片但是第一个播放速度是第二个二倍_cmtimemake

关于fastjson 对象转json出现$ref_"fastjson 转的json,\"$ref\":\"$. jsjson.parse("-程序员宅基地

文章浏览阅读781次。现在微服务、前后分离什么的那么流行，多数新的程序在返数据给前端的时候直接返回json 数据，这样json工具就有用武之地了常用的json工具有 org.json、Gson 、albaba的fastjson。昨天本来是用fastjson 对象转json了，发现有些重复引用的对象会如下展示{"$ref":"$.data.list[0].list[34]"} 看着就像是坐标，这..._"fastjson 转的json,\"$ref\":\"$. jsjson.parse("

禾川Q1系列PLC官方教程_禾川学院培训资料-程序员宅基地

文章浏览阅读3.2k次。禾川Q系列PAC教程_禾川学院培训资料

Eclipse详细安装教程_eclipse的安装步骤-程序员宅基地

文章浏览阅读9.3k次，点赞7次，收藏26次。Eclipse安装教程前言一、Eclipse是什么？二、安装步骤1. Eclipse下载下载网址2. Eclipse安装前言Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。一、Eclipse是什么？Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。二、安装步骤1. E_eclipse的安装步骤