技术标签: 机器学习 计算机视觉 图像处理 深度学习 目标检测 人工智能
作者简介: CSDN、阿里云人工智能领域博客专家,新星计划计算机视觉导师,百度飞桨PPDE,专注大数据与AI知识分享。公众号:GoAI的学习小屋 ,免费分享书籍、简历、导图等,更有交流群分享宝藏资料,关注公众号回复“加群”或️链接 加群。
AI学习星球推荐: GoAI的学习社区 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!加入星球️点击链接
说明:本系列深度学习资料集合包含机器学习、深度学习等各系列教程,主要以计算机视觉资料为主,包括图像识别、分类、检测、分割等,内容参考Github及网络资源,仅供个人学习。侵权联系删除!
深度学习定义:一般是指通过训练多层网络结构对未知数据进行分类或回归
深度学习分类:
有监督学习方法——深度前馈网络、卷积神经网络、循环神经网络等;
无监督学习方法——深度信念网、深度玻尔兹曼机,深度自编码器等。
图像分类(物体识别):整幅图像的分类或识别
物体检测:检测图像中物体的位置进而识别物体
图像分割:对图像中的特定物体按边缘进行分割
图像回归:预测图像中物体组成部分的坐标
语音识别:将语音识别为文字
声纹识别:识别是哪个人的声音
语音合成:根据文字合成特定人的语音
语言模型:根据之前词预测下一个单词。
情感分析:分析文本体现的情感(正负向、正负中或多态度类型)。
神经机器翻译:基于统计语言模型的多语种互译。
神经自动摘要:根据文本自动生成摘要。
机器阅读理解:通过阅读文本回答问题、完成选择题或完型填空。
自然语言推理:根据一句话(前提)推理出另一句话(结论)。
图像描述:根据图像给出图像的描述句子
可视问答:根据图像或视频回答问题
图像生成:根据文本描述生成图像
视频生成:根据故事自动生成视频
手写机器学习笔记 github
机器学习算法公式推导以及numpy实现 github
人工智能相关术语 link
周志华《机器学习》手推笔记 github
机器学习算法 基于西瓜书以及《统计学习方法》 github
机器学习与深度学习基础概念介绍 link
怎样写一个深度学习框架 link
深度学习算法地图 link
卷积神经网络的感受野 link
「深」为什么重要,以及还有什么深的网络 link
深度学习入门之激活层及其选择的建议 link
深度学习如何优化神经网络结构|架构 link
深度学习“科学炼丹”手册 link
深度学习训练tricks整理 数据增强等技巧 link
pytorch图卷积库 github
AI模型序列化总结 github
AiLearning 传统机器学习的讲解、分析和代码github
CNN真的需要下采样(上采样)吗? link
构建深度神经网络,我有20条「不成熟」的小建议 link
feature map 相加和拼接的不同 link
你有哪些deep learning(rnn、cnn)调参的经验? link
目标检测的综述 link
常见的模型算法评估指标 link
GAN万字长文综述 link
神经网络压缩综述 link
细粒度图像分析综述 link
人脸识别损失函数综述 link
OCR papernote github
图像分割综述 link
图像内容鉴黄算法综述 link
AI技术三大应用领域:智能医疗、自动驾驶、智慧营销产业发展现状分析 link
深度学习模型在各大公司实际生产环境的应用讲解文章 github
AlexNet
ImageNet Classification with Deep Convolutional Neural Networks
中文版
中英文对照
VGG
Very Deep Convolutional Networks for Large-Scale Image Recognition
中文版
中英文对照
ResNet
Deep Residual Learning for Image Recognition
中文版
中英文对照
GoogLeNet
Going Deeper With Convolutions
中文版
中英文对照
BN-GoogLeNet
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
中文版
中英文对照
Inception-v3
Rethinking the Inception Architecture for Computer Vision
中文版
中英文对照
轻量级卷积神经网络的设计技巧 link
MixNet-Pytorch github
ShuffleNet 官方开源github
为什么MobileNet及其变体如此之快 github
dabnn 二值网络 github
神经网络量化简介 github
手机端高性能卷积神经网络推理引擎概览 github
学习参考(强推):link
损失函数技术总结 link
根据标签分布来选择损失函数 link
深度学习多目标优化的多个loss应该如何权衡 link
归一化方法总结 link
Kaggle图像分割比赛中的损失函数及keras实现 link
11个重要的机器学习模型评估指标 link
IQA-optimization 图像质量的损失函数 github
regression-losses-pytorch github
分类回归损失函数汇总 link
Learned Perceptual Image Patch Similarity (LPIPS) metric github
超分损失函数小结 link
DataGene - 识别数据集之间的相似度 github
FAT:一种快速的Triplet Loss近似方法,学习更鲁棒的特征表示,并进行有噪声标签的提纯 link github
用于医学图像分割的损失函数 link
目标检测回归损失函数简介:SmoothL1/IoU/GIoU/DIoU/CIoU Loss [link]
CNN模型合集 link
分类实现合集 pytorch github
让CNN有了平移不变性 link
lottery-ticket-hypothesis github
pytorch_image_classification github
deeplearning-modelsgithub
EfficientNets-PyTorch 2019 github
ML_GCN PyTorch implementation of Multi-Label Image Recognition with Graph Convolutional Networks, CVPR 2019 github
pytorch_highway_networks github
推崇的CNN架构 link
图卷积网络Numpy实现 link
PeleeNet-基于手机系统的实时网络 link
TResNet: High Performance GPU-Dedicated Architecture github
ResNeSt 李沐团队提出最强ResNet改进版,多项任务达到SOTA github
SCNet - PyTorch官方实现CVPR 2020论文“使用自校准卷积改进卷积网络” github
SimCLR 对比学习得到一个好的视觉预训练模型 link
SimCLR框架的理解和代码实现以及代码讲解 link
RepVGG 2021 link
github nightly torch_stable pytorch_lightning
opencv基础教程csdn
OpenCV中文官方文档 link
facechanging 变脸 github
AI美颜系列 CSDN
图像处理算法 博客园
图像的模糊检测方法 link
图像保边滤波算法集锦系列 github
只(挚)爱图像处理 link
Photoshop 算法原理 link
图像处理初学者设计的 100 个问题 github
YOLO
You Only Look Once: Unified, Real-Time Object Detection
中文版
中英文对照
YOLO9000
YOLO9000: Better, Faster, Stronger
中文版
中英文对照
Deformable-ConvNets
Deformable Convolutional Networks
中文版
中英文对照
Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
中文版
中英文对照
R-FCN
R-FCN: Object Detection via Region-based Fully Convolutional Networks
中文版
中英文对照
目标检测之Neck选择 link
详解目标检测中边界框的回归策略 link
目标检测中的特征冲突与不对齐问题 link
小目标检测学习汇总 link
在物体检测中搞定小目标 link
在目标检测中如何解决小目标的问题? link
目标检测中Anchor的本质分析 github
利用YOLOv3结合行人重识别模型,实现行人的检测识别,查找特定行人 github
CBNet:一种用于目标检测的复合骨干网络体系结构 2019 github
单级目标检测:YOLO与SSD,我选SSD!!! link
【SSD算法】史上最全代码解析-核心篇 github
MXNet的一个开源项目gluoncv里的yolov3代码,写了一份中文注解 github
faster-rcnn pytorch github
Why anchor link
Double-Head RCNN 通过增加多个head提升准确率github
对YOLOv3做模型剪枝 pytorch 2019 github
simpledet NAS-FPN 2019 mxnetgithub
PoolNet pytorch 2019 github
2018云从人头技术 冠军方案分享 github
目标检测进化史 link
ThunderNet: 轻量级实时检测网络
mmdetection github
Rapid satellite imagery object detection 2018 github
Yolo系列检测器的pytorch实现 github
awesome-object-detection github
deep_learning_object_detection github
RFCN_CoupleNet pytorch github
Yolo-v2 pytorch github
RFBNet pytorch github
CFENet pytorch github
BiSeNet pytorch github
kaggle 大白鲸目标检测 github
R-FCN+ResNet-50用自己的数据集训练模型 link
trident net + refinedet 目标检测 github
基于SSD框架在建筑工地上检测安全帽的佩戴并识别安全帽的相应颜色 link
基于 Mask R-CNN 的街景广告检测与模糊 tensorflow github
yolov3通道和图层修剪 github
YOLOv3+ASFF(自适应空间特征融合)组合,性能优于CornerNet和CenterNet等 github
使用通道修剪的Stronger-Yolo的Pytorch实现 github
Gaussian YOLOv3的PyTorch实现 github
PyTorch实现的EfficientDet(可扩展且高效的对象检测) github
Kaggle RSNA肺炎检测挑战赛中第一名解决方案的代码 github
天池大赛项目:天池新品实验室 - 淘宝直播商品识别 github
只用一页jupyter notebook完成Faster RCNN github
Pytorch版本中的Faster RCNN模型,已在ResGen 101的Visual Genome上进行了预训练 github
Faster-Rcnn:Two-Stage目标检测模型在Pytorch当中的实现 github
Scale-equalizing Pyramid Convolution for object detection github link
End-to-End Object Detection with Transformers 2020 github
yolov5 github
YOLOv3使用笔记——Kmeans聚类计算anchor boxes link
YOLO v4训练自己的数据集 link
深入浅出Yolo系列之Yolov3&Yolov4&Yolov5核心基础知识完整讲解 link
深入浅出Yolo系列之Yolov5核心基础知识完整讲解 link
You Only Look Twice: Rapid Multi-Scale Object Detection In Satellite Imagery 卫星图片多尺寸物体检测 link github
目标检测和感受野的总结和想法 link
目标检测算法anchor聚类实现(coco+voc)
小目标检测学习 link
BBAVectors:一种Anchor Free的旋转物体检测方法 link
Repulsion Loss 遮挡场景下的目标检测 link
mmdetection-mini github
1.8M超轻量目标检测模型NanoDet link
基于密度图的航空物体检测 link
Image-Level 弱监督图像语义分割汇总简析 link
CRNN
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
中文版
中英文对照
CTPN
Detecting Text in Natural Image with Connectionist Text Proposal Network
中文版
中英文对照
数学公式识别:基于编码-解码模型 link
MaskTextSpotter - 端到端可训练神经网络,用于发现任意形状文本的一个PyTorch实现 github
Text_Segmentation_Image_Inpainting 文件检测并修复 github
手写公式识别 :基于深度学习的端到端方法 github
基于MXNet的CTPN 身份证 github
深度学习实践文档检测 link
PyTorch实现的DenseBox多任务学习目标检测/关键点定位 github
增值税发票识别系统(OCR System of Invoice) link
文字相似度函数 pytorch github
深度学习与OCR论文合集 link
CCPD 车牌端对端识别及其250k的数据集 github
aster.pytorch github
Seq2Seq+Attention 中文OCR文字识别 pytorch github
A research project for text detection and recognition using PyTorch 1.2 github
AttentionOCR 2019 ocr检测和识别冠军 github
ABCNet - 利用自适应贝塞尔曲线网络实现的实时场景文本识别 github
运用unet实现对文档表格的自动检测,表格重建 github
条形图检测和坐标识别 github
超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅17M github windows
通过Transformer实现的识别场景文本 github
pytorch_ctpn github
chinese_ocr CTPN + DenseNet + CTC github
一个基于CTPN+CRNN的OCR项目 github
更轻量的中文OCR github
汉字字符特征提取工具,可以提取出字符中的字音(声母、韵母、声调)、字形(偏旁、部首)、四角编码等特征,同时可作为tensor输入到模型 github
TextGenerator - OCR/文字检测/字体识别数据生成工具 github
《深度实践OCR:基于深度学习的文字识别》 随书代码 github
Table-OCR github
支持40+种语言和本地运行,这个OCR库轻松搞定光学字符识别 github
MaskTextSpotterV3端到端文本识别模型 github
手写及场景文字分析与识别的一些新尝试 link
PyTorch OCR模型的安卓端部署 link
基于Transformer文本识别模型的网络架构 link
车牌识别 模型部署翻车记:pytorch转onnx踩坑实录 link
古籍文档图像二值化:基于背景估计和能量最小化的方法 link
金山OCR识别框架KSAI-Toolkits [github](kingsoft-wps/KSAI-Toolkits (github.com))
Lightweight Image Super-Resolution with Information Multi-distillation Network (ACM MM 2019) github
图像超分:RealSR link
Open MMLab Image and Video Super-Resolution Toolbox, , including SRResNet, SRGAN, ESRGAN, EDVR, etc. MMSR:基于PyTorch的图像/视频超分辨率工具箱 github
FALSR 2019 小米 github
FixRes github
noise2noise-pytorch github
Pytorch实现多帧超分辨率(MFSR)网络HighRes-net github
去模糊GAN DeblurGANv2 github
High-Quality Self-Supervised Deep Image Denoising 2019 github
ABPN pytorch 2019 github
super-resolution github
超分辨率损失函数 link
使用具有批量重新归一化的深度CNN进行图像去噪 tensorflow 2019 github
Dandere2x github
Waifu2x-Extension-GUI github
generative_inpainting fillv2 github
srmd ncnn vulkan 通用图片超分放大工具 github
PyTorch实现“通过超高分辨率实现无损图像压缩” github
图像去模糊系列算法 link
MMSR 是基于PyTorch的开源图像和视频超分辨率工具箱,包括SRResNet,SRGAN,ESRGAN等 github
去雨网络(PReNet) github
2020年超越RCAN,图像超分又一峰 link
Software and pre-trained models for automatic photo quality enhancement using Deep Convolutional Networks github link
Deep Unfolding Network for Image Super-Resolution (CVPR, 2020) (PyTorch) github link
Generating RGB photos from RAW image files with PyNET (PyTorch) github
ZSSR link
2020超分辨算法CFSRCNN
如何恢复降采样后的高清图片?可逆图像缩放搞定 github
SRGAN
Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
中文版
中英文对照
ESRGAN
ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks
中文版
中英文对照
arcmargin loss
triplet loss
quadruplet loss
eml loss
npairs loss
度量学习中关于排序损失函数的综述 link
在应用中使用度量学习的最简单方法,具有模块化、灵活和可扩展,采用PyTorch编写 link
注:本资料集合包含机器学习、深度学习等各系列教程,深度学习方向主要计算机视觉资料为主,内容参考Github及网络资源,后续会补充,仅供个人学习,侵权联系删除!
文章浏览阅读712次。视频播放器原理 什么是ffmpeg? ffmpeg 音视频编/解码 流程图 ffmpeg 常用 struct AVFormatContext AVStream AVCodecContext AVCodec AVPacket AVFrame ffmpeg 常用Api av_register_all() avformat_alloc_output_context2() avio_open()..._视频效果演示系统的核心技术
文章浏览阅读449次。Java List集合多种情况处理方法:List集合交集、并集、差集、去重、与数组互转、删除、排序等操作_java list reduce
文章浏览阅读2.3k次,点赞77次,收藏80次。需求:指人对客观事务需要的表现,体现为愿望、意向和兴趣,因而成为行动的一种直接原因。软件需求(IEEE软件工程标准词汇表):(1)用户解决问题或达到目标所需的条件或能力。(2)系统或系统部件要满足合同、标准、规范或者其他正式规定文档所需具有条 件或能力。(3)对(1)或(2)中的一个条件或一种能力的一种文档化表述。用例:定义 1 用例是对一个活动者使用一个系统的一项功能时进行交互过程中的一个文字描述序列。_uml需求文档访客管家
文章浏览阅读574次。第三章、Linux根文件系统及文件管理命令详解02_03_Linux根文件系统详解文件系统:rootfs: 根文件系统 FHS:Filesystem Hierarchy Standard(文件系统目录标准)的缩写,多数Linux版本采用这种文件组织形式,类似于Windows操作系统中c盘的文件目录,FHS采用树形结构组织文件。FHS定_根文件系统文本登陆
文章浏览阅读358次。马克 · 扎克伯格期望的元宇宙到底会是什么样子?_马克扎克伯格博客
文章浏览阅读1.4w次,点赞8次,收藏78次。本文接上一篇文章 使用Python开发游戏运行脚本(一)成功调用大漠插件上一篇我们已经简单实现了python调用大漠插件并输出版本号的功能,接下来我们要做的就是通过大漠插件模拟鼠标点击和键盘文字输入。 由于近年来最热门的游戏基本都是手游,所以我们也会以手游为例来进行游戏脚本的开发。大漠插件是一款针对Windows平台的鼠标键盘模拟+图文查找库,这样我们要想实现手游脚本开发的第一步,就是下载Android模拟器,然后在对安卓模拟器进行鼠标和键盘的模拟,以此来实现自动化游戏脚本。一、Android模拟器的_大漠窗口绑定成功按键
文章浏览阅读1k次。 利用Canvas的fillText(),隔一定时间在画布上作画<!DOCTYPE html><head> <meta charset="utf-8"> <meta name="viewport" content="width=device-width,initial-scale=1.0"> &_canvas画字符雨
文章浏览阅读1.1k次。微信公众号跳转微信小程序,自定义微信跳转标签_opentaglist
文章浏览阅读4.3k次。数据恢复技术与LVM数据恢复方法 1摘要 随着计算机网络应用的发展,数据存储的安全性变的越来越重要。在常见的基于RAID和LVM的环境下面,当出现硬盘故障或者错误操作导致数据丢失的情况下,采用适当的数据恢复策略可以在很大程度上提供数据恢复的成功概率。本文研究了几种情况下的数据恢复技术和方法,为数据恢复和数据安全的预防提供了指导。 2数据恢复需求 2.1Linux IO存储栈 图(1)Linux IO 存储..._vgreduce --removemissing恢复
文章浏览阅读307次。深度学习程序员想年薪百万,基础必须打牢,所以推荐重点书籍Deep Learning花书Deep Learning with PythonDeep Learning for Computer Vision with PythonScikit-Learn与TensorFLow机器学习实用指南深度学习实践Tensorflow机器学习指南..._年薪百万的程序员看什么书
文章浏览阅读1.3k次。一、使用clock()函数,获取毫秒级(ms)时间[1]#include <time.h>//clock()头文件clock_t start = clock();{statement section}//测试代码段clock_t end = clock();printf("the running time is :%fs\n", (double)(end -s..._large_integer nfreq, t1, t2;
文章浏览阅读6.8k次,点赞3次,收藏31次。 前言: 至于用哪个开发工具本文暂且不做任何讨论, 今天着重讲解IntelliJ IDEA这款开发工具的使用 前言:IntelliJ IDEA如果说IntelliJ IDEA是一款现代化智能开发工具的话,Eclipse则称得上是石器时代的东西了。其实笔者也是一枚从Eclipse转IDEA的探索者,随着近期的不断开发实践和调试,逐步..._idea使用视频教程