笔尖笔帽检测1：笔尖笔帽检测数据集(含下载链接)_圆珠笔数据集-程序员宅基地

技术标签：笔尖笔帽笔尖检测笔尖检测数据集手指指尖深度学习笔帽检测数据集笔尖点读

笔尖笔帽检测1：笔尖笔帽检测数据集(含下载链接)

1. 前言

2. 手笔检测数据集

（1）Hand-voc1

（2）Hand-voc2

（3）Hand-voc3

（4）Hand-Pen-voc手笔检测数据集

5. 笔尖笔帽关键点检测(Python/C++/Android)

6.特别版: 笔尖指尖检测

1. 前言

目前在AI智慧教育领域，有一个比较火热的教育产品，即指尖点读或者笔尖点读功能，其核心算法就是通过深度学习的方法获得笔尖或者指尖的位置，在通过OCR识别文本，最后通过TTS（TextToSpeech）将文本转为语音；其中OCR和TTS算法都已经研究非常成熟了，而指尖或者笔尖检测的方法也有一些开源的项目可以参考实现。本项目将实现笔尖笔帽关键点检测算法，其中使用YOLOv5模型实现手部检测（手握着笔目标检测），使用HRNet，LiteHRNet和Mobilenet-v2模型实现笔尖笔帽关键点检测。项目分为数据标注，模型训练和Android部署等多个章节，本篇是项目《笔尖笔帽检测》系列文章之笔尖笔帽检测数据集说明；

项目收集了手笔检测数据集和笔尖笔帽关键点检测数据集：

手笔检测数据集（Hand-Pen Detection Dataset）：共收集了四个：Hand-voc1，Hand-voc2和Hand-voc3，Hand-Pen-voc手笔检测数据集总共约7万张图片；标注格式统一转换为VOC数据格式，手部目标框标注为hand，手握着笔的目标框标注为hand_pen，可用于深度学习手部目标检测模型算法开发
笔尖笔帽关键点检测数据集（Pen-tip Keypoints Dataset）：收集了1个数据集：dataset-pen2，标注了手握笔(hand_pen)的目标区域和笔的两端(笔尖和笔帽)；数据集分为测试集Test和训练集Train，其中Test数据集有1075张图片，Train数据集有28603张图片；标注格式统一转换为COCO数据格式，可用于深度学习笔尖笔帽关键点检测模型训练。
数据收集和标注是一件十分繁杂且又费时费力的工作，请尊重我的劳动成果。

【尊重原则，转载请注明出处】 https://blog.csdn.net/guyuealian/article/details/134070255

Android笔尖笔帽关键点检测APP Demo体验：

https://download.csdn.net/download/guyuealian/88535143

更多项目《笔尖笔帽检测》系列文章请参考：

笔尖笔帽检测1：笔尖笔帽检测数据集(含下载链接)https://blog.csdn.net/guyuealian/article/details/134070255
笔尖笔帽检测2：Pytorch实现笔尖笔帽检测算法(含训练代码和数据集)https://blog.csdn.net/guyuealian/article/details/134070483
笔尖笔帽检测3：Android实现笔尖笔帽检测算法(含源码可是实时检测)https://blog.csdn.net/guyuealian/article/details/134070497
笔尖笔帽检测4：C++实现笔尖笔帽检测算法(含源码可是实时检测)https://blog.csdn.net/guyuealian/article/details/134070516

2. 手笔检测数据集

项目已经收集了四个手笔检测数据集（Hand-Pen Detection Dataset）：Hand-voc1，Hand-voc2和Hand-voc3和Hand-Pen-voc，总共约7万张图片

（1）Hand-voc1

Hand-voc1手部检测数据集，该数据来源于国外开源数据集，大部分数据是室内摄像头摆拍的手部数据，不包含人体部分，每张图只含有一只手，分为两个子集：训练集(Train)和测试集(Test)；其中训练集(Train)总数超过30000张图片，测试集(Test)总数2560张；图片已经使用labelme标注了手部区域目标框box，标注名称为hand，标注格式统一转换为VOC数据格式，可直接用于深度学习目标检测模型训练。

（2）Hand-voc2

Hand-voc2手部检测数据集，该数据来源于国内开源数据集，包含人体部分和多人的情况，每张图含有一只或者多只手，比较符合家庭书桌读写场景的业务数据集，数据集目前只收集了980张图片；图片已经使用labelme标注了手部区域目标框box，标注名称为hand，标注格式统一转换为VOC数据格式，可直接用于深度学习目标检测模型训练。

（3）Hand-voc3

Hand-voc3手部检测数据集来源于国外HaGRID手势识别数据集；原始HaGRID数据集十分庞大，约有55万张图片，包含了18种常见的通用手势；Hand-voc3数据集是从HaGRID数据集中，每种手势随机抽取2000张图片，总共包含18x2000=36000张图片数据；标注格式统一转换为VOC数据格式，标注名称为hand，可直接用于深度学习目标检测模型训练。

关于HaGRID数据集请参考文章：HaGRID手势识别数据集使用说明和下载

（4）Hand-Pen-voc手笔检测数据集

Hand-Pen-voc手笔检测数据集，该数据是项目专门收集含有手部和书写工具笔的数据，大部分图片数据都含有一只手，并且是手握着笔练习写字的情况，其中书写工具笔的种类包含钢笔、铅笔、中性笔、记号笔等，十分符合学生写字/写作/做笔记/做作业的场景数据。数据集目前共收集了16457张图片；图片已经使用labelme标注了两个目标框hand和hand_pen，标注格式统一转换为VOC数据格式，可直接用于深度学习目标检测模型训练。

目标框hand: 手部目标框，仅当只有手且没有握着笔的情况下才标注为hand

目标框hand_pen：手握笔目标框，手握着笔正常书写的目标框；由于手握着笔写字，为了囊括笔的区域，标注手部区域目标框box，会比实际的手部要大点点

（5）手笔目标框可视化效果

需要pip安装pybaseutils工具包，然后使用parser_voc显示手部目标框的绘图效果

pip install pybaseutils

import os
from pybaseutils.dataloader import parser_voc

if __name__ == "__main__":
    # 修改为自己数据集的路径
    filename = "/path/to/dataset/Hand-voc3/train.txt"
    class_name = ['hand','hand_pen']
    dataset = parser_voc.VOCDataset(filename=filename,
                                    data_root=None,
                                    anno_dir=None,
                                    image_dir=None,
                                    class_name=class_name,
                                    transform=None,
                                    use_rgb=False,
                                    check=False,
                                    shuffle=False)
    print("have num:{}".format(len(dataset)))
    class_name = dataset.class_name
    for i in range(len(dataset)):
        data = dataset.__getitem__(i)
        image, targets, image_id = data["image"], data["target"], data["image_id"]
        print(image_id)
        bboxes, labels = targets[:, 0:4], targets[:, 4:5]
        parser_voc.show_target_image(image, bboxes, labels, normal=False, transpose=False,
                                     class_name=class_name, use_rgb=False, thickness=3, fontScale=1.2)

3. 笔尖笔帽关键点检测数据集

笔的种类繁多，材质颜色不一，但笔的外形基本是长条形状；项目没有直接标注笔的外接矩形框，而是将笔分为笔尖(笔头)和笔帽(笔尾)两个端点，这两个端点连接线，则表示整个笔身长度：

笔尖/笔头关键点：位于笔尖突出尖端点位置,index=0
笔帽/笔尾关键点：位于笔末端点中心点位置,index=1
手握笔标注框： box包含笔和手的区域，一般出现在手握着笔书写的情况，不考虑单独出现笔的情况，标注名称为hand_pen

（1）dataset-pen2

dataset-pen2笔尖笔帽关键点检测数据集，改数据由Hand-Pen-voc手笔检测数据集扩充采集获得，标注了手握笔(hand_pen)的目标区域和笔的两端(笔尖和笔帽)；大部分图片数据都含有一只手，并且是手握着笔练习写字的情况，其中书写工具笔的种类包含钢笔、铅笔、中性笔、记号笔等，十分符合学生写字/写作/做笔记/做作业的场景数据。数据集分为测试集Test和训练集Train，其中Test数据集有1075张图片，Train数据集有28603张图片；标注格式统一转换为COCO数据格式，可用于深度学习笔尖笔帽关键点检测模型训练。

（2）笔尖笔帽关键点可视化效果

需要pip安装pybaseutils工具包，然后使用parser_coco_kps显示手部和笔尖关键点的绘图效果

pip install pybaseutils

import os
from pybaseutils.dataloader import parser_coco_kps

if __name__ == "__main__":
    # 修改为自己数据集json文件路径
    anno_file = "/path/to/dataset/dataset-pen2/train/coco_kps.json"
    class_name = []
    dataset = parser_coco_kps.CocoKeypoints(anno_file, image_dir="", class_name=class_name,shuffle=False)
    bones = dataset.bones
    for i in range(len(dataset)):
        data = dataset.__getitem__(i)
        image, boxes, labels, keypoints = data['image'], data["boxes"], data["label"], data["keypoints"]
        print("i={},image_id={}".format(i, data["image_id"]))
        parser_coco_kps.show_target_image(image, keypoints, boxes, colors=bones["colors"],
                                          skeleton=bones["skeleton"],thickness=1)

4. 数据集下载

数据集下载地址：笔尖笔帽检测数据集(含下载链接)

数据集内容包含：

手笔检测数据集：包含Hand-voc1，Hand-voc2和Hand-voc3，Hand-Pen-voc手笔检测数据集总共约7万张图片；标注格式统一转换为VOC数据格式，手部目标框标注为hand，手握着笔的目标框标注为hand_pen，可用于深度学习手部目标检测模型算法开发。
笔尖笔帽关键点检测数据集dataset-pen2，标注了手握笔(hand_pen)的目标区域和笔的两端(笔尖和笔帽)；数据集分为测试集Test和训练集Train，其中Test数据集有1075张图片，Train数据集有28603张图片；标注格式统一转换为COCO数据格式，可用于深度学习笔尖笔帽关键点检测模型训练。
数据收集和标注是一件十分繁杂且又费时费力的工作，请尊重我的劳动成果

5. 笔尖笔帽关键点检测(Python/C++/Android)

本项目基于Pytorch深度学习框架，实现手写工具笔端(笔尖和笔帽)关键点检测，其中手笔检测采用YOLOv5模型，手写工具笔端(笔尖和笔帽)关键点检测是基于开源的HRNet进行改进，构建了整套笔尖笔帽关键点检测的训练和测试流程；为了方便后续模型工程化和Android平台部署，项目支持轻量化模型LiteHRNet和Mobilenet模型训练和测试，并提供Python/C++/Android多个版本

Android笔尖笔帽关键点检测APP Demo体验：

https://download.csdn.net/download/guyuealian/88535143

6.特别版: 笔尖指尖检测

碍于篇幅，本文章只实现了笔尖笔帽关键点检测；实质上，要实现指尖点读或者笔尖点读功能，我们可能并不需要笔帽检测，而是需要实现笔尖+指尖检测功能；其实现方法与笔尖笔帽关键点检测类似。

下面是成功产品落地应用的笔尖+指尖检测算法Demo，其检测精度和速度性能都比笔尖笔帽检测的效果要好。

本文链接：https://blog.csdn.net/guyuealian/article/details/134070255

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

机器学习模型评分总结（sklearn）_model.score-程序员宅基地

文章浏览阅读1.5w次，点赞10次，收藏129次。文章目录目录模型评估评价指标1.分类评价指标acc、recall、F1、混淆矩阵、分类综合报告1.准确率方式一：accuracy_score方式二：metrics2.召回率3.F1分数4.混淆矩阵5.分类报告6.kappa scoreROC1.ROC计算2.ROC曲线3.具体实例2.回归评价指标3.聚类评价指标1.Adjusted Rand index 调整兰德系数2.Mutual Informa..._model.score

Apache虚拟主机配置mod_jk_apache mod_jk 虚拟-程序员宅基地

文章浏览阅读344次。因工作需要，在Apache上使用，重新学习配置mod_jk1. 分别安装Apache和Tomcat：2. 编辑httpd-vhosts.conf： LoadModule jk_module modules/mod_jk.so #加载mod_jk模块 JkWorkersFile conf/workers.properties #添加worker信息 JkLogFil_apache mod_jk 虚拟

Android ConstraintLayout2.0 过度动画MotionLayout MotionScene3_android onoffsetchanged-程序员宅基地

文章浏览阅读335次。待老夫kotlin大成,扩展:MotionLayout 与 CoordinatorLayout,DrawerLayout,ViewPager 的交互众所周知,MotionLayout 的动画是有完成度的即Progress ,他在0-1之间变化,一.CoordinatorLayout 与AppBarLayout 交互时,其实就是监听 offsetliner 这个偏移量的变化同样..._android onoffsetchanged

【转】多核处理器的工作原理及优缺点_多核处理器怎么工作-程序员宅基地

文章浏览阅读8.3k次，点赞3次，收藏19次。【转】多核处理器的工作原理及优缺点《处理器关于多核概念与区别多核处理器工作原理及优缺点》原文传送门　　摘要：目前关于处理器的单核、双核和多核已经得到了普遍的运用，今天我们主要说说关于多核处理器的一些相关概念，它的工作与那里以及优缺点而展开的分析。1、多核处理器　　多核处理器是指在一枚处理器中集成两个或多个完整的计算引擎（内核），此时处理器能支持系统总线上的多个处理器，由总..._多核处理器怎么工作

个人小结---eclipse/myeclipse配置lombok_eclispe每次运行个新项目都需要重新配置lombok吗-程序员宅基地

文章浏览阅读306次。1. eclipse配置lombok 拷贝lombok.jar到eclipse.ini同级文件夹下，编辑eclipse.ini文件，添加: -javaagent:lombok.jar2. myeclipse配置lombok myeclipse像eclipse配置后，定义对象后，直接访问方法，可能会出现飘红的报错。如果出现报错，可按照以下方式解决。 ..._eclispe每次运行个新项目都需要重新配置lombok吗

【最新实用版】Python批量将pdf文本提取并存储到txt文件中_python批量读取文字并批量保存-程序员宅基地

文章浏览阅读1.2w次，点赞31次，收藏126次。#注意：笔者在2021/11/11当天调试过这个代码是可用的，由于pdfminer版本的更新，网络上大多数的语法没有更新，我也是找了好久的文章才修正了我的代码，仅供学习参考。1、把pdf文件移动到本代码文件的同一个目录下，笔者是在pycharm里面运行的项目，下图中的x1文件夹存储了我需要转换成文本文件的所有pdf文件。然后要在此目录下创建一个存放转换后的txt文件的文件夹，如图中的txt文件夹。2、编写代码（1）导入所需库# coding:utf-8import ..._python批量读取文字并批量保存

随便推点

Scala:访问修饰符、运算符和循环_scala ===运算符-程序员宅基地

文章浏览阅读1.4k次。http://blog.csdn.net/pipisorry/article/details/52902234Scala 访问修饰符Scala 访问修饰符基本和Java的一样，分别有：private，protected，public。如果没有指定访问修饰符符，默认情况下，Scala对象的访问级别都是 public。Scala 中的 private 限定符，比 Java 更严格，在嵌套类情况下，外层_scala ===运算符

MySQL导出ER图为图片或PDF_数据库怎么导出er图-程序员宅基地

文章浏览阅读2.6k次，点赞7次，收藏19次。ER图导出为PDF或图片格式_数据库怎么导出er图

oracle触发器修改同一张表,oracle触发器中对同一张表进行更新再查询时，需加自制事务...-程序员宅基地

文章浏览阅读655次。CREATE OR REPLACE TRIGGER Trg_ReimFactBEFORE UPDATEON BP_OrderFOR EACH ROWDECLAREPRAGMA AUTONOMOUS_TRANSACTION;--自制事务fc varchar2(255);BEGINIF ( :NEW.orderstate = 2AND :NEW.TransState = 1 ) THENBEG..._oracle触发器更新同一张表

debounce与throttle区别及其应用场景_throttle和debounce应用在哪些场景-程序员宅基地

文章浏览阅读513次。目录概念debouncethrottle实现debouncethrottle应用场景debouncethrottle场景举例debouncethrottle概念debounce字面理解是“防抖”，何谓“防抖”，就是连续操作结束后再执行，以网页滚动为例，debounce要等到用户停止滚动后才执行，将连续多次执行合并为一次执行。throttle字面理解是“节流”，何谓“节流”，就是确保一段时..._throttle和debounce应用在哪些场景

java操作mongdb【超详细】_java 操作mongodb-程序员宅基地

文章浏览阅读526次。regex() $regex 正则表达式用于模式匹配，基本上是用于文档中的发现字符串（下面有例子）注意：若未加 @Field("名称") ，则识别mongdb集合中的key名为实体类属性名。也可以对数组进行索引，如果被索引的列是数组时，MongoDB会索引这个数组中的每一个元素。也可以对整个Document进行索引，排序是预定义的按插入BSON数据的先后升序排列。save: 若新增数据的主键已经存在，则会对当前已经存在的数据进行修改操作。_java 操作mongodb

github push 推送代码失败. 使用ssh rsa key. remote: Support for password authentication was removed._git push remote: support for password authenticati-程序员宅基地

文章浏览阅读1k次。今天push代码到github仓库时出现这个报错TACKCHEN-MB0:tc-image tackchen$ git pushremote: Support for password authentication was removed on August 13, 2021. Please use a personal access token instead.remote: Please see https://github.blog/2020-12-15-token-authentication_git push remote: support for password authentication was removed on august 1