入门 labelImg 数据标注
小科普
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
什么是数据标注
数据标注种类繁多,如分类、拉框、注释、标记等等。想要理解数据标注,就得先理解什么是AI ,其实是部分替代人的认知功能。
小编带大家回想一下我们是如何学习的,例如我们学习认识飞机,那么就需要有人拿着一个飞机的图片到你面前告诉你,“看,这是飞机”。从此以后,不管你是在电视里还是在机场,只要你见到了飞机,你就会知道这玩意儿叫做 " 飞机 "。
同理可证,类比机器学习,我们要教它认识飞机,同样的,直接给它一张飞机的图片,它完全不知道这是个啥玩意的,这可怎么办呢?这跟人脑还是有点差距的啊!
什么?差距?没有的事儿,只是你的打开方式不对!
你听小编慢慢道来,首先,我们得有张飞机的图片,并且上面得标注着 " 飞机 " 两个字,然后机器通过学习了无数张飞机图片中的特征,直到它可以自行识别飞机,这时候我们再给机器任意一张飞机的图片,它就能认出来这是飞机了。
训练集和测试集,它们都是标注过的数据。
还是以飞机为例子,假设我们有 1000 张标注着 " 飞机 " 的图片,那么我们可以拿 900 张作为训练集,100 张作为测试集。
机器从 900 张飞机的图片中学习得到一个模型,然后我们将剩下的 100 张机器没有见过的图片去给它识别,那么我们就能够得到这个模型的准确率了。
想想我们上学的时候,考试题与平时我们做过的练习题总是有些出入的。当然,变换题型才能测试出学习的真正效果,这样就不难理解为什么要划分一个测试集了。
我们都知道机器学习分为有监督学习和无监督学习。
无监督学习的效果是不可控的,常常是被用来做探索性的实验。而在实际产品应用中,通常使用的是有监督学习。那么有监督的机器学习就需要有标注的数据来作为先行经验了。
小编这节“数据标注课”讲得怎么样呢?!
下面给大家看一下标注实例(操作):
使用软件及平台为Python Anaconda
标注软件为开源项目 labelImg: https://github.com/tzutalin/labelImg
1、准备标注
2、标注进行时——人体拉框1
3、标注进行时——人体拉框2
4、已完成的标注图
labelImg 快捷操作
快捷键 | 功能 |
---|---|
Ctrl + u | 加载标注图片路径 |
Ctrl + r | 更改标注结果文件路径 |
Ctrl + s | 保存 |
Ctrl + d | 拷贝标注框标签 |
Space | 将当前图像标记为已验证 |
w | 创建框 |
d | 下一张图片 |
a | 上一张图片 |
del | 删除选定的框 |
Ctrl++ | 放大 |
Ctrl– | 缩小 |
↑→↓← | 键盘箭头微调框 |
标注软件为开源项目 labelme: https://github.com/wkentaro/labelme
# Build the standalone executable
conda create --name labelme python==3.6.0
conda activate labelme
在终端中输入:labelme,就可以打开 labelme 这个软件了。
参考文章
推荐阅读
-
入门 labelImg 数据标注
-
tensorflow入门之mnist手写数据集识别
-
mysql入门教程 博客分类: 数据库mysql mysql常用操作收集入门教程
-
Zend Framework入门教程之Zend_Db数据库操作详解
-
基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解
-
Python入门_浅谈数据结构的4种基本类型
-
PHP入门教程之使用Mysqli操作数据库的方法(连接,查询,事务回滚等)
-
redis入门第二篇-------redis五种数据类型及常使用命令
-
Python入门_浅谈数据结构的4种基本类型
-
MyBatis入门之增删改查+数据库字段和实体字段不一致问题处理方法