人工智能数据标注 课件全套 项目1--4 认识数据标注---文本标注.pptx

人工智能数据标注 课件全套 项目1--4 认识数据标注---文本标注.pptx

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

人工智能数据标注

CONTENTS项目一认识数据标注项目三语音标注项目二图像标注项目四文本标注

项目一认识数据标注

概述本书按照整体项目、任务设计和完成过程展开,主要包括:图像标注、语音标注和文本标注三大项目,每一个项目里面由若干个任务构成。为了能够顺利地完成各项标注任务,本书以“必需、够用”为目标,在讲解操作任务之前,安排了相关的辅助任务。本书内容关系,如图所示。

数据标注的知识和原则数据标注的定义数据标注是借助标注软件,对人工智能学习数据进行加工和运用的行为。数据标注工程师和人工智能产品训练师都需要收集数据用来形成知识库,进而完成数据标注。根据标注对象的不同,标注的分类也不相同,一般可分为图像标注、语音标注和文本标注。典型的图像标注,如图所示。图(a)为人物原图,图(b)为标注后的图像。(a)人物原图(b)标注后的图像

数据标注的知识和原则图像标注随着科技的进步,图像作为信息传播的重要媒介,在智能监测、智能搜索引擎、无人驾驶、医学影像分析、航天、遥感等多个领域得到了广泛的研究,并在社会和经济生活中承担着越来越重要的角色。人们不断深入研究图像,促进了计算机视觉的发展。图像的基本概念如下。(1)像素。图像可以用矩阵来表示,矩阵中的一个元素代表图像空间中的一个点,称为像素(Pixel)。像素的大小与图像的分辨率有关,分辨率越高,图像就越清晰。(2)分辨率。分辨率是衡量图像细节表现力的技术参数。分辨率分为显示分辨率、图像分辨率和输出分辨率三种。通常所说的图像大小指的是图像的显示分辨率的大小。比如1K图像的分辨率为1920×1080,2K图像的分辨率为2048×1080,4K图像的分辨率为4096×2160。图像的分辨率越大,需要的存储空间也越大。(3)像素坐标系。像素坐标系u-v中,左上角的原点O对应坐标为(0,0),横坐标u和纵坐标v分别是图像所在的行和列。在视觉处理库OpenCV中,u坐标对应x坐标,v坐标对应y坐标。像素坐标系所示。(4)灰度图像。灰度图像是对彩色图像进行灰度化处理后的图像。由于很多模型对图像颜色的依赖性不高,通常可以先对彩色图像进行灰度化预处理用来去除彩色信息。这不仅能提高图像处理的鲁棒性,还可以提高图像处理的速度。灰度图像的每个像素信息是由一个量化的灰度级来描述的,没有彩色信息;而彩色图像(如RGB图像)中的每个像素信息则是由RGB三原色构成的,分别通过三个不同的灰度级来描述。灰度图像。(5)二值图像。二值图像的数据足够简单,只有两个值。二值图像的每个像素只能是黑或白,没有中间的灰度级过渡,像素值为0或255。二值化就是将彩色图像变成二值图像的过程。最常用的二值化处理,就是选取一个阈值,大于它的像素值就视为白色,小于它的像素值就视为黑色。二值图像。

数据标注的知识和原则图像标注随着科技的进步,图像作为信息传播的重要媒介,在智能监测、智能搜索引擎、无人驾驶、医学影像分析、航天、遥感等多个领域得到了广泛的研究,并在社会和经济生活中承担着越来越重要的角色。人们不断深入研究图像,促进了计算机视觉的发展。图像的基本概念如下。(6)色彩空间。不同的色彩空间采用不同的颜色表示方式,最常用的色彩空间是RGB色彩空间,除此之外还有HSV色彩空间、YUV色彩空间等。色度学理论认为,任何颜色均可由红、绿、蓝三种基本颜色混合得到。图像也可用红、绿、蓝三原色来表示。例如,RGB色彩空间中的R表示Red(红色),G表示Green(绿色),B表示Blue(蓝色)。这三种颜色以不同的量进行叠加,就可以显示出所有颜色。RGB颜色叠加,如图1-6所示。HSV色彩空间则是由Hue(色调)、Saturation(饱和度)、Value(明度)组成。YUV色彩空间是由一个Y(亮度)和两个UV(色度)决定的。(7)感兴趣区域。在图像处理的过程中,人们可能会对图像中的某个特定区域感兴趣,也只对该区域进行操作。例如,对于过道里安装的监控系统,其中的相机是固定安装的,感兴趣区域就选取行走区域。另外,感兴趣区域可以是任意形状的,如四边形或其他任意多边形。(8)图像保存格式。图像的常用格式包括:BMP、JPEG、GIF和PNG。其中,BMP格式为图像的非压缩格式。

数据标注的知识和原则图像标注的知识图像标注是利用视觉传感器采集到的图像,通过专门的标注软件转换成相应的语言描述,本质上类似于“看图说话”的过程。随着计算机视觉技术和卷积深度学习网络的发展,图像标注的需求与日俱增。一个好的模型,往往需要使用大量准确的标注数据进行训练,如自动驾驶中的车道识别、行人识别,智能安防中的人脸识别、步态识别、行为识别等。看图说话对于小朋友来说很容易掌握,但对于机器而言却是一个很大的挑战。机器无法像人一样的思考,但是可以通过大量标注数据对

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档