一(yī)、AI机器感知解决(jué)机器(qì)理解世界的(de)问题。
1.机器(qì)视觉硬件可采集周围环境信息
目前常(cháng)用的视觉传感器主要(yào)有:摄像头(tóu)、ToF镜头和激(jī)光(guāng)雷达技术。
1)机(jī)器视觉相机
机(jī)器视(shì)觉相机的目(mù)的是将通过镜头投影到传感器的图(tú)像传(chuán)送到能够(gòu)储存、分析和(或者)显示的机器设备上(shàng)。可(kě)以用一个简单的(de)终端(duān)显示图像,例如利用计(jì)算(suàn)机系统(tǒng)显示、存储以及分析图像。
portant;" />
portant;" />
2)激光(guāng)雷达技术(shù)
激光雷达是一种(zhǒng)采用非(fēi)接触(chù)激光(guāng)测距技术的扫描式传感器,其工作原理(lǐ)与一般的(de)雷达系(xì)统类似,通(tōng)过发射(shè)激光光束(shù)来探测目标,并通过搜集反射回来的(de)光(guāng)束来形成点云和获取数据(jù),这些(xiē)数(shù)据经(jīng)光电处理后(hòu)可生成为精确的(de)三维立体图像。采用这(zhè)项技术,可以准确的获取高(gāo)精(jīng)度的物理空间环境(jìng)信(xìn)息,测距精度(dù)可达厘米级。
portant;" />
3)ToF摄像头(tóu)技术
TOF是飞(fēi)行时间(Time oFFlight)技术(shù)的缩写,即(jí)传感器发出(chū)经调制的近红外光,遇物体后反(fǎn)射(shè),传(chuán)感器(qì)通过计(jì)算光线发射和反射时(shí)间差或相位差,来换算被拍摄景物的距离,以产生(shēng)深度信息,此外再结合传统的相机拍摄,就(jiù)能(néng)将物体(tǐ)的三维(wéi)轮廓以不(bú)同颜色代表不同距离的地形图方式呈现出(chū)来。
目前ToF用在智能手机(jī)的后(hòu)置镜头中(zhōng),用来(lái)进行测距及AR应用为主(zhǔ)。
portant;" />
portant;" />
2.AI视(shì)觉技术算法帮助机器人识别周围环(huán)境
视觉技术包括:人脸技术、物体检测、视(shì)觉问答、图像(xiàng)描述、视觉嵌入(rù)式技术等(děng)。
(1)人脸(liǎn)技(jì)术(shù):人脸检测能(néng)快(kuài)速检测人脸并返回(huí)人脸(liǎn)框位置,准确识别多(duō)种人脸属性;人脸(liǎn)比对通过提取(qǔ)人脸(liǎn)的特征,计算两张人(rén)脸的相(xiàng)似度并给出(chū)相似(sì)度百分比;人脸查找是(shì)在一(yī)个指定人脸库(kù)中查找相(xiàng)似的人脸;给定一张(zhāng)照片,与指定人脸库中的N个人脸进(jìn)行比对,找(zhǎo)出最相似(sì)的一张脸或多张人(rén)脸。根据待识别人脸与现有人(rén)脸库中的人脸匹配程度,返(fǎn)回用户信息和(hé)匹(pǐ)配度,即1:N人(rén)脸(liǎn)检索。
portant;" />
(2)物(wù)体检测:基于深度学习及大规模图像训练的物体检测技术,可准确识别图片中的物体类别、位置、置信度等(děng)综合信息。
(3)视觉问答:视觉问答(VQA)系统(tǒng)可将图片和问题(tí)作为(wéi)输入,产生一条人类语言作为(wéi)输出。
portant;" />
portant;" />
(4)图像描(miáo)述:需要能够抓住图(tú)像的语义信息,并(bìng)生成人类可读的句子。
(5)视(shì)觉嵌入式技术:包括人体(tǐ)检测跟踪(zōng)、场(chǎng)景识别等。
portant;" />
portant;" />
3.SLAM技术赋予(yǔ)机器人更好的规划移(yí)动的能力
SLAM,全称叫做Simultaneous LocalizationAnd Mapping,中文叫做同时定位与建图。在SLAM理(lǐ)论中,第一个问题称为定位(Localization),第(dì)二个(gè)称为建图(Mapping),第(dì)三个则是随(suí)后的路径规划。通过机器视觉(jiào)的映射,机器(qì)人可以通过复杂的算法同时定(dìng)位并绘制出位(wèi)置环境的地图,通过SLAM技术可以有效解决规划不合理,路径规(guī)划无法覆盖所有地区,导致清洁效果一般的(de)问题。
portant;" />
当完全不含SLAM的时候,由于没有地图没有(yǒu)路径规划(huá),扫地机器人每次碰到障碍(ài)物会沿(yán)着随机方向折返,无法覆盖到(dào)每一个区域。当有SLAM的时候,可覆盖至(zhì)任意(yì)区域。此外,扫地机(jī)器人还配备摄像头,用来(lái)识别(bié)鞋、袜子、动(dòng)物粪便等(děng)物品,达到(dào)智能规(guī)避(bì)。
portant;" />
portant;" />
4. 基于ToF机器视觉的超宽带定(dìng)位技术
机(jī)器人(rén)中,基于(yú)ToF技术,主要(yào)可用来进行高(gāo)精度测距与定(dìng)位,目前(qián)常用的就(jiù)是超宽(kuān)带定(dìng)位技术。
UWB(超宽带)是一种无线通信(xìn)技术,可用于高精度测距与定位(wèi)。UWB 传感器(qì)精简设备分为(wéi)标(biāo)签(qiān)和基站两(liǎng)种。其(qí)基本工作方式是采用TOF(Time oFflight)的(de)方式来进行无线(xiàn)测(cè)距(jù),根据测距值快速准确(què)计算(suàn)出(chū)位(wèi)置。
portant;" />
二、AI自(zì)然语(yǔ)言处理是人机交互的重要技术
人类(lèi)获(huò)取(qǔ)信息的手(shǒu)段中90%依(yī)靠视觉(jiào),但表达自己的方(fāng)式90%依(yī)靠语言。语言是人机(jī)交互中最自然的方式(shì)。但是自然语言(yán)处理NLP 的难度很大,在语法、语义、文化中均存在差异,还有方言等(děng)非标准(zhǔn)的(de)语言产生。随着(zhe)NLP 的成(chéng)熟,人类(lèi)与机器的语音交互越来(lái)越便捷,也将推动机器人向(xiàng)更“智能(néng)化”发展(zhǎn)。
portant;" />
1. 语(yǔ)言(yán)技术的硬件(jiàn)主要依靠麦克风和扬声器(qì)实现
机器人的阵列式麦克风和扬声器技术已(yǐ)经比较成熟,随着近年智(zhì)能音箱+语音助手的快速发展,麦克风阵列和微型(xíng)扬声器被广泛使用。
portant;" />
portant;" />
在(zài)钢(gāng)铁侠陪伴(bàn)机器人中,与用户的语(yǔ)音交互都依(yī)靠麦克风阵列和扬声器,此类陪伴(bàn)机器人(rén)就如同会动的(de)“智能音箱”,拓展了边界形态。
2.AI自然语言处理NLP 算法仍是人类未来(lái)尚需攻(gōng)克(kè)的一(yī)大方向
目前对话机器(qì)人(rén)可分为通用对(duì)话机器人和专业领域对话机器人。自然语言处(chù)理的技术发展,将提升(shēng)机器人与人(rén)类的交(jiāo)互(hù)体验,让机器(qì)人显得更为“智能”。
portant;" />
三、AI深度(dù)学习(xí)算(suàn)法帮助机器人向产生自(zì)我意识中进化
1. 硬件(jiàn):AI芯片技(jì)术(shù)的发展,使机(jī)器(qì)人拥有(yǒu)更高算力
由(yóu)于摩尔定律的发展,单位面积(jī)芯片容纳的晶体(tǐ)管个数(shù)不断增长,推动芯片小(xiǎo)型化和AI算(suàn)力的提(tí)升。
此外,异构芯片如(rú) RISC-V 架构芯片的(de)产生,也为AI芯片(piàn)的算力提升提供了硬件支持。
portant;" />
2. 算法:AI深度学习算法(fǎ)是机器(qì)人的(de)未来
AI深度学习算法给予机器人通过输入变量学习的能力。未来的机(jī)器人能否拥有(yǒu)自(zì)主意识,需要AI技术的不断发展。
深度学习算法给机器人(rén)获得自我意识提出了一种可能性。通(tōng)过对(duì)神经网络模型(xíng)的训练,一些算法(fǎ)已经可以(yǐ)在单点的领域超越人类,AlphaGo 的成功,让我(wǒ)们看到人类在AI技术中,已可(kě)实现单类别的自(zì)我(wǒ)学习能力,并在一些领域,如“围棋、德州(zhōu)扑克、知识竞赛”等(děng)单个领(lǐng)域已经可以媲(pì)美(měi)甚至打败人(rén)类。
portant;" />
portant;" />
AI深(shēn)度学习(xí)算法,使机器(qì)人(rén)拥有了智(zhì)能决策的(de)能力,摆脱了之(zhī)前单(dān)一(yī)输入对应单一输出的编程逻辑,也让机器人更加“智(zhì)能”。
但是,机器人在(zài)“多模(mó)态(tài)”领域,仍无法与人类(lèi)媲美。特别是如嗅觉、味觉(jiào)、触觉、心理学等无法(fǎ)量化的信号,仍未能(néng)找到(dào)合理(lǐ)的量(liàng)化方式。
portant;" />
portant;" />
未来来(lái)看,多模态将是人工智能的未来。
四、AI+5G拓展(zhǎn)机器人的活动(dòng)边界,提供更大算力(lì)和更多存储(chǔ)空间,形成知识共享
1.4G时代,移动机器人(rén)的四大痛点(diǎn)
哈(hā)尔(ěr)滨工业大(dà)学的朱(zhū)晓蕊教授看来,现(xiàn)在的移动机器人(rén)存在四大痛(tòng)点:
1) 工作范围受限:只能在固定的范围内执行任务,构(gòu)建的地图不(bú)便(biàn)于共享,难以在大(dà)尺度环境(jìng)下工(gōng)作。
2) 业务(wù)覆盖受限:运算有(yǒu)限,识别性能仍需提(tí)升;能力有(yǒu)限,仅能发现(xiàn)问题,难以(yǐ)快(kuài)速批量部(bù)署。
3) 提供(gòng)服务受限(xiàn):复(fù)杂(zá)业务能力差,交互能力有待提高,特种业务(wù)部署效率低。
4) 运维成(chéng)本高(gāo):部署效率(lǜ)低,每(měi)个场景都需构(gòu)建地图(tú),规(guī)划路经,配备巡检任务等。
这四大痛(tòng)点,制约了(le)移动机器人在4G时代的渗透。总体来说,就是机器人(rén)仍需要更多的存储空间和更强的运算能(néng)力。5G的低延(yán)时、高速(sù)率、广连接将能够解(jiě)决目(mù)前的这些痛点。
2.5G对于移动机器人的赋能:
1)拓展机(jī)器人(rén)的工作范围
而5G对于机器人的最大(dà)赋能就是(shì)拓展了机器人的(de)物理边界,5G对于TSN(时间(jiān)敏(mǐn)感网络)的支持,使机器人的活动边界从家(jiā)庭(tíng)走向社会的方方面(miàn)面。
我们大可以想象未来(lái)人(rén)类(lèi)与机器(qì)人(rén)共同生活的场景(jǐng)。在(zài)物流、零售、巡检(jiǎn)、安保、消防、指挥交通(tōng)、医疗等方面,5G和AI都能(néng)够赋能机器人,帮助(zhù)人类实现智慧城市。
5G将推动远程手(shǒu)术机器(qì)人的发展(zhǎn):
· 2008年12月18日,利(lì)用(yòng)华为(wéi)和联通搭建的(de)5G网络,解放军医院完成了世界首例(lì)基于5G通信技术的远程机器人手术动物实验。
· 5G+手(shǒu)术(shù)机器人将帮助医生完成(chéng)一对多(duō),多(duō)对一的手术(shù),并且手术覆盖多场景。
portant;" />
2)为机器人提供更大算力和更多存(cún)储空(kōng)间(jiān),形成知识共享
5G对云机器人(rén)的推动(dòng),为机器人提供(gòng)更大算(suàn)力和更多存储空间:
· 弹性分配计(jì)算(suàn)资源:满足复杂环境(jìng)中的同(tóng)步(bù)定位和制图。
· 访(fǎng)问大量数据库(kù):识别和抓取物体;基于外(wài)包地图的长期定位。
· 形成知识共享(xiǎng):多(duō)机器人间形成知(zhī)识共(gòng)享。
portant;" />
portant;" />