联系我们
本公司研发的一种实用型系统,其可以通过识别摄像头拍摄的手势,并由此来操控机器人的基本动作。
该系统有AI系统和机器人操控2个部分构成。AI系统部分对摄像头拍摄的图像进行解析,以此完成对图像中的手势的识别。机器人操控部分是接收识别出的手势信息,然后将对应的动作向机器人发出指令。机器人操控与AI系统是各自完全的独立动作,通过无线通信的方式互相传达信息。
AI模型中使用了ResNet50进行图像分类。将ImageNet的学习数据转用至机器人操控的学习中,用Fine Turning方式训练手势识别数据库。此处使用的AI模型是由3200万参数的神经网络构成。如果使用搭载GeForce GTX 1080 Ti的PC进行CPU处理,20ms就可以处理识别一轮手势数据。因为能够进行如此迅速的识别,所以基本可以实时的操控机器人。
另外,应用系统中为了可以搭载更轻巧便宜的Raspberry Pi 3,对AI模型进行了轻便改造,压缩了1/10左右的参数。(330万参数) 但是,即使Raspberry Pi没有前述GPU那样庞大的处理能力,Raspberry Pi也可以达到1秒完成1轮的处理速度。虽然无法完成实时对接,但是可以广泛的应用于不要求应答速度的各种系统。
注记
AI系统使用了由7万张手部图像(学习:检验=6:4)构成的数据库。学习后的数据验证正确率达到了96%以上。但是,因为使用的数据库图片是由3名成年男性的手部照片构成,对儿童和女性的手部识别率还是相对较低。这是因为,使用于现行AI系统的数据库相对特定,也就是说对未学习过的手势的应用还比较困难。为了改善此缺点,需要将数据库中包含的冗长数据(或相似数据)删除,并且新增大小,形状,颜色等具有多数差异化的手势和嵌入各种背景中的手势,进行进一步的学习。
人工智能技术
通过AI技术,识别手写数字
知能技术株式会社成功研发了通过AI技术,对手写数字进行识别的系统
学到更多>>