“为孩子们开发一个植物识别软件,满足他们对自然的好奇心。”陈明权这样谈及到他开发“形色”的初衷。
“形色”是一款基于人工智能深度学习技术实现的辨识花草App。用户上传花草照片,即可在手机端获知植物名称和寓意。
只是一个父亲的体验
2015年G20峰会在杭州筹备中。江南大道旁的盆栽每周更换,陈明权常带着一岁半的儿子在此散步。
“当时市面上已经出现识图引擎,但普遍准确率不高,”陈明权笑谈道,“当初我们搜寻紫薇这种植物时,百度给我们的照片却多是林心如。”因此,陈明权决定利用人工智能技术,研发一款能够满足人们花草知识科普的识花App。
前年年底,陈明权用4个星期,研发出识花App“形色”的雏形。
他使用人工智能深度学习模型(卷积神经网络CNN)“形色机器人”,从花草图像中自动学习并提取特征信息,从而能够分析出照片中描述的花草种类纲目。
最初版本的“形色机器人”的识别模型在训练中使用了约40万张的植物图像信息,这些图像信息主要从谷歌、百度的图片中抓取而来。最初验证评估表明,“形色”识花准确度约为40%。
起初,研发的产品在朋友间传播的反馈良好,受到这样的鼓舞后,陈明权决定把产品推广至市场。
不过,要使用深度学习技术,不断提高对花草识别的准确度,没有大量各色花草图像数据作为“教材”还不行。基于此,研发团队进驻各大植物论坛,向植物爱好者征集花草图片与数据信息。
“开始时,‘形色’的人工智能的程度还比较低,识别不准确。因此当时我们在机器识别后,需在后台人工辨别修正。”陈明权说,“那时,真的是叫‘人工’+‘智能’。”
用户100万,准确率90%
随着用户自身的口碑宣传,用户开始使用并自发给“形色”供图。机器人需要对植物花开前、绽放中、凋谢时各时期形态的图片数据进行深度学习。至此,“形色机器人”在吸收原有数据的基础上,已能够增量式地提升模型的性能。
用户只需要将拍摄的花草照片上传至形色App中,“形色”将图像数据导入后端的云平台进行识别计算,并反馈给用户三张花草图片作为参考。用户在给定的三张照片中,寻找与自己所见植物相同的图片后选定,“形色”告知用户选定的植物名称及寓意。流程用时将在1~3秒内。“我们下一步要实现的是,用户上传照片后,‘形色’直接告诉他你这是什么花”。
◆“形色”识花操作界面
目前,“形色”的识别率和识别种类得到提升,已能够识别出4000种植被种类,准确率约90%。
“我们已经不需要专人在后台进行再次辨别”。若用户对“识花机器人”给出的植物名称表示质疑,可以前往App“专家鉴定”板块中寻求其他用户或“形色”团队帮助。