【导读】我爱快包的第三次产品经理坐诊活动圆满结束,本次活动是针对语音识别和图像识别领域的前沿应用进行的探讨,我爱快包的特邀嘉宾和产品经理通过分析现状的技术和趋势,为我爱快包有需求的雇主们量身定制了最适合各自的需求文案。来具体看看本次活动都有哪些亮点吧~
语音识别已经成为了大公司之间的兵家必争之地,而由于其方便、几乎没有学习成本等特性,普遍被认为可以在某种程度上代表人机交互的未来。而图像识别作为机器“认识”世界的一种新方式,也一直令大家心向往之。但这样的交互方式的使用门槛很低,开发门槛却非常高,至今世界上可以说仍然没有一款完美的语音和图像识别产品。可是创客们从不会因为一个技术的实现困难就避而不做,相反,挑战困难正是创客精神中相当重要的一部分。因此仍然有无数的创客们在为实现高效的语音、图像识别和处理而努力。
语音识别三大巨头,Siri、微软小娜、Google Now
毕竟创客个人的力量是有限的,在创业过程中,肯定所有人都希望有人能帮助自己指出自己的失误,或者传授一些更好的方法和技巧。而我爱快包举办的产品经理坐诊正是为了帮助有想法的创客们梳理自己的想法,让其更容易实现。
本次活动大家讨论比较热烈的需求有三个:一是云中飞公司希望为他们的智能止鼾仪配备一个语音识别模块,用于识别用户发出的声音是否为鼾声。以此记录用户打鼾程度的改善情况和判断睡眠质量。让用户能更直观的体会到止鼾仪的好处。
对此本次活动的嘉宾图一科技的刘峰表示:此处识别的方式和一般的语音识别类似,都是将用户声音的特征与已经录入系统的声音的特征值匹配。识别鼾声,就是通过建立鼾声的音频特征库,再将录入的鼾声与之对比进行判断。技术上没有特别困难的地方。但是建立鼾声数据库可能需要花费一些精力。
威客们正在热烈的讨论
第二是睿视科技的陈总提出的安防摄像头的一个设想,在安防领域的应用,如防盗应用中,摄像头通常只能在事发后才能通过调用录像来调查事件,或者凭借其本身的存在给犯罪者一个不算太有效的心理震慑。而大多数时候无法对外来威胁做到主动防御。因此陈总希望让摄像头具备图像识别能力。让摄像头在发现可疑人员的时候主动报警。
最初的设想是在摄像头发现可疑人员的时候拍摄一段视频发送给用户,但视频占用的带宽太大了,因此此设想可行性很低。于是大家退而求其次,希望在发现可疑人员的时候抓拍照片发给用户。
这个需求是经过消费者反馈证明确实存在并且比较强烈的。但是实现起来仍然有一些障碍,经过陈总和威客们的讨论。认为问题主要出在两点:一是在现在的物业体系中,为安防设备买单的并不是最终的消费者,而是房地产商或物业公司,而他们对消费者的个性化需求并不特别在意,并且对成本相当敏感,因此并不会偏向于采购这种具有新功能的产品。另一点是目前图像识别的技术还不太成熟,受环境尤其是光照条件的影响很大。而且对人脸识别的人的角度等的要求也非常苛刻。因此效率无法得到保证。
而天启航空科技的付总则希望做一个应用于无人机的识图避障功能,在经过讨论会上的讨论梳理后,更是在我爱快包上发布了更新后更加确切的需求,寻找有能力完成的威客。
参与活动的大家的合影
如果您也对自己的想法有点看不太透彻,或者有问题没想明白,也欢迎您来参加我们的活动。相信我们能给您以一些启发。