亚马逊的Alexa到底神奇在哪里
|
语音助手包括了两个大的技术环节:语音识别(前端声学+后端识别)和语义理解(+内容聚合)。语音识别其实不涉及太多智能问题,仅仅只是AI的一个管道,智能的核心还是在于语义这个环节。语音识别和场景也密切相关,不同的场景需要不同的模型适配,这才能保证其识别率。语义更是需要场景的辅助,毕竟圈子的语言还是有很大差异性的。如果不能迈过这个门槛,语音交互的效能就会极具降低,对用户来说呈现不出来足够的吸引力。 另外一个问题就是语音助手本身也要定义一个性格,即便是冷冰冰的问答控制,也要让语音助手体现出个性来,这也包括语音合成的语调问题。比如苹果Siri很调皮,微软小冰很小色,亚马逊Echo很热心等等。当然,这更多是AI产品经理的任务,现在这个领域AI产品人才也是奇缺。 4 好的产品并不要100分的技术 Amazon的Echo显然不是百分的产品,其技术也远未成熟,但是这不妨碍Echo的热销,只要达到80分过了用户心理预期的门槛,这就是一款好产品。苹果的历代产品也都是这个路径走过来的。所以这就不要让AI技术人员过多定义产品,机器人就是个不好的例子,总是不断拔高用户预期这非常不妙。产品满足的是用户需求,而不是研发人员自我炫酷的心态。更好的产品设计应该是充分发挥技术的优势,而巧妙避过技术的缺陷。 比如麦克风阵列,Amazon采用这项技术核心就是要解决远场语音识别问题,而且这也是当前阶段唯一有效的技术方法。AI产品经理更需要了解麦克风阵列技术的优势和缺陷,将其融合到产品之中,而不是浪费很大精力钻研麦克风阵列与深度学习之间的关系,甚至总是在琢磨如何才能替代麦克风阵列,这就本末倒置,应该让专业的公司做更专业的事情。 5 没有历史包袱的产品更易成功 单从Amazon在AI领域崛起来看,国内的消费级AI战场鹿死谁手还真不一定。领先布局的BAT不一定能突围,紧跟其后的小米、华为、联想、金山也不是没有机会。从PC互联网和移动互联网的发展来看,没有历史包袱的产品更容易获得成功。说到这点总是难免会提到诺基亚、摩托罗拉、爱立信等最近十年的变化,当然PC时代会有更多的例子,只是年代比较遥远了。 事实上也简单,成熟的公司总会有成熟的架构,百度总裁张亚勤最近强调公司的中层力量可能会比较阻碍创新,这是一个事实,谁也不愿放弃舒适安逸的环境去适应新鲜的事情。毕竟,这意味着可能要放弃陪伴家庭,放弃自我休闲,所以我很敬佩创业群体,这是一群有理想还能做事情可爱的人,而事实也证明,大都是创业公司创造出了奇迹。无论百度、阿里、腾讯、小米、京东还是华为,他们曾经都是很小的创业公司,也曾经卖也卖不掉。 6 感知和认知是两个层面的问题 毋庸置疑,这也是人工智能的两个层面,感知更多关注的是数据,认知更多关注的是推理。显而易见,现在我们还在感知的阶段,这个阶段所强调的智能其实不重要,控制才重要。可以把智能看作噱头,而控制才是根本。特别是真实场景下的感知问题,这是一切AI的基础。 那么感知就牵涉到多学科融合的问题,比如真实场景下的语音识别问题,首先就是真实场景下获取数据的声学问题,这更多是一个物理学科的问题,而数据处理后又要涉及深度学习的问题,这又是一个计算机学科的问题,如何平衡这两类技术并且融合成一种新的技术体系显然也是一个难点。何况感知还包括了器件、芯片等硬件技术,比如语音识别常用的麦克风,消费级产品都是标量麦克风,矢量麦克风在数据感知上更具优势,但是怎用应用以及如何降低成本都是一个技术和产业的问题。 7核心竞争不是技术,而是产品 (编辑:网站开发网_安阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


