如下内容来自于Mangrove Capital Partners的报告 - Voice:Welcoming the Next Generation of Disruptors
算法
原文连接 - https://www.mangrove.vc/voice-tech-report-2019api
在过去多年的键盘输入和点击手机屏幕以后,咱们正在回归到最初的“用户界面”:语音。虽然咱们还没有感觉到语音技术带来的所有影响,但这种技术正在改变咱们与数字世界互动的方式。微信
重要的是,这种转变影响的远远不止是查看天气预报,获取音乐,以及设置闹钟。语音带来了平台和用户界面的转变,足以与网页和智能手机相媲美。做为人工智能和机器学习的入口,语音技术将经过强大的新方式为咱们提供服务。网络
在Mangorve,咱们相信,语音将成为将来10年决定性的主题之一。除了用数字服务影响各行各业之外,语音技术还将培育出新一代的科技公司。与人工智能一块儿,语音技术将从根本上改变人和机器的关系,给下一代软件创造巨大价值。app
向语音的转移机器学习
自2011年苹果推出Siri以来,语音技术已经取得了长足发展。随着机器学习的发展,咱们在语音识别和天然语言处理两方面都得到了至关大的进步。事实上,语音系统的单词识别准确率已超过95%,这意味着它们已经具有了与人类相仿的语言理解能力。相对于打字,语音产品提供了更天然、更便利、更高效的沟通形式。所以,语音注定将成为最主要的人机互动接口。工具
根据Juniper Research的数据,目前市面上已有25亿个语音助理存在。随着科技巨头争相加入竞争,愈来愈多家庭正在启用语音服务。在美国,家用智能音箱的总数2018年大幅增加78%,从6670万台增长至1.855亿台。亚马逊在这个市场的份额达到64.6%。Canalys预计,全球范围内智能音箱的装机量到2023年将增加至5亿台。学习
语音也在成为智能家居和物联网的入口。亚马逊宣布,已有4500个品牌提供2.8万款支持Alexa的智能家居设备,包括电视机、炊具和机器人吸尘器。除了进入家庭场景以外,语音助手也在进入万豪等酒店的房间,而且在汽车信息娱乐系统中也很受欢迎。亚马逊正在与多家汽车公司展开谈判,有报道称亚马逊的车内产品Echo Auto预售订单已超过100万。Echo Auto提供全方位的免提体验,包括打电话、导航,以及操控智能家居设备。优化
语音技术也在超越语言障碍。目前谷歌的服务已经支持30种语言,甚至能够同时理解用户所说的多种语言。有趣的是,在中国语音服务的普及更快,阿里巴巴在中国的智能音箱市场处于领先。搜索引擎
各种受欢迎应用的出现使人联想到App Store发展的早期。亚马逊Alexa提供的功能包括为新妈妈提供母乳喂养支持,鼓励孩子们刷牙,帮助用户锻炼,指导足球队,以及指引人们如何祷告。
语音电商的崛起
因为亚马逊Alexa直接关联至全球最大的电商平台之一,语音购物也在初步发展。亚马逊已经看到,Alexa平台的电商交易在2018年假日季同比增加至三倍。沃尔玛近期也推出了基于谷歌语音助手的在线生鲜购物服务,支持购物者经过谷歌Home、智能手机或智能手表将产品添加到购物车。
根据Juniper的数据,在美国和英国,语音电商的规模将从2018年的20亿美圆增加至2022年的400亿美圆。有趣的是,语音电商最热门的三大商品品类都是低价商品:生鲜杂货(20%)、娱乐(19%)和电子(17%)。
所以对零售商来讲,得到“亚马逊精选”的地位将会比以往更加剧要。根据OC&C战略咨询公司的数据,亚马逊购物者中有85%最终会选择亚马逊推荐的商品。不过目前外界仍然不清楚,具体商品要如何才能得到这样的推荐。
不管是在线上仍是线下,语音技术已经在指引消费者购物。快消品厂商正在探索,基于语音体验,对于制做鸡尾酒和品尝威士忌等场景,能够如何提高产品定位和用户忠诚度。
你不会再感到孤单
重要的是,语音服务正在从事务性向对话性转变。这种趋势的最终结果很难彻底被理解,但你能够考虑这一点:你永远不会再感到孤单,不管是在与Alexa说话,仍是与另外一我的或人工智能说话。人工智能的第一次浪潮使用算法去创建推荐引擎,提供访问互联网服务,例如谷歌、亚马逊和Facebook的快捷方式。而第二次浪潮则是帮助企业利用结构化数据去优化决策流程。相似Palantir的公司开始崛起,它们挖掘大量结构化数据,找出人眼和人脑难以发现的信息关联性。
人工智能的第三次浪潮正在到来。人工智能得到了眼睛、耳朵和无数其余感官,从而能够收集历来没有过的新数据,随后使用这些数据推进更复杂的流程自动化。与此同时,咱们也在从基于命令的静态流程转向动态流程。这是计算领域的结构性变化,将完全改变咱们体验软件,与软件交互的方式,模糊了数字世界和现实世界之间的关联。
随着人工智能系统在对话中变得更熟练,收集关于人们及其周围世界的更多数据,它们将能够了解情景信息。人类一般能够不费力地掌握这些关联信息,并将其应用在对话中。情景信息将帮助人类和机器以更天然的方式互动和协做。而随着体验的优化,变得更有用,他们将会更加频繁的互动,而机器也将掌握更多知识。
这样的良性循环意味着,在将来3到5年内,计算机的对话能力将变得更复杂,更具变革性。与其将咱们的时间花在键盘打字和智能手机触控上,咱们能够很方便地与无所不在的人工智能交谈。重要的是,咱们与软件互动的方式将被永久改变:表单将会消亡,接触点将变成“监听点”。
这就能够解释,为什么全球最大的科技公司向语音技术进行了大笔投资。语音技术带来了平台和用户界面的改变,这足以媲美此前的网页和智能手机,而不一样之处仅仅只是,用户向语音的转移不须要任何训练。对于这种将来主导性的平台,大型科技公司不容有失。所以,亚马逊已有超过1万名员工从事Alexa项目,而亚马逊也是对语音技术创业公司最热衷的投资方之一。
语音优先界面的黎明
语音技术的影响很是深远,每家公司都须要从新考虑如何与用户进行互动。这不只仅是调整SEO(搜索引擎优化)等方面的工做,或是开发本身的Alexa“技能”或谷歌的“操做”。
企业最终须要提供能感知情景、语音优先的界面。能创建用户认知和情感链接的企业将能够更好地吸引用户,而若是只是用预设脚本去被动响应用户问题,那么企业将处于明显的劣势。严重依赖通知去驱动应用使用的科技公司可能须要从新审视策略。消费者对于那些用太多通知去打破“声音门槛”的公司(例如LinkedIn)不会再有太多耐心。
最热门的移动应用成为了今天的主导平台,而最能吸引用户的语音优先界面将会成为明天的主导服务。很难预测理想的界面应该是什么样,但下一代Airbnb、Monzo和Uber的出现极可能只要3到5年。
无屏幕手机,例如Light Phone的出现向咱们展现了将来,这样的手机不依赖于咱们了解并喜好的移动应用。考虑到语音服务的学习曲线很短,能明显减小用户的使用障碍,所以能够很合理地假设,在咱们注意到所有潜力以后,语音经济将快速发展。
语音时代的工做
在咱们与软件交互的过程当中,所花费时间最长的场景就是工做。所以能够合理假设,在工做场景咱们将会看到最明显的变化。尽管咱们可能仍然须要与屏幕互动,但键盘极可能会变成多余的。毕竟,普通人每分钟能够用键盘输入40个单词,但却能够说出150个单词。
无所不在的人工智能能够支持咱们平常工做中的许多任务和流程,例如回复电子邮件,整理会议信息,向团队成员发布信息,以及用数据更新相关系统等。这也可能意味着,咱们将再也不被捆绑在办公桌,没必要再久坐不动。
更进一步,无所不在的人工智能能够注意到效率最高的员工,并告知他人他的工做方式,从而优化工做产出。能持续识别高绩效者的特定策略,并将最佳绩效建议分发给网络中其余人的人工智能学习循环已经开始出现。这些优化网络不是为了取代人工,而是依靠人类去学习并优化流程。人类仍然会处于循环中。
一个值得关注的案例是Chorus.ai,该服务能加入通话,同时就有效回复作出提示。Chorus.ai并非给销售电话提供预设的脚本,而是会分析团队成员的不一样方法,带来更积极的成果,并鼓励创造性。
经过让人类变得更聪明、更高效,新一代的SaaS(软件即服务)产品将能够收取更高的订购费用,从而成为更具价值的一代企业软件。
从虚拟人物到虚拟医生
虚拟KOL莉儿·米克拉(Lil Miquela)
咱们已经看到,虚拟KOL逐渐兴起。例如,来自洛杉矶、19岁的虚拟KOL莉儿·米克拉(Lil Miquela)在Instagram上积累了150万粉丝,目前已经参与过Calvin Klein等知名时尚品牌的营销活动。
位于旧金山的创意工做室Fable正在虚拟人物方面迈进更多一步。该公司的虚拟人物具备完整的互动能力,而且有本身的个性。很快,咱们就能建立人工智能全息伴侣,例如《银翼杀手》中的乔伊。乔伊由Wallace Corp制造,能够成为“你想看到的所有一切”。
虚拟人物极可能会改变娱乐和客服的表现形式,与此同时在给老年人和其余须要帮助的人群提供服务方面也能够扮演关键角色。毕竟,被认为孤独的人群健康降低的风险要高出59%,而社交孤立也是形成抑郁症的最多见缘由之一。
总部位于巴塞罗那的Safe365做为由科技驱动的社区和互助网络已经吸引了许多老年人。语音产品提供了对用户很是友好的方式,监控健康和认知能力,并提供关于锻炼和服药的提醒。
事实上,语音和人工智能最终有可能彻底取代医生。K Health已经开发了一款人工智能,将数千名医生的经验结合在一块儿,以作出准确的诊断。借助语音技术,人工智能还能够像人类医生同样给病人提供安慰。
对语音技术融资的分析
根据咱们的分析,对语音创业公司的投资正在加速。语音技术创业公司今年已融资7.86亿美圆,远远超过2018年的5.81亿美圆以及2017年的2.98亿美圆。这样的融资增加代表了市场的信心,即语音技术将带来变革。融资的规模也在大幅上升,2019年到目前为止平均交易规模是3000万美圆,而2018年和2017年分别为1800万美圆和1750万美圆。
娱乐和播客是已经吸引了大量兴趣的领域之一。Spotify收购了播客创业公司Gimlet和Anchor,总共花费3.37亿美圆。这个领域其余值得关注的创业公司还包括制做语音优先收费内容的Sybel。
与此同时,从2015年成立以来,亚马逊Alexa基金已经进行了72笔投资。过去18个月中,该基金投资的创业公司涉及娱乐、健康、教育、交通、电商、酒店和SaaS等行业。这代表,亚马逊相信语音技术将改变一系列行业。
咱们的分析还显示,在语音技术创业公司的融资活动中,美国处于领先。美国此类创业公司得到了超过10亿美圆的投资,而欧洲只有1.18亿美圆。这尤为值得关注,由于语音技术表明着范式转换。若是欧洲但愿在下一代技术发展中创建本身的地位,欧洲的创业者和投资人须要快速作出响应。
挑战
语音技术领域最大的挑战之一是隐私保护。微软的数据显示,41%的语音助手用户对信任、隐私和被动监听感到担心。谷歌Nest设备中被发现存在隐藏的麦克风形成了不利影响,而亚马逊申请专利“监听房间里的全部对话”也是如此。
如何回应这些关切取决于科技公司,而苹果在这方面的工做卓有成效。苹果收购Silk Labs值得赞扬,后者开发在设备中运行的人工智能软件,而没必要使用云计算平台去处理数据。
苹果在围绕语音服务构建生态方面进展缓慢。实际上,苹果1987年提出的“知识导航工具”给出了更明确的语音服务愿景。语音服务社区指望苹果在2020年全球开发者大会(WWDC)上为开发者社区发布Siri操做系统,从而加速创新和普及。
Voicebot.ai的编辑和出版人布雷特·金塞拉(Bret Kinsella)表示:“Siri操做系统对于鼓励创新是有必要的。许多人认为,苹果须要匹配亚马逊和谷歌语音助手取得的进展。”
《机械姬》等热门电影中提出的一个问题是,若是咱们痴迷于机器人,爱上代码而不是其余人,那么人工智能将成为人类的威胁。尽管对某些人来讲这种说法听起来很牵强,但约会模拟游戏已被证实很是受欢迎。在中国,名为《恋与制做人》的游戏在上线首个月下载量突破700万。
尽管挑战了咱们对隐私保护的观念,就人类与技术的关系提出了新问题,但咱们仍然有不少理由对语音技术保持乐观。这种技术将驱动新的生产力提高浪潮,造福消费者、企业和社会。而且,这也将帮助咱们更好地照料老年人,同时让全球7.74亿不识字的人群可使用互联网。
语音时代的预测
键盘的消亡:咱们再也不须要打字,而是可使用语音和手势。键盘将在将来5到10年内基本上消亡。
语音技术将带来全新的产品门类,包括无屏幕智能手机。
品牌很快须要经过“声音身份”来被识别,产品搜索将被完全改变。
由于在使用语音服务时用户不太能注意到具体应用,所以硬件将从新变得比软件更重要。
虚拟伴侣将变成现实,知足你生活的所有需求。
苹果将于2020年推出Siri操做系统,从而在语音经济中推进巨大的创新。到2025年,语音经济的规模将达到1万亿美圆,超过移动应用经济。
本文分享自微信公众号 - VoiceVista语音智能(AIndustrialRock)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。