每晚七点,一名汽车领域、拥有几十万粉丝的主播,都会在直播软件上接受连麦提问。
有人问三元锂电池和磷酸铁锂电池哪个好?
有人问电车能不能买,电池是不是不经用?
……
一次连麦提问持续不到一分钟,但麦序上整整排了上千位对汽车有疑问的观众。
午夜十二点一到,主播直接关闭了直播软件,下播休息。留下麦位上还在排队的几百位观众面面相觑——他们已经举着手机,排了一个多小时的队,却没能解决自己的疑问。
类似的情况比比皆是:问旅游的、问母婴的、问兼职的、问教育的……
所有提问共同制造了一个十分矛盾的叠加态:社区里的意见领袖越来越多,但被解决的问题却越来越少。
这事儿的最大的原因之一在于,大部分有价值的信息,都是需要在网络上,进行高强度检索和筛选的。而不同领域的信息,检索渠道通常都不同。普通人不但很难判断意见领袖们的专业度,也几乎不可能随时随地的自由提问。
更常见的情况是,一些看似日常,但实则不易回答的博物学问题,往往出自还在上幼儿园的“好奇宝宝”之口,孩子随口一问,父母哑口无言,或者无暇应接孩子层出不穷的问题。
这是为什么最近很多人开始尝试利用AI来解决自己的问题。
笔者最近观察到,很多博主对华为小艺进行测评。
有人问,问界M5和M7车型对比,小艺会直接罗列一张横向对比的表格,非常直观;有人问非上海户口,在上海能办香港签注吗?小艺会准确回答,列举办理流程、注意事项,并罗列信息来源,排在前面的都是本地宝这种可信的参考来源。
还有之前奥运会期间,很多人去问小艺比赛谁会胜出,小艺神预测居然全部猜中了。
作为一个智慧助手,小艺似乎正成为了一个新物种——用户可以随时提问各类稀奇古怪的问题,而小艺的回答非常专业、实用、可靠。
01
“专业助理”的升级之路
大模型与语音助手的深度结合,使传统语音助手的听、说、思考能力都直接翻倍,能完成十分口语化的对话,并习惯于旁征博引。
小艺在2023年8月HDC上就官宣接入盘古大模型,可以理解模糊意图和复杂命令,走在了行业前头。
随着大模型预训练的算法、数据和工程化方法,都越来越完善,且在很大程度上解决了“大模型幻觉”的问题。
早期的大模型产品,很有天赋,数学、地理、文学,好像什么都懂,但也很难依赖,偶尔会胡说八道,产生某种“这是事实”的幻觉。
幻觉产生的原因,是训练大模型的数据本身存在错误,叫做噪声数据。
行业内普遍的解决方案,是分两步走,一步是从源头开始,尽量采用可信来源的训练数据;一步是在大模型推理的过程中,检索相关文档,利用外部知识,减少幻觉。
其实数据合作一直是大模型公司的“软肋”——大模型训练所需要的训练数据是海量的,参数规模动辄达到万亿级。华为目前已和多个权威机构达成了数据上的合作,并会在回答中按可信度列举参考来源。
比如,对小艺提问“二里头夏都遗址博物馆介绍一下”,小艺会展示博物馆的位置、介绍、馆藏文物、开放情况等,而且回答的第一条参考来源是中国大百科全书。
如果对小艺提问“上海近5年的GDP发展趋势”,小艺不仅会引用国家统计局的数据,还能给出图文并茂的趋势图,更加方便用户阅读理解。
这看起来已经是个完全值得信赖的“专业助理”角色了,尤其是来自统计局的数据,令人咋舌——上网自己找报告,再制作表格,还不如直接问问小艺。
小艺甚至在问答体验上,更进一步,围绕生态合作,实现使用体验上的连续服务。你可以问问小艺,甄嬛传里翠果掌嘴是在第几集,而小艺除了加粗并准确回答问题,还会推送甄嬛传的播放链接。
华为曾发布过一个服务叫做“HarmonyOS意图框架”,这种对用户意图的理解和连续服务,就是这个意图框架的效果演示。
可以说,在小艺身上,华为过去十年在AI领域的积累展露无遗。背靠盘古大模型的华为小艺,其问答能力还远没有被媒体博主们测试出边界,相信医学、气象等专业领域,小艺未来都能给出专业回答。
02
不止于“听”与“说”
要媲美真人专家,光靠“能听”“会说”也不够,还必须好用。
目前市场上的中高端机型,几乎100%配备语音助手,但根据Strategy Analytics的数据,其使用频率仅为每周3-4次。事实上,除开车内等实在不方便动手的少数场景,语音交互的用户接受度,一直存在大问题。
所以对于现在的所谓“智慧助手”而言,能力强只是一方面,它还必须要在易用度上做出调整。
小艺的做法是,除开长按电源键呼出、语音唤醒,还给小艺增加了识屏、圈选、拖拽等多种操作模式,小艺也从幕后到台前,与系统AI导航条融合,常驻屏幕底部,这不仅让用户使用更方便,无处不在也让用户增加了使用频次。
设计这么多操作方式,不显得花里胡哨吗?
还真不是,关键在于,用户本就不应该去迁就智慧助手的交互模型,而是智慧助手应该匹配用户的操作习惯。
以小艺的使用场景为例,外出旅游时如果看到漂亮的景点或建筑物,很好奇,但不知它的名字和历史,则可以拍照后,让小艺进行解答。
而圈选操作的存在,让这种功能体验变得更加日常和自然。比如你在火车上看电影或浏览资讯的时候,某个演员不认识,圈出来问小艺该演员是谁;看到社交媒体上的穿搭推荐,圈选出来问问小艺搜同款;路过一条文化古街,拍照后想了解照片中某个古建筑的由来,也完全可以圈选出想了解的建筑,小艺会精准识别你选中的部分,给出专业回答。
当然,如果你是在阅读英文材料或者英文网页,直接双指按压屏幕进入识别界面,全屏翻译更为方便。
相信很多人用手机处理工作,需要处理文档,此时可以用小艺拖拽的功能,把文档拖入小艺,进行摘要,还能对文档内容进行问答,更好的理解内容。
如果你在手机上接到聚会邀请,小艺可以识别其中的地点信息,进而传输给问界的车机系统,实现从手机到汽车的跨终端任务执行。
这种便捷的操作设计,除了设计之初的“人文关怀”——对用户需求的细节洞察。小艺能做到这一点,其根源还是在鸿蒙系统本身。
2024年10月22日,“原生鸿蒙之夜暨华为全场景新品发布会”上,华为正式发布原生鸿蒙操作系统HarmonyOS NEXT,开启更多机型公测。
所谓纯血鸿蒙,主要是两个概念:完全自研自主,与安卓彻底分割,继而诞生了一个非常有想象空间的推论:华为自此对鸿蒙系统及其使用体验,有完整的、不受任何制约的体验优化和定制能力。
而得益于纯血鸿蒙,小艺理论上可以在任何界面被唤醒,进行服务,直接打破了通过APP、网页访问大模型的僵硬服务模式。
这是一种AI能力的系统级下沉,从赋能各个子系统,形成原生智能的底座,大量的日常应用、控件、服务,在此牵引下完成智能化升级,比如:备忘录智能摘要/润色/排版、图库AI消除/AI扩图,等等。
可以说,拥有全栈自研操作系统打底、鸿蒙原生智能框架的小艺已经下一个level了。小艺的上限在哪,很难想象。
03
写在最后
必须要说明的是,小艺的上述表现,并非是根据特定测试而制作的精美PPT。
从根源来看,长期的人才储备,自研的HarmonyOS,鸿蒙生态、AI大模型技术全面融入终端系统,少了哪一个,小艺都会“发育不良”,但华为恰好都有。
用当下时髦的词儿来说,这就是华为的“势能”,所以小艺在技术领先性上的优势,只会越来越明显。
鸿蒙智能座舱、智能手机、平板、智能手表等华为终端设备搭载着小艺,为消费者带来更加强大的智慧体验。
而使用这些设备的年轻人,也正在养成“随时随地问问小艺”的新习惯。 打赏
转载请注明出处。