两个多月后360那个刚出生的孩子长大了

author
0 minutes, 8 seconds Read

作者丨何思思

编辑丨林觉民

周鸿祎:你为什么不废掉刘婵取而代之呢?刘备不也同意你这么做吗?
 

360 AI数字人:夫天下之事非一人之所能独为。虽君父有命,亮亦不忍背之。况刘氏托名汉室,实为一邦之主。亮岂敢以私怨而王大义哉…

在前段时间刚结束的认知型通用大模型360智脑发布会上,360集团创始人周鸿祎与360 AI数字人角色进行多轮对话后,现场响起了一阵又一阵的掌声。

 

时隔两个多月的时间,周鸿祎携4.0版本的360智脑大模型亮相,同时还发布了核心创新产品——AI数字人。

雷峰网了解到,360 AI数字人目前拥有200多个角色,分为数字名人和数字员工两类。其中数字名人包括历史人物、偶像明星等,具有较强的可玩性。数字员工强调的则是高可用性,致力于解决企业的实际问题,可成为企业员工的知识助手和办公助手。

与传统数字人相比,360 AI数字人最大的特点在于有灵魂、有记忆、有人设,能够复刻人类的思维方式和经历。周鸿祎表示,数字人是未来大模型最重要应用入口,360将依托360智脑大模型能力,重新定义“数字人”。

可以说360 AI数字人是周鸿祎对AI认知的具象表现。在他看来,AI应该以人为本,无论做多么强大的AI,都是在为人类做有史以来最好的工具。

百模大战、千模大战,比拼的是多模态的能力

目前国内大模型呈遍地开花之势,几乎到了每个人都可以做出一个大模型的阶段。

周鸿祎认为,一个完整的AI大模型一定要具备多模态能力,包括文字处理、图像处理、语音处理、视频处理四大能力。同时他形象的比喻道,AI大模型是一个从只有眼睛,到有耳朵、鼻子、嘴巴的蜕变过程。

这从360 AI大模型的发展路径中也可以看出来,3月29日360推出大模型1.0,当时只能和搜索结合,还不支持多轮对话;4月26日2.0版本上线,具备了多轮对话的能力;5月18日发布多模态文生图的应用“360鸿图”,同时迭代到了2.5版本;5月31日发布智脑视觉大模型,并迭代到了3.0版本。

而近日发布的360智脑大模型不仅升级到了4.0版本,还加入了多模态的能力。

缘何这么做?

周鸿祎告诉雷峰网,GPT1和GPT2都是以文字处理为主,GPT3扩大了参数量,GPT4展露了一小部分多模态的能力,但之后再也没有新的成果发布。所以我预测,GPT5一定会全面支持多模态。

反观国内自研的大模型基本能力已经成熟,甚至很多方面都赶超了GPT3.5。所以下一步的重点不是文字能力的较量,而是多模态能力的比拼。

对此,周鸿祎还进一步解释道,大模型训练到一定水平后,人类的知识会愈发不够用。以GPT4为例,其学习的Token数目接近4千万种图书,而人类有史以来的图书不足1亿本,所以当大模型具备了多模态能力后,它获得知识的途径不再局限于文字,也可以是图片,亦或视频。

这也是周鸿祎把多模态融入到360智脑大模型的重要原因,目前也成了其最重要的组成部分。

雷峰网了解到,360智脑大模型已经具备了生成与创作、多轮对话、书写代码、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、多语言翻译等十大能力,200多种细分的子能力。

“2015年360就成立了AI研究院,2018年开始多模态的探索。我们未来会发布插件平台,我们要让大模型不仅仅停留在大脑层次,多模态可以给它增加眼睛、耳朵、鼻子、嘴巴,插件可以让它有手和脚的能力,这样大模型的能力才能发挥出来,”周鸿祎补充道。

构建大模型的关键:数据、用户反馈、安全

多模态可以说是进阶版的大模型,但就目前国内大模型发展来看,很多企业仍处于起步阶段,讨论的更多的还是如何做大模型?门槛高不高等问题。

对此业界可谓众说纷纭,一部分人更是极端地把大模型描绘成了“曼哈顿计划”,像一样高精尖的技术。

但周鸿祎却持否定态度,他表示,做大模型一是找一个类似Transformer架构的基础模型,二是给大模型灌知识,即无监督学习或者预训练的知识,三是刷题训练,即有监督的微调。

此外,还需要在用户场景中不断反馈优化。过程中,用什么样的数据做预训练,用什么样的题海战术做有监督的微调,以及用户的使用反馈都对大模型的持续训练起着至关重要的作用。

360在这方面就显得轻松地多。

首先,360以搜索业务起家,这意味着其在自然语言理解方面有丰富的技术积累。雷峰网(公众号:雷峰网)了解到,360每天在全球会抓取1.4亿的网站数据,2.8亿的专业文献,1.2亿的行业数据。其中,包括数十种语言、图片、视频等多种形式的基础材料。

其次,360还具备清洗能力,对全网数据清洗后,仍会留下10T级优质的规模数据,更重要的是这个过程还会产生高质量的问题,比如用户每天在搜索引擎里有1亿次的使用,用户搜索的这些问题就是高质量的问题,这就会更加了解用户在想什么,从而有的放矢地做知识的标注。

“搜索能力对大模型不仅会影响数据积累,也会影响结果的真实性。”
 

对此,周鸿祎解释道,大模型最大的短板是数据更新不及时,甚至有时候会产生幻觉。而搜索恰恰可以补足,我们可以通过搜索最新的内容,让GPT随时训练到最新的事实内容,同时把结果通过搜索做内容的校正,这个能力还在不断研发。

 

除数据和用户反馈外,360还非常重视安全问题,周鸿祎谈到,大模型如果只一味地讲发展不讲安全,这个大模型肯定是走不远的。

目前360已经启动安全团队专门做人工智能安全方面的研究,具体分为两部分:一是用安全加强大模型的能力;二是用安全使大模型在安全方面更加可控。

所谓道高一尺,魔高一丈,周鸿祎更是形象地把自家的安全手段比喻为:以其人之道反制其人之身,即通过全球的网络攻击大数据,安全行业的智能大脑,帮助企业更好地辨别黑客的攻击,网上隐藏的攻击,从而增强安全防卫能力。

当然,在周鸿祎看来,研发大模型不能把大模型当成一个黑盒子,而是要了解它的来龙去脉、工作原理,才能从根本上解决大模型的安全问题,为此,360首创了大模型安全风险的评估体系“AISE”,为全球大模型提供安全保障。

基于此,360提出了“一体双翼”的发展战略,并重发展和安全,此外,为了切实解决千行百业的实际问题,包括360安全浏览器、360搜索以及安全卫士等在内的产品已经全面接入360智脑大模型。

可以预见的是百模大战、千模大战的战火会愈演愈烈,对于大模型厂商来说,只有不断增强大模型的能力,提供差异化的服务,才能在这场战争中保持优势。

Similar Posts