我们不是“钢铁侠”,但每个人都需要一个“贾维斯”

文章正文
发布时间:2024-05-30 15:29

小时候,希望能像托尼 · 史塔克一样有战甲,也希望自己也能拥有一个 AI 伙伴 " 贾维斯 "。长大后才发现,现实版的 " 贾维斯 " 可能是个搜索引擎?

5 月 14 日,谷歌在 I/O 开发者大会上推出最新多模态 AI 产品,一石激起千层浪,AI 搜索这个赛道又热闹起来。望观中国大模型市场,前有 B 端大佬彻底打响价格战,后有 C 端巨头宣布日活月用户突破 100 万大关,前仆后继的 AI 应用,正在掀起一场科技革命。

谷歌 I/O 发布会上提到,谷歌的大模型可以提供一个三天的膳食计划:

这个 demo 中所体现的能力,我们能明显发现,来自中国的天工 AI 搜索很早就已经上线了。最新消息显示,昆仑万维旗下的天工 AI 用户活跃度已经突破 100 万,成为国内 AIGC 应用的 " 王炸 " 产品,这表明天工 AI 受到了用户们的狂热追捧。  

这是天工 AI 根据我的日程给出的一份图文并茂的行程规划,与谷歌的图文呈现能力如出一辙:    

当然,如果你希望生成像 gemini 一样的图表形式也完全 OK,并且支持任何产品深度对比分析。    

    

最近高考就要来了,强烈建议大家用这个功能进行报志愿选择,可以清晰对比出每个院系的优劣。

面对日常信息需求,天工 AI 也完美解决了时效性问题,不仅可以轻松地查询天气情况,股票、油价、彩票、金价、快递、日落时间、星座运势、解梦等很多实时性信息都非常完善,而且视觉体验感很不错,高度符合用户搜索习惯,离传统搜索引擎被淘汰又近了一步。

用过天工 AI 之后,有一个强烈的感觉:多模态很强的大模型搜索,不像是搜索引擎,反而更像是一个搜索产品形态的 "AI 全能助手 ",是一个嵌在 PC 和手机里的 " 贾维斯 "。 

 

要知道,AI+ 搜索做得好并不容易,谷歌之外,国外做得好的有 Perplexity、notion、newbing,国内字节百度一线大厂也都在做。有意思的是,国内 AI 搜索的 " 鼻祖 " 既不是字节也不是百度。

把这个问题抛给百度文心一言以及 Perplexity,就有了答案:" 天工 AI 搜索 "。

2019 年,昆仑万维开始在全球布局 AIGC 业务,2023 年 4 月天工 skywork 首款国内自研大模型上线,同期的大模型还有文心一言、通义千问、讯飞星火。2023 年 8 月,天工推出中国第一款 AI 搜索产品——天工 AI 搜索,自此掀起了国内 AI 搜索浪潮。  

天工 AI 有多强?国内 AI 搜索 " 鼻祖 " 究竟有多少含金量?

不试不知道,一试发现根本停不下来…… 亲身体验过后隐约觉得,就像当年谷歌搜索改变整个互联网,如今 AI 时代大门打开,一场新的无形的技术革命正在发生。    

 AI 生产力时代,AI 大模型是每一个人的 " 贾维斯 "

技术革命是无形的,但产品是有形的。

能不能创造一个时代,得看产品好不好用,能不能解决生产力的问题。用过一段时间之后,我发现天工 AI 是有可能解决这个问题的。

原因在于,天工 AI 有了解决复杂 case 的能力。

这是天工 AI 搜索的网页入口:

打开网页版天工 AI 搜索,会出现这样一个界面:         

    

从产品的角度看,这不像是一个 " 搜索 "UI,而像一个 " 系统 "UI。

这似乎表明,天工 AI 搜索的易用性很强,左边是多模态的能力,搜索框上也有三种模式可选,满足不同程度的信息深度获取。       

不过,传统的大模型的一个痛点在于一次只能解决一个问题,缺乏应对复杂需求的能力,原因就在于缺乏多模态能力。比如,对于内容创作来说,多模态能力不够,则意味着不能完成更多的复杂工作,很难真正地提升效率。

天工 AI 大模型作为MoE 混合专家大模型,很好地解决了这个问题。

文本解析、大纲创作、脚本生成、图片生成以及音乐生成,天工的搜索 3.0+AI 速读 +AI 写作 +AI 音乐大模型,几乎深入到了图文、视频内容创作链条的各个环节。而面对复杂的 case,调用如此之多的能力,前后花费的时间其实不超过 10 分钟。       

这个效率是十分惊人的。      

接下来,我们不妨通过一些实操,来看看天工 AI 的多模态能力到底能解决哪些问题。

1、AI 生成 PPT:解放 " 办公室生产力 "    

作为媒体,有时候也会制定一些传播方案。    

假如某汽车品牌搭载最新版本智驾的产品上市在即,需要制作一个传播方案,这个时候,天工大模型就能帮你解决很多问题,而你所需要做的其实只有三步:

第一步,先用天工 AI 生成一个大纲;

第二步,可以直接在页面上直接进一步修改,或者直接按照大纲使用 AI 生成 PPT;

第三步,确定好大纲后直接生成 PPT,然后简单修改调整,一份传播方案就完成了。整个过程的时间,也就几分钟,效率非常高。      

    

实际上,多模态能力之间的配合,结果不是简单 1+1,而 1+1 × n 的能力倍增。这也是为什么天工 AI 能够充分解放 " 办公室生产力 " 的关键。

2、自然语言模型 + 音乐大模型:视频创作者的 " 马良神笔 "。         

短视频时代,人们获取信息越来越碎片化,短视频 kill Time 的特性,使得人们的注意力大部分都在短视频平台上。    

所以,如今媒体人的工作,除了写文章之外,很大一部分精力都花在视频上。  

做视频这个事儿,跟写文章很不一样。文案之外,要求有更多的制作能力,而制作的过程中,很大一部分精力其实是花在找素材上,效率其实很低。

这个时候,如果用上天工 AI 转绘 + 自然语言模型 + 音乐大模型,则可解决大部分的效率问题,甚至带来意想不到的创造力。

天工 AI 的视频转绘功能,可以轻松从视频帧中提取特征,转化为漫画或者其他风格的视觉艺术效果。

这是一段女孩儿跳舞的视频,可以转化为动漫人物风格:

这是电影《泰坦尼克号》中的 " 名场面 ",转化为迪士尼风格后的画面:

         

强大的 AI 转绘能力,就好像赋予了创作者一支 " 马良的神笔 ",可以把自己日常的拍摄的视频轻松转化为动漫作品和影视动画作品。

如果你觉得风格化的创作太艺术化了,作为媒体人还是想做一个专业类的视频,天工 AI 也很容易就给出一个可用的文案,甚至,它很懂得把特斯拉 FSD 拉过来做背景板……  

天工 AI 很好地解决了这个问题。在天工 AI 的多模态能力中,嵌入了中国首个音乐 SOTA 模型:天工音乐大模型。    

 

    

使用起来也很简单,只要想好了歌名与歌词,再找一段参考的音频,就算不懂乐理的小白也能有创作音乐的能力。

如果你不会写歌词,也想不到好的歌名,也不用着急,只要找一首歌曲作为风格参考,天工 AI 会自动 " 脑补 " 所有的内容,帮你实现创作。

  

下面就是用天工 AI 生产成的音乐。

其实不仅仅是媒体,天工音乐大模带来的这种全新创作方式,也将会对整个音乐行业产生颠覆性的影响。

天工 SkyMusic 作为国内首个音乐 SOTA 大模型,在人声、BGM 音质、人声自然度、发音可懂度等几个关键维度上领先海外顶尖音乐大模型 Suno V3。有天工音乐大模型,每一个普通人都有机会成为 " 作曲家、唱作人 ",音乐创造真正走向大众。  

在音乐这个领域,天工大模型正在引领一个新的 "GPT 时刻 "。     

3、AI+ 搜索:从写作到深度创作      

对于复杂的媒体内容策划和写作,传统的文本大模型能够实现长文本分析,但这其实只是第一步,接下来,还需要一个完整的稿件大纲。 

这份大纲其实并不简单,内容是否准确,其实很考验语言模型能力和搜索引擎能力的融合能力。天工 AI 给出的这份大纲很准确,接下来,我们可以让天工 AI 对这份答案进行一个扩写,然后就得到了一份 1800 字的完整版的稿件大纲。    

这份大纲包含了华为与赛力斯的合作分析、智驾行业趋势发展、技术发展、市场接受度以及法律法规、行业竞争多方面出发,最终得出 " 智驾是汽车行业下半场关键 "" 技术创新与用户体验的双重驱动 "" 合作与竞争推动行业健康发展 " 等核心观点。       

    

难的是,天工 AI 好像真的理解什么是智能驾驶、什么是汽车产业,而不是一些简单的信息摘取。这里面体现的就是MoE 混合专家大模型的能力。

有意思的是,在给出大纲后,天工 AI 大模型还给出了很多关联的提问,比如华为与赛力斯的合作有哪些内容?智能驾驶发展对行业的深远影响等。

大纲完善后,接下来,只要用天工对各个部分进行详细扩写,一篇关于智驾的行业分析深度文章就已经基本成型了。

4、AI 图片生成:包容无限想法的超级素材库

做内容,少不了要用图片素材。

内容完成之后,还能用 AI 图片生成直接做一张文章头图,这样创作者就再也不担心图片侵权的问题了。      

除此之外,AI 图片生成最有价值的,是能把一个好的想法变成可用的画面素材,这对创作的效率提升是巨大的。

实际上,天工的 AI 图片生成能力本身就是一个庞大的素材库,而好的想法就是一个检索词,通过 AI 图片生成去找到最适合的素材,从而使内容创造更简单,更直接。

图片素材之外,天工 AI 还能直接生成漫画,把漫画创作者的想法直接变成作品,从而帮助漫画作者,减少冗杂的工作量,释放更多的创造力。

5、多模态能力:人人都需要的 " 贾维斯 "

  从实际的体验来看,我是有点被震撼到的,天工 AI 多模态能力,正在成为创作者的 " 贾维斯 "。

从行业深度文案创作,到素材生成,再到新车型上市的传播方案制定,以及视频脚本生成、内容素材、背景音乐制作。这么长的一个工作流,天工 AI 都可以做到全程参与。并且,项目报告评估、行业白皮书等,这些对专业和行业背景要求更高的工作,AI 也能很好胜任。   

在我用过的大模型产品中,目前除了天工 AI 之外,没有任何一款 AI 工具集这么多模型能力于一身。

以搜索为主,天工 AI 的多模态能力带来结果就是,复杂 case 的执行变得效率更高了也更容易了。实际上,用户实际的场景需求很复杂,AI 要真的成为 " 贾维斯 ",就得懂得更多,并且能做得更多。

由此来看,开发天工 AI 的技术实力很强,而且对产品的理解能力很强。产品力越强,意味着用户可以真正用它提高生产力。

互联网江湖一直以来都认为,AI 大模型能不能引发新一轮趋势,除了看技术先进不先进,另外就是好不好用,能不能解决实际的问题。

谁在定义产品上做得更好,谁就代表着真正的 AI 生产力。

而多模态能力满足复杂 case 执行、大模型时效性能力的背后,隐现的是一线国际大厂的技术能力储备以及定义产品的能力。      

这些能力之下,一场新的搜索产品革命或许就此展开。

大模型 " 巧夺天工 ":AI 搜索革命,它来了     

每个时代都有自己的技术烙印,21 世纪的前十年是 PC 互联网,10 年代到 20 年是移动互联网,20 年代到现在则是 AI 互联网。 

从 2000 年到现在,每一波技术浪潮下,都诞生了不同的巨头。PC 时代,是百度、360;移动时代是腾讯、字节;AI 时代会是谁?目前还没有确切的答案。

有一点可以笃定,下一个巨头必然是有原生创新能力的 AI 玩家,是在 AI 领域积累够深,且底层创新能力足够强大的玩家。

目前,市面上的 AI+ 搜索有四种。

第一种:自研大模型 + 自研搜索引擎;

第二种:自研大模型 + 非自研搜索引擎;

第三种:非自研大模型 + 自研搜索引擎;

第四种:一些小厂的非自研大模型 + 非自研搜索引擎。   

而昆仑万维正是自研大模型 + 自研搜索引擎的深度玩家,真正能引发行业革命的,务必是真正有实力的高精专团队。

一来,大模型是个极其耗费资源的业务,大厂有稳定的收入来源,能够做更长期主义的投入;二来,大厂有很强的研发资源和产品能力,做大模型更容易成功。          

大厂里面,百度、字节等都是上个时代的玩家,能不能做好 AI 这个新产品,能不能开创下个 AI 时代很难说。

百度的优势在于搜索引擎份额很稳,字节的优势在于有源源不断的流量池。

总之,各有各的王牌。

百度、字节之外,天工是中国 AI 搜索鼻祖,也是探索行业的先驱者,昆仑万维也有丰富的自研经验和强大的自研能力,在 AI 和搜索引擎行业都有很深的积累。

产品方面,昆仑万维很多年前已经在海外做出的 opera 浏览器,也取得了巨大成功,做 AI 搜索,是有基因优势的。

人才方面,昆仑万维大模型研发中心高级算法工程师多达 300 人 +,其中海内外名校博士 100+,大量人才来自微软、阿里、百度,也有一线大厂的研发实力。  

有国际经验的一线大厂,研发实力强大,可用的资源丰富。

这意味着几件事儿:

首先,迭代的速度很快,意味着核心的 AI 能力能够迅速适应市场竞争的变化。  

AI 为什么能这么强,强就强在版本迭代速度快,能不断 " 进化 "。这个过程中," 喂 " 给 AI 的数据、算力越多,进化的能力就越强。    

百度字节、天工是自研模型 + 自研搜索,有大量的人才、技术储备,能满足 AI 进化的需求,也能敏锐洞察市场变化。     

AI 拼到最后,拼的是参数量,拼的是算力,只有大厂才 " 喂 " 得起数据,也才能训练出更强的 AI。   

其次,AI 行业是一个赢者通吃的行业,AI 革命先行者总能吃到更多红利。     

现实点来讲,大模型 + 搜索应用之后,全球搜索市场的格局在变化。

在产品上,对比全球同类的产品,天工 AI 在多模态能力、中文搜索能力以及中文用户习惯上并不差。    

所以,海外的中文搜索市场,昆仑万维也是有机会分一杯羹的。      

目光回到国内市场,AI 革命也会搅动搜索市场的份额,而天工 AI 作为行业引领者,也自然有更多的机会。     

在互联网商业链路中,搜索商业之所以能够开启一个时代,很重要的一个点在于能够挖掘需求,并嵌入商品和服务(百度搜索)。搜索之后,后来嵌入商品和服务是图文(微信公众号、小程序),现在是直播和短视频(抖音)。  

那么,未来会不会是天工 AI?会不会是昆仑万维?现在看来还没有确切答案。  

不过,AI+ 搜索一个很重要的价值是,平台发现用户需求会更容易。发现需求的下一步就是满足需求,所以,在大模型中嵌商品与服务的可能性,才是这波 AI 革命最重要的意义之一。这也是百度、字节以及昆仑万维等大厂的想象力所在。 

大厂的成功,也是中国 AI 的成功,天工 AI 表现出的产品力,也为整个中国的 AI 竞争力打了一针强心剂。     

过去几年,大模型的出现,让人们对 AI 有了更多的期待。AI 行业是个赢者通吃的行业,但 AI 也是一个永远有创新红利的行业。天工 AI 的成功似乎也证明了这一点。

AI+ 搜索,开启的是一个全新的生产力时代。这是一场巨变。     

身处这场巨变中,作为一名中国人也感到特别淡然,因为我们知道,新时代的征程伊始,我们已经走在了最前面。

首页
评论
分享
Top