最有AI味的年,百度让技术接地气
声明:本文来自于微信公众号 光子星球,作者:吴先之,授权站长之家转载发布。
乙巳新年的春节营销,俨然成为各厂商秀技术肌肉的舞台,AI拜年形式多种多样。事实上春节场景千千万,大模型技术已普遍应用,出现在更高频的日常场景中。
日前,百度借机发起“瞬移世界拜个年”活动,利用AI 技术为大众提供新的拜年方式,照片秒替换背景并生成拜年视频,让参与者足不出户就能在全球各地给亲友送上新春祝福,增强节日氛围。
如果仔细观察可以发现,不少流传于微信群、朋友圈、社交动态的物料几乎都带着“度味”。
日前,郑州一位跳广场舞的阿姨用AI拍摄全世界拜年视频,火爆老年朋友圈,引发不小关注。“看老年人现在也是很潮吧”,这位大妈在接受采访时的这句话,折射出基于大模型的应用在以润物细无声的方式进入日常。
事实上,在春节期间百度正在借助基于大模型的生态,完成一场“下沉”。
春节给AI普及提速
春节是全球华人一年到头最重要的时间节点,单是过去42届春晚几乎就是半本商业史。
由于人们在这个节点对于节日有强烈表达,推动了媒介形式不断变化,从而不断重构既有的商业模式。从微信支付到支付宝集五福,到百度“好运中国年”,再到此后与电商的不断绑定,过去十年,春节的表达形式早已不再局限于贴对联、发红包、拜年祝词。
随着大模型不断迭代,从“可玩”到“可用”,今年春节开始有了新的变化。
早些时候,DeepSeek超越ChatGPT,登顶苹果免费APP下载排行榜,很大程度上缓解了国内对于AI行业的焦虑。从更大的角度来看,眼下大模型正借助春节的流量洪峰,完成对互联网创造的新民俗进行全盘改造。
最明显的特征是各大厂上线的春节拜年活动全部与AI相关。
支付宝上线的新五福节与微信红包的个人定制封面,核心玩法悉数来自于生成式AI。两种玩法都是对移动互联网新年俗的一次AI“改造”,本质上是借助新颖的拜年形式和高频的社交激活自身生态。
活动本身吸引用户“钱流”,同时庞大的流量为品牌提供了难得的曝光机会。支付宝上线的各种玩法与平台内的内容(如短视频)、蚂蚁森林、芭芭农场联动,既有促活的考量,亦有培育内容消费的考量。
可定制的微信红包封面,本质上是心智消费,腾讯借此机会将流量、钱流留存在生态之内,为视频号电商生态提供活水。国人有着节日“送礼”的传统,即便各电商平台相继上线“送礼”功能,但没有人会怀疑,坐拥社交与内容的微信生态才是最终吃螃蟹的人。
各厂商相继上线AI拜年功能,让蛇年的AI味儿变得愈加浓郁,然而春节期间,过年形式远不止送红包、集五福那么简单。既有节日特定的行为,亦有日常,因而一部分技术大厂,则另辟蹊径“整活”,例如百度日前发起“全球拜年”活动。
通过百度搜索“AI拜年”,既可以生成祝福语、贺卡,按照个人需求调整,选择“创意照片”即可完成定制。值得注意的是,生成的图片与春节氛围高度贴合,表明文心4.0的生图对文化要素的理解有了长足进步。
我们输入“愿巳巳如意,新年发财,阖家幸福”的祝词后,生成的图片都紧扣团圆、年夜饭、红色等传统符号。
除了生图之外,大模型与场景的融合还在与习俗融合。
文小言上线AI视频生成能力,并发起“春节抱财神”活动。用户根据模版上传照片后生成自己的创意视频。如双人物的各种拥抱,送春节祝福。上传两个图片两个图片的人物,进行跨空间、跨时间、跨角色的拥抱,例如抱财神。
新玩法被不少网友玩出了花,在不少社交平台和日常交流中,脑洞打开的用户不断解锁百度大模型的能力。
年轻人喜欢“玩梗儿”,有用户利用AI生成一个奥特曼的拜年视频,在传统古建筑背景中跳舞。
甚至让两个不相关的IP,跳一场“骑马舞”。
中老年更偏向于真人出镜,更偏爱传统背景,也可以生成真人出镜的拜年视频。
大模型“下沉”
面对春节这个前沿技术飞入寻常百姓家的绝佳窗口,相较于其他厂商单点突破,百度选择了将AI全面与现实融合。包括融入到节日高频的场景,如拜年、媒介视频化、创意生成等放方方面面。
早前,百度文心智能体平台发布“34省智能体”,形式上贴近本地习俗,不仅有图文对话,还提供一键“打电话”的功能开启沉浸式对话,AI生成的地道乡音,解锁更浓的年味。AI不是玩具,而是融入到实际场景之中为人所用,“34省智能体”能够全方位满足用户吃喝玩乐、旅游打卡等需求,实现玩转各地风俗。
语音大数据挖掘技术和语音合成大模型技术是实现这一功能的核心技术支撑。数字人语音生成涉及语音大模型迁移技术、篇章段落合成技术、文本韵律增强技术。在方言语音上还涉及语音大数据挖掘技术与方言迁移合成技术等。
创意生成显然是节日期间使用频次最高的功能。生成质量高低在这个特殊时间节点往往与祝福的诚意相关,何况用户早已对“AI味儿”的内容产生了审美疲劳。华人的新年祝福出现非传统的符号,显然是不合时宜的。
大量用户使用文心4.0生图的一个重要原因便在于几乎没有“AI味儿”,这背后实际上得益于iRAG技术。文字生成领域已经验证了RAG(增强检索)的高准确性和几乎无幻觉的能力,复刻到图像领域后,生成结果兼具可靠性与准确性。
值得一提的是百度的iRAG(image based RAG),具备无幻觉、超真实、没成本、立等可取等特点,在降低用户生成成本的基础上,提升了生成图片的效果。
技术不止是融入到“功能”,也为复刻传统提供了可能。
宋代曾风行名片拜年,被称为“飞帖”。家家户户门口会贴上一个红色纸袋,用以放置飞帖。“不求见面惟通谒,名纸朝来满敝庐;我亦随人投数纸,世情嫌简不嫌虚。”文征明曾用诗句描写了飞帖拜年的情形。
近日,百度智能云曦灵数字人推出“飞帖贺新春”微信小程序功能,面向公众免费开放。重新复刻了这种传统的拜年形式,同时也提供了新的拜年形式。
用户仅需在曦灵小程序上传1张自己的照片,即可快速生成数字人拜年视频,还可根据输入的祝福文案,生成流畅的口播祝福语内容。
上述动作表明,百度试图跑通一条大模型的下沉之路:诸多基于大模型的应用,如生成式AI、数字人、语音技术融入到节日日常之中。
如果说蛇年春节红包与集福是AI整花活儿,那么这条下沉之路的目的则是让AI真正被人们用起来。
证明技术真正被用起来不需要复杂的技术分析,或是劳神费力的技术调研,春节期间,流传于各个微信群的大妈“广场舞”拜年视频已然给出了答案。
大妈广场舞视频折射出大模型明显降低了各个年龄段用户创作的门槛,进入到实际生活之中。反过来,用户使用频率大增,则将推动模型能力的增长——这或许是百度选择大模型下沉这条路的核心动因。
“AI味儿”的春节与“春节味儿”的AI
除了“34省智能体”、iRAG加持生图、飞帖拜年之外,百度在春节期间“整活儿”的动作还未停歇。
1月23日,“紫禁城里过大年”新春特展上,百度AI利用文心大模型iRAG等AI能力开发的“AI新春贺卡”,使观众可以在现场实时拍照、生成与故宫的新春AI合照及新年祝福语。AI亦开始展露与线下融合的趋势。
十年前,移动互联网创造了红包、集福、好运中国年的新民俗,而在以大模型为代表的智能时代,正在孕育新一轮的民俗。
人们对于年味的期待有着无限的表达欲求,需求刺激供给,为新技术落地的绝佳“练兵场”。百度或许只是为人们展示了智能时代改变移动互联网的冰山一角。
当技术下沉,汇聚到足够用户与使用之后,行业期待的“杀手级应用”,或许会在量变走向质变的过程中,逐渐揭开面纱。