OpenAI的12份圣诞礼物,透露出AI公司领头羊的困境
声明:本文来自于微信公众号 AI新榜,作者:卷毛 阿虎,授权站长之家转载发布。
AI界最会营销的公司OpenAI,总算放完了所有的圣诞礼物。
从12月4日开始,OpenAI进行了为期12天的发布活动,每个工作日都有新的产品发布或功能演示。
一开始听到这个消息,大家都很兴奋,猜测AGI难道真的要来了?
虽然OpenAI的发布时间正好是北京时间的凌晨2点,但还是有不少AI媒体和玩家熬夜蹲守直播。
我们浅跟了两天,立马就发现被耍了,合理怀疑是Sam Altman变相“清库存”的手段。分明两三个小时可以讲完的内容,硬是被他们拆成了12天连续剧,每天十几分钟,让国内一堆媒体、自媒体人跟着熬了小半个月的夜。
社交平台上对此次直播的看法也褒贬不一:
说什么信什么的兴奋派
看好OpenAI的期待派
苦苦抱怨的等待派
会说真话的预言派(这12天中发布的新功能,确实没有开放)
奔向竞对的粉转路派
在大家对OpenAI“饱含期待又遗憾离去”的12天里,谷歌却密集地发布了很多AI产品,没有任何预告,出手就是“王炸”:
最近没有看直播的朋友不用遗憾,我们梳理了这12天的发布精华,借着复盘这次旷日持久的“新品发布会”,看看OpenAI这家曾经被捧上神坛的行业领头羊是如何失去昔日光芒的?
12天直播内容全盘点,
多少人乘兴而来败兴而归?
第一天
12月6日,OpenAI发布了o1模型正式版,其推理能力比之前有很大提升,响应速度也提高了50%以上。
这里最大的亮点是,OpenAI的研究员展示了o1如何在53秒内回答了相当专业的化学知识,并给出所有标准答案。
如果说OpenAI对于o1的迭代在意料之中,那么他同时推出每月200美元的ChatGPT Pro订阅服务,真的让我们大为震撼。
200美元,1460元人民币,什么概念?可以说,这些钱能为AI视频、AI音乐、AI聊天机器人等工作流程中涉及的所有国内AI工具买单。
这么想来,是不是太贵了?OpenAI你变了,说好的AI普惠呢?
要说毒舌还得是网友
第二天
第二天的直播,Sam Altman干脆不来直播间了。
这一轮发布的技术面向的是企业用户。企业用户可以利用“强化微调”(Reinforcement Fine-Tuning)技术,来定制自己的o1mini模型。
给大家解释一下“强化微调”技术,就是利用强化学习原理,进一步提升模型在特定领域的推理能力,使其在特定任务上表现更好。
这种技术可以提高模型的准确性,还能增强对类似问题的推理能力。
对于专门研究大模型的专家来说,这一技术很重要。但这个能力实际上要到明年才会真正公开推出。OpenAI还提到,如果个人用户有需求,可以尝试申请:
https://openai.com/form/rft-research-program/
第三天
Sam终于带着Sora走来了!12月10日凌晨,我们期待已久的视频生成模型Sora正式发布。
据OpenAI介绍,Sora支持用户生成最高1080p、最长20秒、多种尺寸比例的视频。用户可以使用文本、图像和视频三种方式提示Sora生成视频,并利用混合、重剪、融合和风格预设等功能对视频进行编辑修改。
但发布第一天,大多数用户就面临Sora网页崩溃,停止新用户注册的问题。
等了一年的期货,效果怎么说呢,相比国产AI视频模型已经没有太多优势了。“AI新榜”也在第一时间连线了首位华人艺术家Junie,邀请她分享用Sora成片的经验。
第四天
这一天,Sam Altman没有出现。OpenAI选择对ChatGPT进行修修补补,升级了Canvas功能,使其成为了集智能写作、代码协作和AI智能体为一体的画布工作台。
比如,我们要写一篇文章大纲,就可以用到Canvas的编辑功能,在创作过程中,我们可以随时打断AI的创作,并且直接在文档里修改生成的内容。AI会实时调整后续内容,保证其中的连贯性。Canvas让这一环节变得更像“共创”。
另外,团队还展示了代码调试的过程,能够实时编辑和修改错误代码,提出具体的代码修改建议,让用户一键应用。
可惜的是,Canvas目前不支持GPT o1模型,而同为开发者工具的明星产品Cursor不仅支持o1,还有更细致的功能集。
当然,这个曾经只向付费用户开放的功能,现在会面向所有ChatGPT用户开放使用,让更多人可以体验到AI辅助创作的优势。这算是OpenAI AI普惠计划的一小步?
第五天
Sam Altman出现了!这一天对OpenAI来说应该是个大发布。OpenAI宣布ChatGPT和苹果智能深度整合。
主要涉及三个方面:
首先是和Siri协作,Siri可以唤起ChatGPT,并将相关任务转移给ChatGPT处理。其次,用户长按iPhone16的相机控制按钮,可以让ChatGPT实时分析画面中的内容。另外,用户还可以使用ChatGPT撰写和细化文档内容。
据彭博社此前统计,ChatGPT为苹果、谷歌、微软等科技巨头带来了8万亿美元的红利。有报道称,OpenAI实现10亿用户目标的关键就是“和苹果合作”。
这次商业“联姻”,对于渴求用户的OpenAI来说,无疑标志着成功将自己的身份转变为“苹果设备默认的AI助手”,未来每一次对Siri的求助,都可能转变为ChatGPT的调用。
不过,这一次商业合作宣布后,ChatGPT还出现了长达4小时的故障。
网友的吐槽
值得一提的是,谷歌在同一天发布了Gemini2Flash这一全新模型,不仅实现了速度上的提升,还支持音频和图像的多模态输出能力。
一边是官宣商业化“联姻”,但对技术避重就轻,一边是AI领域的突破炸场,谁都能分辨孰强孰弱吧?
第六天
OpenAI在发布会的第六天,推出了高级语音模式视觉功能。
简单来说,就是ChatGPT能看到屏幕上的内容以及用户本人,通过视觉和听觉与用户互动,并进行反馈。
这一高级语音视觉功能,其实已经在5月份的时候展示过了。当时和GPT-4o模型一起发布,彼时,大家认为这是OpenAI版《Her》,对它充满了期待。
在直播演示环节,OpenAI研究人员根据ChatGPT和语音视觉功能的指示,制作了一杯咖啡。
再仔细想一想这个功能熟悉吗?其实就是智谱清言玩剩还开源的视频通话😀。换成OpenAI,还是先面向Plus用户开放。
第七天
12月14日,OpenAI为ChatGPT添加了“Projects”功能,方便用户组织管理聊天会话。
比如,“Projects”可以将聊天记录、文件和自定义指令都集中在一个“项目”中。我们可以自定义这个项目的颜色、名称,直接在项目里和ChatGPT对话。
另外,用户也可以把之前毫无逻辑的对话,通过搜索的方式找出来,整合到“Projects”中,类似一个文件夹的功能。
这一功能首先面向Plus、Pro和团队用户开放。
不过,为什么说OpenAI会营销呢?可能是觉得本场发布的功能太小,不够话题度。研究员在演示环节还露出了“AGI,请勿现场展示”的项目😅,颇有“此地无银三百两”的味道。
第八天
12月17日,ChatGPT的对话搜索功能ChatGPT Search面向所有用户开放。
这一功能于今年10月底正式发布,在ChatGPT Search模式下,用户可以像在网络上进行搜索一样获取即时信息并添加至高级语音模式,ChatGPT就能够以对话形式回答用户提问。但当时仅面向Plus和团队用户开放付费搜索服务。
做得好的搜索工具,不是只有你OpenAI,看看其他家Perplexity、昆仑万维.....
第九天
在直播活动进行到第九天时,OpenAI面向开发者宣布了开放其o1模型和API服务,在性能、灵活性和成本效益等方面均有升级。
连熬几个大夜的网友们都想吐槽一句,这一个功能没有必要开直播,在OpenAI上发一篇文章就可以解决问题了。
第十天
12月19日,OpenAI开放了ChatGPT通过WhatsApp访问的权限,用户可以通过WhatsApp向其发送文本,或者用美国电话拨打呼叫,和ChatGPT互动聊天,单次时长限制在15分钟。
直接打电话问AI,形式看起来很“传统”,但事实上能帮助不太会用手机的人群用上AI,在没网的时候也不怕没有AI助手了。坏消息是跟国内用户无关。
第十一天
这一天的发布依旧和苹果有关。OpenAI宣布ChatGPT支持Apple Notes、Quip和Notion等Mac端应用,用户现在可以将ChatGPT接入更多编码应用中,执行多种任务。
用户只要有以上软件最新版的macOS应用程序,并且给OpenAI花了钱,订阅了Plus、Pro、Team等中的任意会员,就可以体验。
但这一功能,是不可以和苹果合作那一天一起发布吗?需要额外占用一天时间?
第十二天
最后一天,OpenAI想要贯彻“最好的留到最后”,Sam Altman带着新一代推理o3模型来了。
从o1直接跳到o3,怎么回事?Sam解释说不叫o2是因为和一个英国的通信运营商撞名了......
据OpenAI官方给出的信息来看,o3和o3-mini能够处理更复杂的问题。这一模型在ARC-AGI测试中得分是o1的三倍,是首个突破ARC-AGI基准的模型,但还是期货。(ARC-AGI是一个专门用来测试人工智能模型对极其困难的数学和逻辑问题进行推理的能力基准测试。)
目前o3和o3-mini正处于内部安全测试阶段,OpenAI正在邀请外部研究人员申请测试这些模型,申请截止日期为2025年1月10日,o3-mini预计将于2025年1月底发布,完整的o3模型也将在此之后推出。
很多网友兴奋地宣布:这就是AGI。
数千美元解决一个任务,“越贵越好用”,在OpenAI这里得到了最好的诠释
Sam,请你自己说,这能是AGI吗?
“o3系列不是奇点,不是AGI,因为人们甚至无法访问这些模型”,终于有AI博主坐不住出来说话了。
ARC评测联合创始人在内的很多研究者表示“o3仍未达到通用人工智能的水平,它在一些简单任务上仍然表现不佳,和人类智能之间存在本质差异。
他们还补充提到,只有不再能设计出对普通人容易,但对人工智能困难的任务时,那就意味着通用人工智能真的到来了。
总而言之,o3真的让AI向前进了一步,但用户期待已久的AGI仍未出现。不过,如果要从这12天的直播中选出一个惊喜的产品,那应该只有o3了。
OpenAI成也营销,败也营销?
提问:如果我是OpenAI,请用一句话攻击我最薄弱的地方。
AI回答:反响平平的发布会,接连流失的AI人才,以及持续不断的烧钱大战。
回顾这12天的发布内容,我们可以发现这几天科技版的头条一定非OpenAI莫属。但其中有诚意的产品寥寥无几。
“新产品”Sora是OpenAI最大的期货,但却并非完整版。5月份惊艳众人的实时视频通话模式,到12月才全面开放,甚至有媒体吐槽“现在连微软都能做到这功能”。满血版o1来了,随之而来的也是更昂贵的付费模式。网友们期待的图像模型、GPT-5都未见其身影。
两年前,OpenAI凭借GPT模型脱颖而出,成为当之无愧的AI届新秀,甚至是AI的代名词。
而两年后,人们再看OpenAI以“藏着掖着”的方式发布的新产品,无疑都能在其他家找到更好的技术和产品。
以OpenAI视频生成模型Sora为例,在谷歌发布Veo2之后,社交平台X上最多的评价是:Veo完胜Sora。
刚发布的腾讯混元视频模型也能与Sora掰掰手腕。
曾经的明星企业,在一年时间内几乎失去了它原本的光芒。这种光芒不仅仅是指OpenAI旗下的产品,更是他本身的核心班底、AI策略和规划。
今年下半年,OpenAI接二连三陷入组织动荡和人才流失的事件中。据《晚点LatePost》此前报道,截至今年10月,OpenAI631位核心贡献者中,已明确有80位已经离开OpenAI。上周五,GPT论文的主要贡献者Alec Radford官宣离开了OpenAI。
在AI策略和规划上,Sam Altman仍想改造OpenAI,坚定地将其变成一家营利公司。与此同时,AI领域的下一个飞跃却迟迟未曾出现。
12月21日,有报道称OpenAI GPT-5模型的开发面临多重困难,成本花费巨大,但还是没有达到预期效果。有分析显示,GPT-5为期6个月的训练仅成本就高达5亿美元。
但纵使训练资金充裕,也使OpenAI在GPT-5训练上接连卡壳。OpenAI研究员提到,要让GPT-5变得更聪明,就需要更高质量更多元的数据。而现有的新闻报道、互联网帖子、研究论文等都不足以满足GPT-5的需求。
所以,Sam Altman在11月时表示,2024年不会发布任何名为GPT-5的产品。
而比OpenAI技术进展更瞩目的,是OpenAI CEO精湛的营销手段。
我们当然认可OpenAI带来的技术能力上的突破,持续不断地为人们带来新的惊喜,但自始至终,AI是一个凭借“能力”才能让普通人感到魅力的技术。只有底层技术实现了突破,上游的产品层才能有更多的空间,将AI普及到更多普通人的日常生活中。
换句话说,可能对于更多人而言,紧密关系普通人的生活,或者因为AI的关系,产生的更多未知和话题性,才更有吸引力。
一些“重磅”“最强”“最新”技术,请先我们让“感受”到,再用2000美元来蛊惑我给AI打工。
有报道称OpenAI计划推出2000美元的订阅会员
或许,让我们觉得“差点意思”的并非是OpenAI没有发挥他应有的实力,而是我们没有像2022年底那样感受到ChatGPT式的爆款。