AI日报:赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、国产大模型再突破!DeepSeek R1开源,性能直逼OpenAI,开启AI平权新时代
DeepSeek最近发布并开源了其最新研发的大型语言模型R1,标志着国产AI技术的一次重大突破。该模型在性能上与OpenAI的o1正式版相媲美,特别是在数学、代码和自然语言推理等关键任务上表现优异。
【AiBase提要:】
🌟 DeepSeek R1在后训练阶段应用强化学习技术,显著提升推理能力。
📊 开源了660B参数的DeepSeek-R1和DeepSeek-R1-Zero模型,同时提供了6个小模型,丰富了开源生态。
💰 API定价更具竞争力,缓存命中每百万输入tokens仅需1元,鼓励用户商用。
详情链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
2、月之暗面发布新一代SOTA模型 k1.5:多模态推理能力再升级
月之暗面公司推出的k1.5多模态思考模型,标志着多模态推理和通用推理领域的重大突破。该模型具备卓越的多模态处理能力,能够同时处理文本、图像和声音等信息,提升了对复杂任务的理解和应对能力。k1.5的强大通用推理能力使其在编程、数学问题求解等多种应用场景中表现出色。
【AiBase提要:】
🌟 k1.5模型具备卓越的多模态推理能力,能够同时处理文本、图像和声音信息。
🤖 强大的通用推理能力使k1.5适用于编程、数学等多种任务,灵活性极高。
📱 目前k1.5模型的预览版已在Kimi.com和Kimi智能助手App上线,用户可体验新功能。
3、免费试用!智谱推出 AI 生视频产品清影2.0已在智谱清言全量上线
北京智谱华章科技有限公司推出了AI生视频产品清影2.0,经过全面升级,显著提升了模型能力和视频生成质量。新版本能够生成自然流畅的动作和精美画面,用户只需简单提示即可实现复杂场景。同时,清影2.0在艺术风格上也有了突破,支持多种风格的视频生成。
【AiBase提要:】
🚀 清影2.0的基础模型能力提升38%,生成自然流畅的视频内容。
🎨 新版本支持多种艺术风格的视频生成,提升画面美感。
💡 用户通过简单提示词即可实现复杂场景,展现创意与稳定性。
详情链接:https://chatglm.cn/video?lang=zh
4、豆包App推出新语音模式,抢先GPT-4o实现唱歌和角色扮演
豆包 App 最新发布的“端到端”语音大模型在实时语音通话功能上进行了重要更新,标志着其在语音交互领域的重大突破。新模型整合了语音识别、理解和生成能力,具备人类般的表达和情感输出,提升了对话的智能水平。新的人格模式增加了互动的趣味性,使得豆包在情感陪伴和心理咨询等领域的应用场景更为广泛。
【AiBase提要:】
🎶 新的“端到端”语音大模型整合了语音识别、理解和生成,提升了对话流畅度。
🌟 新增的“灵魂歌手”和“百变大咖”模式使豆包能够唱歌和进行角色扮演,展现独特个性。
🤖 新的人格模式“受气小包”和“夸夸大师”增强了互动趣味性,拓展了AI的应用场景。
5、OpenAI 即将推出能控制电脑的 AI 工具 “Operator”
OpenAI 正在研发一款名为 “Operator” 的 AI 工具,预计将在2025年1月发布。该工具能够自主控制个人电脑,执行包括编写代码和预定旅行在内的多项任务。尽管在某些安全评估中表现良好,但其在执行任务的成功率上仍低于人类,专家对其潜在安全隐患表示担忧。市场分析预计,AI 代理市场将在未来几年内迅速增长。
【AiBase提要:】
🔍 OpenAI 的 “Operator” 工具将具备自主控制电脑的能力,能够执行多种任务。
🛠️ 尽管 “Operator” 在某些任务上表现不如人类,其成功率相对较低。
⚠️ 专家对 “Operator” 的潜在安全隐患表示关注,尽管其在安全评估中表现良好。
6、支持中文字体!美图WHEE「AI海报」功能即将上线
美图公司近日宣布即将推出WHEE应用的「AI海报」功能,旨在通过人工智能技术简化海报制作流程。用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体,满足个性化需求。此外,该功能提供强大的自定义排版能力,涵盖多个核心场景,帮助用户高效设计。
【AiBase提要:】
🎨 用户可通过简单输入生成多种风格的海报,支持中文字体。
🛠️ 提供强大的自定义排版能力,适用于电影、电商等多个场景。
✨ 「免抠素材」功能已上线,支持生成多种风格的定制化PNG素材。
7、百度文库AI功能月活跃用户突破9000万,付费用户超4000万
在近日的百度AI开放日活动中,百度副总裁王颖分享了百度文库在AI技术应用方面的显著进展。平台的月活跃用户已超过9000万,付费用户数突破4000万,显示出AI功能的强大吸引力。过去一年,百度文库新增了100多项AI功能,涵盖智能PPT、全网搜等创新工具,极大地提升了用户的文档处理和学习体验。
【AiBase提要:】
📈 月活跃用户突破9000万,日活跃用户同比增长230%,显示了平台的强大吸引力。
🛠️ 新增100多项AI功能,包括智能PPT和全网搜,满足用户多样需求,提升文档处理效率。
🎨 '自由画布'功能开启公测,支持多任务并行处理,简化创作流程,增强用户体验。
8、世界首个聊天机器人 ELIZA 复活,源自60年前的代码
最近,一个来自美国和英国的研究团队成功复活了历史上第一个电子聊天机器人 ELIZA 的代码。这段代码最初由麻省理工学院教授约瑟夫・韦岑鲍姆在1960年代编写。研究人员在发现原始代码后,经过技术调整,使其重新运行,尽管存在一些问题,如输入数字时程序崩溃。
【AiBase提要:】
🗨️ ELIZA 是第一款电子聊天机器人,其代码由约瑟夫・韦岑鲍姆在1960年代编写。
💻 研究团队成功复活了这段代码,并解决了多项技术问题,使其能够正常运行。
📜 ELIZA 在计算机历史上具有重要意义,被认为是聊天机器人的开创者。
9、中国科研团队重磅发布VideoChat-Flash 长视频处理速度提升100倍
中国科研团队推出了VideoChat-Flash系统,利用层次化视频标记压缩技术HiCo,显著提升了长视频处理的效率。该技术通过减少冗余信息,降低了计算需求,同时增强了模型的理解能力。实验结果显示,该系统在多个基准测试中表现优异,成为长视频处理领域的先进模型。
【AiBase提要:】
🌟 研究人员提出层次化视频标记压缩技术HiCo,显著降低长视频处理的计算需求。
📹 “VideoChat-Flash”系统采用多阶段学习方法,结合短视频和长视频进行训练,提升了模型的理解能力。
🔍 实验结果显示,该方法在多个基准测试中达到了新的性能标准,成为长视频处理领域的先进模型。
详情链接:https://arxiv.org/abs/2501.00574
10、告别传统爬虫!Firecrawl Extract无需编写代码,轻松抓取任何网站的数据
Firecrawl Extract的推出标志着网络爬虫时代的逐渐落幕。借助其自然语言处理和强大功能,用户无需再为编写爬虫脚本而烦恼,而是可以专注于数据分析与应用,显著提高工作效率。这一创新的工具使得数据抓取变得更加智能、简便,推动了数据采集技术的进一步发展。
【AiBase提要:】
🛠️ Firecrawl Extract通过自然语言处理技术,允许用户仅通过文字提示提取网站数据,省去繁琐的编程过程。
🌍 该工具支持多语言和国际网站的数据抓取,能够处理JavaScript渲染的动态页面内容,确保数据的精准获取。
🔗 提供API接口,便于与其他应用集成,支持大规模数据处理,满足大数据分析的需求。
详情链接:https://github.com/mendableai/firecrawl
11、2024年出货的笔记本电脑中,超25%具备生成式AI功能
Counterpoint的最新市场研究报告显示,2024年全球PC市场将显著增长,预计出货量达到2.53亿台,较2023年增长2.6%。这主要受Windows10支持结束和新一代AI笔记本电脑推出的推动。预计2024年第四季度出货量同比增长3.7%,企业IT系统升级需求增加,AI笔记本电脑将改变用户体验,推动市场发展。
【AiBase提要:】
🌍2024年全球PC出货量预计达到2.53亿台,同比增长2.6%。
💻 超过25%的新笔记本电脑将具备生成式AI功能,推动市场升级。
📈2025年预计AI笔记本电脑将占据市场近60%的份额,商业订单有望增长。