AI日报:可灵AI API对口型能力全面开放;豆包大模型宣称追平GPT-4;百度2024年度AI提示词“答案”;智谱深度推理模型GLM-Zero
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、可灵AI API对口型能力全面开放、虚拟试穿升级至V1.5模型
北京快手科技有限公司近日宣布可灵AI(Kling)API完成新一轮升级,主要在虚拟试穿和对口型功能上取得显著进展。升级后的V1.5模型支持“上装+下装”组合服装,提升了试穿体验的真实感。同时,对口型能力的全面开放,使得生成的视频内容更加生动,带来了全新的创作可能性。这些技术进步将为电商、广告营销等领域的客户提供强大的支持,推动视觉内容的创新与发展。
【AiBase提要:】
👗 可灵AI的V1.5模型支持组合服装,提升虚拟试穿的真实感与实用性。
🎤 对口型能力全面开放,实现视频人物口型与配音的完美同步。
🚀 升级将助力企业用户在业务增长上迈出新的步伐,推动视觉内容创新。
2、豆包大模型宣称已追平GPT-4,首次披露300万长文本能力
字节跳动旗下的豆包大模型在2024年度技术进展报告中宣布,其最新版本Doubao-pro-1215在综合性能上已与GPT-4全面对齐,并在某些专业领域表现更为出色。这一进展标志着中国大模型技术的崛起,显示出其在理解精度和生成质量上的显著提升,尤其是在复杂场景中超越了GPT-4,同时提供了更具竞争力的服务价格。
【AiBase提要:】
🚀 豆包大模型在综合性能上已与GPT-4全面对齐,并在部分专业领域表现更强。
💡 通过优化数据处理和创新模型架构,豆包在理解精度和生成质量上取得显著进步。
📚 首次公开300万字的超长文本处理能力,处理延迟控制在15秒以内。
3、智谱深度推理模型 GLM-Zero 预览版上线
智谱华章科技有限公司在年度收官时发布了其首个基于扩展强化学习技术的推理模型GLM-Zero的初代版本GLM-Zero-Preview。该模型专注于提升AI在数理逻辑、代码编写等领域的推理能力,表现出色。尽管与OpenAI的模型仍有差距,但公司计划持续优化,扩展其应用领域。用户可以在智谱清言平台体验该模型,开发者也可通过API调用。
【AiBase提要:】
🚀 GLM-Zero-Preview专注于提升AI的推理能力,尤其在数理逻辑和代码编写方面表现出色。
🛠️ 用户可在智谱清言平台免费体验GLM-Zero-Preview,支持文字和图片上传,输出完整推理过程。
📈 随着训练量增加,GLM-Zero-Preview在深度推理方面的效果稳步提升,展现了强化学习的重要性。
详情链接:https://chatglm.cn/main/gdetail/676411c38945bbc58a905d31?lang=zh
4、百度发布2024年度AI提示词——“答案”
在2024年的尾声,百度发布了年度AI提示词“答案”,反映了人们对AI的依赖与期待。随着人们频繁向AI寻求解答,诸如“答案”、“为什么”等词汇揭示了社会情绪与个人困惑。百度通过分析高频提示词,展示了AI如何融入人们的日常生活,成为思考与情感的寄托。
【AiBase提要:】
🤖 AI成为人们生活中寻求答案的重要工具,反映了社会的情感与迷茫。
🔍 高频提示词揭示了人们在生活、工作与情感方面的普遍问题与渴望。
🌟 百度强调AI将继续作为人类的伙伴,共同探索未来的可能性与未知领域。
5、通义发布2024年轻人AI使用趋势报告:85、90后关注AI比例更高
根据《2024年轻人AI使用趋势报告》,AI的应用已广泛渗透到生活的各个层面,尤其在工作、学习和创意表达中备受关注。95后、女性及企业管理者对AI的关注度最高。超过80%的受访者表示对AI工具保持高度关注,近一半的受访者每天使用AI,显示出AI已成为生活中不可或缺的一部分。
【AiBase提要:】
🧑🎓95后、女性和企业管理者对AI的关注度显著上升,超过80%的受访者高度关注AI工具。
🎨 AI被广泛应用于创意表达和娱乐活动,年轻人乐于尝试AI生成内容。
🔍 尽管对AI的期待增加,但人们对数据隐私的关注也在上升,需保持警觉。
6、OpenAI CEO公布2025年新技术产品,AGI 、成人模式引发热议
OpenAI首席执行官Sam Altman宣布将在2025年推出多项新技术产品,尤其是通用人工智能(AGI)和智能体功能,吸引了广泛关注。新产品的发布体现了OpenAI在人工智能领域的持续创新,尤其是针对用户反馈的响应,显示出公司对市场需求的敏感度。成人模式的推出引发了网友的热烈讨论,期待能带来更开放的内容生成体验。
【AiBase提要:】
🌟 OpenAI计划于2025年推出AGI、智能体等新产品,展示其在人工智能领域的持续创新。
💬 成人模式引起网友关注,期待提供更开放的内容生成体验。
📈 Altman的技术发布源于用户反馈,反映出OpenAI在产品开发中对用户需求的重视。
7、智元机器人开源全球首个百万真机数据集AgiBot World
智元机器人联合多方机构开源了AgiBot World数据集,这是全球首个基于真实场景的百万真机数据集,旨在推动人形机器人技术的发展。该数据集的规模和质量均超越了现有的同类产品,将极大促进机器人大模型的训练和应用。
【AiBase提要:】
🌍 AgiBot World是全球首个基于全域真实场景的百万真机数据集,支持泛化和通用的机器人大模型训练。
📦 数据集涵盖家居、餐饮、工业等五大核心场景,包含3000多种真实物品和80多种技能视频。
📈 智元机器人计划未来开源千万仿真数据,推动人形机器人技术的广泛应用。
详情链接:https://github.com/OpenDriveLab/agibot-world
8、Hugging Face 推出 SmolAgents:三行代码打造智能代理,简化AI开发
Hugging Face的SmolAgents工具包为AI开发带来了革命性的变化,使得智能代理的创建变得前所未有的简单和高效。通过仅仅三行代码,开发者可以利用预训练模型快速构建功能强大的智能代理,极大地降低了开发门槛。SmolAgents的轻量级设计和直观API使得各个技能水平的开发者都能轻松上手,快速完成任务。
【AiBase提要:】
🚀 SmolAgents通过三行代码简化智能代理的创建,降低了开发门槛。
📊 该工具包利用预训练模型,支持语言理解、智能搜索和动态代码执行等功能。
💻 SmolAgents适用于各种开发场景,快速完成任务,适合个人开发者和小型团队。
详情链接:https://github.com/huggingface/smolagents
9、上海市新增9款已完成登记的生成式人工智能服务
上海市网信办近期发布公告,新增9款生成式人工智能服务的登记,旨在推动本市生成式人工智能的创新与规范应用。此次登记工作使总登记数量达63款,强调所有上线服务需标明上线编号,以提升透明度和用户信任。新登记的服务包括无忧智面、AI同步口语练等,旨在为用户提供更安全可靠的服务环境。
【AiBase提要:】
📈 上海市新增9款生成式人工智能服务,登记总数达到63款,促进行业健康发展。
🔍 所有上线的生成式人工智能应用必须标明上线编号,提升服务透明度。
💡 新增服务包括无忧智面、AI同步口语练等,旨在为用户提供安全、可靠的使用体验。
10、超贵!OpenAI o3模型单次查询竟高达1000美元!
OpenAI最近推出的o3AI模型被认为是其最强大的人工智能产品,但运行成本令人咋舌,单次任务费用超过1000美元。o3在ARC-AGI基准测试中表现优异,得分达到87.5%,几乎是前一代o1模型的三倍。然而,这种显著的性能提升伴随着巨大的开销,使得业界对其经济性产生了担忧。
【AiBase提要:】
💸 o3AI模型的单次查询成本超过1000美元,显示出其运行的高昂费用。
📊 在ARC-AGI基准测试中,o3得分达到87.5%,几乎是前一代o1模型的三倍。
🔍 目前o3尚未向公众发布,预计“迷你版”将于明年1月推出。
11、Nvidia 成功收购 Run:ai 并决定开源其 GPU 管理软件
Nvidia 最近完成了对以色列软件公司 Run:ai 的收购,旨在提升 AI 云计算的管理效率。虽然具体收购金额未披露,但该交易价值约为7亿美元。Nvidia 宣布将开源 Run:ai 的软件,以支持更广泛的 AI 生态系统。Run:ai 的软件能够高效调度 Nvidia GPU 资源,优化 AI 运算性能。
【AiBase提要:】
🌟 Nvidia 完成对 Run:ai 的收购,并宣布将开源其软件,以促进 AI 技术的发展。
💻 Run:ai 的软件能有效调度 Nvidia GPU 资源,提升 AI 运算效率。
🤝 Run:ai 将继续为客户提供支持,致力于最大化 AI 基础设施的使用效率。