AI日报:广电总局整治AI“魔改”视频乱象;Hailuo AI上线AI语音克隆功能;OpenAI将发布全新Sora
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、广电总局发布“管理提示”整治AI“魔改”现象,经典影视遭恶搞
广电总局针对AI“魔改”视频现象发布管理提示,强调治理措施以保护经典文化。近期多部经典影视剧被恶搞改编,引发公众对传统文化的关注。管理要求各省局督促短视频平台清理相关内容,并落实生成式AI内容审核,以防止误导和侵权。
【AiBase提要:】
🚫 广电总局发布提示,要求治理AI“魔改”视频现象,保护经典文化。
🎥 多部经典影视剧被恶搞改编,影响公众对传统文化的认知与价值观。
🔍 平台需严格审核生成式AI内容,避免误导和侵犯版权。
2、海螺AI海外版上线超强AI语音克隆功能
海螺AI最近推出了其海外版的音频克隆模块,用户只需10到60秒的音频样本即可完美复刻自己的声音。这一技术突破在中文语音克隆领域引起了广泛关注,许多用户对其出色的音频克隆效果感到惊喜。该系统不仅操作简单,还支持多种语言和情绪选择,极大地满足了用户的需求。
【AiBase提要:】
🌟 只需10到60秒音频,海螺AI即可完美复刻用户声音,突破了中文语音克隆的瓶颈。
🎤 系统支持12种语言,用户可选择不同情绪,丰富语音表现。
💻 目前海螺AI音频功能免费使用,用户可轻松创建多个声音模型。
详情链接:https://www.hailuo.ai/audio
3、Runway Act One更新:将你的表演和声音无缝融入视频角色
Runway Act One的最新更新为视频制作带来了革命性的变化,允许用户将自己的表演和声音直接应用于其他视频角色,实现完美同步。这一技术突破不仅降低了创作门槛,还为影视创作提供了前所未有的灵活性,创作者可以随时随地进行试镜和表演转移。
【AiBase提要:】
🎭 多维度表演转移:动作、声音和表情可以无缝移植到任何角色上。
📱 便捷试镜:演员可随时用手机拍摄,轻松将表演转移到目标角色。
🖥️ AI结合:使用Midjourney等工具,创作者能将短视频延展为完整表演。
详情链接:https://top.aibase.com/tool/runway
4、OpenAI 即将发布全新 Sora 视频生成器,支持多种生成方式
OpenAI 最近在伦敦 C21Media 大会上宣布即将推出更新版的 Sora 视频生成器,该版本将支持文字、图像和视频的多种生成方式,极大地提升了用户的视频创作体验。新版本在效率和速度上都有显著提升,预计将在12月的冬季推广活动中正式发布,同时可能还会推出 GPT-4.5等其他新功能。
【AiBase提要:】
🌟 更新版 Sora 视频生成器将支持文字、图像及视频生成视频,提升创作灵活性。
🚀 新版生成器在速度和效率上都有显著提升,增强用户体验。
📅 预计将在12月的冬季推广活动中发布,可能同时推出 GPT-4.5等新功能。
5、超高清视频修复工具VISION XL 模糊视频一键变清晰
随着科技的进步,VISION XL作为一款视频修复和超分辨率工具,以其卓越的性能和易用性脱颖而出。它不仅能够修复视频缺失部分和去除模糊,还能显著提升视频清晰度,最高可达四倍超分辨率。其基于潜在扩散模型的处理框架,减少了对额外预训练模块的依赖,使得高分辨率视频的处理效率大幅提升。
【AiBase提要:】
✨ VISION XL能够修复视频缺失部分,去除模糊,提升清晰度,最高可达四倍超分辨率。
⚙️ 采用基于潜在扩散模型的处理框架,减少对额外预训练模块的依赖,提升处理效率。
🚀 仅需13GB显存即可处理25帧视频,处理时间不超过2.5分钟,适合快速应用场景。
详情链接:https://vision-xl.github.io/
6、马斯克旗下社交网络平台X上线图像生成器Aurora
埃隆·马斯克的社交网络X最近推出了新图像生成器Aurora,旨在创造照片般真实的图像。尽管上线后不久部分用户无法访问该功能,Aurora仍然允许用户生成包括米老鼠在内的公共和版权人物图像,且没有限制。该工具在生成静物和景观图像方面表现出色,但也存在一些不足,如图像中的物体融合不自然和人像缺失手指等问题。
【AiBase提要:】
🌟 新图像生成器Aurora上线,用户可生成多种图像。
🚫 部分用户在上线后几小时内无法访问该功能。
💰 X社交平台将Grok功能向所有用户开放。
7、谷歌新发布Gemini-Exp-1206模型横扫对手,超越ChatGPT成为AI新王
谷歌最新推出的Gemini-Exp-1206模型在生成AI领域引起了广泛关注,凭借1379的高分在LMArena排行榜上超越了ChatGPT-4.0的1366分,展现了其卓越的综合能力。尽管Gemini-Exp-1206在多项评估中表现出色,但在投票数量上仍落后于ChatGPT-4.0,显示出后者在可靠性方面的优势。
【AiBase提要:】
🌟 Gemini-Exp-1206在LMArena排行榜上取得1379分,超越ChatGPT-4.0的1366分。
🗳️ ChatGPT-4.0获得21,929票,明显高于Gemini-Exp-1206的5052票,显示出其可靠性。
🔍 Gemini实验模型为开发者提供了前所未有的AI体验机会,但仍处于测试阶段,不适合生产使用。
详情链接:https://ai.google.dev/gemini-api/docs/models/experimental-models?hl=zh-cn
8、NegToMe重新定义图像生成:降低版权风险 提升多样性改善视觉效果
NegToMe是一项颠覆性的图像生成技术,利用图像驱动的对抗性指导方法,突破了传统负面提示的局限,显著提升了生成图像的多样性和质量。它通过降低生成内容与版权作品的相似度,解决了版权保护的问题,同时在跨域应用中也表现出色,为创作者提供了更大的创意自由。未
【AiBase提要:】
🎨 NegToMe通过图像驱动的对抗性指导方法,显著提升了生成图像的多样性,尤其在种族和性别处理上表现突出。
🔒 该技术降低生成内容与版权作品的相似度,测试显示相似性降低了34.57%,有效解决版权保护问题。
⚙️ NegToMe集成便捷,开发者只需少量代码即可应用,推理时间几乎不受影响,兼容多种扩散模型。
详情链接:https://github.com/1jsingh/negtome
9、X向所有用户开放Grok AI 普通用户也可以白嫖生图了
xAI最近宣布其聊天机器人Grok已向全球用户开放,提供了一个低成本的AI体验机会。用户在免费版本中受到一些使用限制,如每日图像创作和信息发送数量的限制。这一举措不仅吸引了更多用户了解AI技术,也反映了xAI在推广产品时的商业策略。
【AiBase提要:】
🖼️ Grok允许用户每天最多创作或分析3张图片。
💬 用户在两小时内只能发送10条信息,以控制使用频率。
📈 xAI通过免费开放Grok来吸引用户,未来可能推出更多付费功能。
10、Google Photos推出2024年度照片回顾:AI智能生成,记录你的精彩瞬间
随着数字科技的发展,Google Photos推出了2024年度照片回顾功能,利用AI技术为用户提供个性化的体验。通过Gemini AI,用户可以获得智能生成的照片标注,回顾重要时刻和拍摄数据。尽管这一功能为用户带来了分享美好回忆的机会,但也可能唤起一些不愉快的回忆。
【AiBase提要:】
🤖 AI技术生成个性化的照片标注,突出年度重要时刻。
📊 提供详细的拍摄数据统计,方便用户分享个人指标。
😢 可能唤起一些不愉快的回忆,AI尚未完全理解用户的情感需求。
11、OpenAI 决定与军方承包商合作,内部员工发声反对!
OpenAI与安杜瑞尔的合作引发员工的强烈反响,许多人对技术在军 事上的应用表示担忧,要求更多透明度。尽管管理层强调合作仅限于防御系统,但员工对这一界限表示怀疑。
【AiBase提要:】
🌐 OpenAI与安杜瑞尔的合作引发员工对AI军 事应用的担忧。
🛡️ 管理层强调合作仅限于防御系统,但员工对技术应用的限制性表示怀疑。
📉 政策转变显示OpenAI开始接受其技术在军 事领域的应用。
12、AI 专家:一次 ChatGPT 查询相当于需要浪费半升水
生成式人工智能的快速发展带来了环境问题,尤其是能源和水资源的消耗。凯特・克劳福德教授在讲座中指出,若不采取可持续性措施,生成式人工智能的能耗将在一年内达到与日本相当的水平。
【AiBase提要:】
🌍 一次 ChatGPT 查询会浪费半升水,提醒人们关注人工智能对水资源的影响。
⚡ 生成式人工智能的能耗可能在一年内达到日本的水平,需制定可持续发展计划。
🤝 可持续性应成为人工智能行业的首要任务,而不是竞争排名。
-
上一篇
女生与小说的浪漫邂逅,从拒绝到热爱 -
下一篇
临高实现用气报装“零跑腿”