AI日报:可灵1.5模型升级!上线人脸模型;华为Mate 70系列将支持AI隔空传送;Runway新增视频扩展画面功能
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://top.aibase.com/
1、可灵AI平台1.5模型升级:上线人脸模型功能 新增「标准模式」
可灵 AI 平台最近升级至1.5版本,推出多项新功能,包括增强的高品质视频生成模式和新增的标准模式,后者支持快速生成720p 视频。新的人脸模型功能面向高级会员开放,用户可在训练后随时生成视频。
【AiBase提要:】
🎨 高品质模式增强,用户可指定运动轨迹,添加静止区域,提供更精细的控制。
⚡ 新增标准模式,快速生成720p视频,创作时间大幅缩短,性价比高。
👤 人脸模型功能面向会员开放,解决人脸ID保持难题,支持随时调用生成视频。
2、Runway新增视频扩展画面功能“Expand Video”
Runway 近日推出 “Expand Video” 功能,用户可通过文本提示在原视频基础上生成额外视觉内容,并调整视频。该功能支持动态效果,如快速变焦和拉远镜头,使视频更加生动。此工具标着视频生成技术的又一进步,进一步丰富创作可能性。
【AiBase提要:】
🎥 新功能上线: RunwayML推出“Expand Video”,允许用户通过文本提示在原视频基础上扩展内容。
⚙️ 动态效果实现: 用户可以创造快速变焦和拉远镜头等动态效果,提升视频的视觉体验。
🚀 生成速度提升: 新一代Gen-3Alpha模型生成速度显著提高,满足用户快速创作的需求。
3、华为Mate70系列将支持AI隔空传送 余承东亲自演示
华为 Mate70系列即将发布,搭载 AI 隔空传送和魔法手势操作功能。用户可通过手势轻松传送内容,提升使用体验。此外,Mate70系列将首次搭载原生鸿蒙系统,标志着华为在移动操作系统领域的进展。
【AiBase提要:】
🤖 AI隔空传送:用户可通过简单手势将内容从Mate70手机传送至平板,操作便捷。
✋ 魔法手势操作:在不便用手时,用户可通过手势翻页等操作,增加灵活性。
🌐 原生鸿蒙系统:Mate70系列首次搭载原生鸿蒙系统,标志着中国在移动操作系统领域的进步。
4、Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒!
Lightricks 推出了名为 LTX Video 的开源视频生成模型,具有20亿参数。该模型可以以每秒24帧的速度生成高达5秒的视频,仅需4秒,性能显著。LTXV 与 ComfyUI 无缝集成,提升用户体验,促进创意产业的发展。
【AiBase提要:】
🚀 LTXV模型基于扩散变换器架构,拥有20亿参数,生成速度快于视频播放,4秒生成5秒视频。
💻 采用bfloat16精度,在主流显卡上高效运行,优化内存使用,确保视频质量。
🌍 LTXV与ComfyUI无缝集成,降低使用门槛,推动创意科技的民主化,为创作者提供无限可能。
详情链接:https://www.lightricks.com/ltxv
5、EchoMimicV2:输入图片、音频和手势视频即可生成“同款”数字人
EchoMimicV2是最新的动画生成技术,支持输入一张图、一段手势视频和一段音频,能够生成高质量的半身人类动画该技术通过 Audio-Pose Dynamic Harmonization 策略提升动画细节,简化生成过程,并引入头部局部注意力机制来解决数据稀缺问题。
【AiBase提要:】
✨ EchoMimicV2通过简化控制条件,实现高质量的半身人类动画生成。
🎨 采用 Audio-Pose Dynamic Harmonization 策略,提升动画细节与表现力。
📊 新基准评估方法显示,EchoMimicV2在效果上优于现有技术。
6、音频驱动生成面部视频技术JoyVASA
JoyVASA 是一种新兴的音频驱动图像动画技术,旨在提升视频质量和嘴形同步精度。其创新的两阶段设计使得生成更长的动画视频成为可能,同时支持人物和动物的动画化,展现出良好的多语言支持能力。
【AiBase提要:】
🎨 JoyVASA 技术通过解耦面部表情与三维模型,实现更长的动画视频生成。
🔊 该技术能够根据音频线索生成动作序列,具有人物与动物动画的双重能力。
🌐 JoyVASA 在中英文数据集上训练,具备多语言支持,为全球用户提供服务。
详情链接:https://jdh-algo.github.io/JoyVASA/
7、PicMenu:用AI将菜单可视化 随手一拍就能生成高质量菜单
PicMenu 是一款创新的 AI 菜单可视化工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的数字化展示。它为餐饮行业的数字化转型提供了全新解决方案,展现出极强的实用性和技术实力。
【AiBase提要:】
📸 PicMenu 能通过拍照自动识别并提取菜品信息,生成高质量的数字化菜单展示。
🌍 该工具采用多重 AI 技术栈,确保菜品信息提取和图像生成的高效性与准确性。
🔧 项目开源,开发者可通过 GitHub 获取源代码,便于个性化定制和部署。
详情链接:https://www.picmenu.co/
8、英伟达发布Edify3D生成模型2分钟即可生成高质量3D资产
NVIDIA 推出的 Edify3D 技术能够在两分钟内,根据文本描述或参考图像生成高质量的3D 模型,具备完整的 UV 贴图、4K 纹理和 PBR 材质。该技术结合了多视角扩散模型和基于 Transformer 的重建技术,显著提高了3D 资产的创作效率,支持多样化的应用场景。
【AiBase提要:】
🎨 Edify3D技术能在两分钟内生成高质量3D模型,支持完整UV贴图和4K纹理,适用于多种行业。
🔍 该技术结合了多视角扩散模型和Transformer重建技术,确保生成的模型具有精确的网格结构和高分辨率纹理。
🌐 Edify3D还支持根据文本提示生成复杂3D场景,提供了强大的艺术设计和3D建模支持。
详情链接:https://research.nvidia.com/labs/dir/edify-3d/
9、更聪明了!小米智能家庭屏系列产品推送大模型超级小爱
小米公司宣布对智能家庭屏系列产品进行大模型升级,增加超级问答和闲聊对话等新功能。此次升级覆盖六款设备,用户需通过小爱音箱 App 完成设置。升级后,音箱将支持文本创作,具备更全面的知识库,提升用户体验。
【AiBase提要:】
🔧 升级覆盖六款设备,包括Xiaomi智能家庭屏10和小米小爱触屏音箱Pro8等。
📱 用户需将音箱升级到最新版本,并在App中设置大模型功能。
🌐 新功能支持文本创作和实时搜索,用户可直接向音箱询问各种问题。
10、REDMI K80Pro搭载Xiaomi AISP2.0影像算法:融合四大模型
小米公司今日披露了REDMI K80系列手机的影像配置细节,标志着该系列在摄影能力上的全面提升。Xiaomi AISP2.0包含了融合光学大模型2.0、影调大模型2.0、色彩大模型2.0以及人像大模型2.0,这些技术的应用将进一步提升K80Pro的影像处理能力。
【AiBase提要:】
📷 REDMI K80系列搭载旗舰级高动态主摄和浮动长焦镜头,满足高质量摄影需求。
⚙️ K80Pro内置Xiaomi AISP2.0技术,支持150张全算法高画质快拍,提升拍摄体验。
💰 标准版与Pro版在主摄和体验上保持一致,但不含高成本浮动长焦镜头,提供更具性价比的选择。
11、胖东来发声明:警告多账号擅自利用AI生成于东来声音
胖东来商贸集团近日发布声明,警告多个账号未经授权使用其创始人于东来声音,并篡改视频内容。这些行为严重侵犯了公司的著作权和人格权,误导公众,影响品牌形象。胖东来表示将采取法律措施追究责任,以维护其合法权益和网络生态的正常秩序。
【AiBase提要:】
🔊 多个账号利用AI生成与于东来相似的声音,进行非法剪辑和篡改。
⚖️ 胖东来强调此行为侵犯著作权,并制造虚假信息,破坏网络生态。
🚫 公司要求相关账号立即停止侵权,并表示将采取法律行动。
12、2028年全球生成式AI芯片市场预计将达862.4亿美元
根据最新报告,生成式人工智能芯片市场正在经历快速增长,预计到2028年市场规模将达到862.4亿美元。这一增长反映了对计算能力的需求激增和云计算的普及。
【AiBase提要:】
🌟 市场规模预计到2028年将达862.4亿美元,年均增长率为27.9%。
💻 主要驱动因素包括计算能力需求增加、深度学习发展及云计算普及。
📈 高通推出新一代芯片,提升智能手机生成式AI能力,推动市场创新。