恭喜你成为UI中国推荐设计师 (详情)
//百度统计 20220402 uicn

您的意见是我们 UI 中国进步的动力!
点击立即反馈按钮,发表您的意见!
立即反馈
QQ群反馈
您也可以加入UI中国官方反馈群进行反馈!
群号:302892100
备注:反馈问题后@管理员能让我们及时了解您的意见

提交需求

赛事与广告咨询合作,请填写需求表单,我们会在第一时间与您联系!

0/20
0/200

设计大赛

  • 设计大赛
  • 发布广告
  • 发布招聘
  • 其它需求

提交完成
感谢您对UI中国的支持和信赖!
MEUX 「一月」 AI设计观察
16.9°
2025-02-06 原创文章 行业资讯 举报 4104 8 18 0

AI设计观察是MEUX发起的体验洞察系列内容,定期汇总国内外设计动态,为大家带来最新行业资讯。


【1】Domo AI推出v2v真实模型

【2】讯飞星火浏览器插件新升级

【3】Hume AI发布语音引擎OCTAVE

【4】南洋理工大学推出超分技术InvSR

【5】腾讯推出ColorFlow

【6】OpenAI正式发布o3模型

【7】Krea AI上线自定义功能

【8】支付宝面向商家营销推出AI创意生成服务

【9】可灵1.6版本提升物理规律真实感

【10】Google推出AI生图工具Whisk



1.Domo AI推出v2v真实模型


Domo AI推出v2v真实模型,可以进行反向操作,将动漫类型的视频转换成真人视频,还可以通过Prompt将视频里的对象转成别的真实事物,如将一个圣诞老人转成一只圣诞兔子,功能类似于Runway推出的Act one功能。



2.讯飞星火浏览器插件新升级


讯飞星火对其浏览器插件进行升级,增加了多项AI能力。集成了讯飞星火V4.0底层能力,兼容Chrome、Edge等主流浏览器。新增“继续提问”功能,随时深入讨论,获取高质量答案;实现网页全局对照翻译;新增“一键朗读”功能,实现边听边看;支持句子、段落总结。




3.Hume AI发布语音引擎OCTAVE


Hume AI推出OCTAVE的文本与语音引擎,该引擎能够通过简单的文本描述一段5秒的语音录音,生成或克隆出逼真的语音和人格特质。不仅能够生成自然的语音,还能精确地模仿说话者的性别、年龄、口音、情绪语调及职业特定的说话风格,能够在毫秒级别内完成语音生成,实现了真正的实时对话,并且还允许用户实时动态地调整生成内容。



4.南洋理工大学推出超分技术InvSR


南洋理工大学的研究团队发布图像超分辨率(SR)技术,该技术基于扩散反演(Diffusion Inversion),通过充分利用大型预训练扩散模型中的图像先验信息,提升图像的分辨率和清晰度。与现有的超分辨率方法相比,这项技术具有更加灵活高效的采样机制,可以支持从一个到五个任意数量的采样步骤。




5.腾讯推出ColorFlow


清华大学与腾讯ARC实验室的研究团队推出ColorFlow的新型图像序列上色模型。解决了在黑白图像序列上色的同时,保持角色和物体身份一致性的问题,能够利用上下文信息,通过参考图像池为黑白图像序列准确生成颜色。与以往需要针对每个角色进行微调的技术不同,ColorFlow通过具备泛化能力的检索增强上色管道,简化了色彩生成的过程。




6.OpenAI正式发布o3模型


OpenAI在第十二天技术直播中正式发布了o3模型,在全球著名的编码竞赛平台Codeforces中得分是2727,位于排列榜单第175名,超越了99.99%的人类。在数学竞赛AIEM2024中接近满分,在评估人工智能在高级数学推理方面能力的FrontierMath中成功率为25.2%,与之对比,GPT-4和Gemini1.5Pro的成功率不足2%。目前不知道o3什么时候放出,但是OpenAI又基于o3训练了3个小尺寸的o3模型,其中o3-mimi预估在1月底可以对外开放。




7.Krea AI上线自定义功能


AI创意工具Krea AI宣布在Krea Editor推出自定义训练功能,可以在几秒钟内将真实产品添加到任何图像中。从官方的演示视频来看,在实际操作中只需涂抹需要替换的区域,如“涂抹模特脸上的墨镜”,然后选择商品图“VR眼镜”,AI就会自动处理,将VR眼镜戴到模特脸上。用户还可以继续扩图处理,用同样的方法继续涂抹区域,选择其它商品,AI就会把商品融合到模特身上。




8.支付宝面向商家营销推出AI创意生成服务


支付宝宣布推出AI创意平台“蚂上有创意”,这是一个面向商务机构的AI营销服务。“蚂上有创意”可以为客户提供AI快速生成创意素材、营销广告智能分析等服务,还免费开放多项营销图片素材。据介绍,过去一年支付宝将AI全面应用于商业开放生态,共接入近70个业务场景,累计为生态商家机构生成8700万张AI素材。




9.可灵1.6版本提升物理规律真实感


快手旗下AI视频生成工具可灵(Kling)发布1.6版,主要在物理规律真实感、人物表演能力和语义理解水平三个核心维度提升。①对物理世界的精准演绎:在切西红柿的测试中,可灵1.6版展现出近乎专业厨师的精准操作,无论是刀具与食材的互动,还是切片的力度都非常真实。倒茶、猫咪踩沙发、狗狗奔跑等日常场景中的物理效果也更加真实;②人物表情和动作:从细微的眉头皱起到优雅的芭蕾舞姿,再到中国古典水下舞蹈,可灵1.6版都能准确捕捉人物细微的情感变化和复杂的肢体动作;③语义理解:更强的场景理解能力,无论是“摘下眼镜拥抱小鹿”这样的连续动作,还是“后退举枪”等复杂场景,都能准确理解并生成符合预期的视频内容。




10.Google推出AI生图工具Whisk


Google发布新AI工具Whisk,允许用户使用图片作为提示词生成图片。可以上传图片来指定AI生成图像的主题、场景和风格,并且可以为这三者分别使用多张图片。如果你手头没有合适的图片,可以点击骰子图标,让谷歌自动填充一些图片作为提示。Whisk还为每张生成的图片提供了文字提示。如果对结果满意,可以收藏或下载图像,如果想要进一步优化,可以在文本框中添加更多文字,或直接点击图像编辑文字提示。



感谢阅读,转载请注明出处,违者必究,谢谢您的合作。申请转载授权后台回复【转载】。也欢迎加入MEUX,交互/视觉/用研,可投简历至meux-talent@baidu.com  (注明信息获取来源如:UI中国)

关于我们:
MEUX,百度移动生态用户体验设计中心,负责百度移动生态体系的用户/商业产品的全链路体验设计。服务的产品包括百度APP、百度搜索、百度百科、百度贴吧、百度商业产品等。MEUX以「简单极致」为设计理念,创造极致用户体验的同时赋能商业,推动设计行业的价值和影响力,让生活因设计而更美好。

Powered by Froala Editor

更新:2025-02-06

收藏

8人已收藏

百度MEUX

百度移动生态用户体验设计中心 简历投MEUX@BAIDU.COM

  • 189

    作品

  • 3580

    粉丝

  • 0

    关注

  • 工业品的专业化探索—爱采购商品详情页升级
  • 寻找国宝计划—探寻传统文化与数字艺术的文化创新
  • 百度APP评论场景AI角色设计实践
  • 百度APP“捏一下看早晚报”,最新资讯轻松掌握
相关标签
运营设计

    猜你喜欢

      2025-02-06 原创文章 行业资讯 举报 4104 8 18 0

      MEUX 「一月」 AI设计观察

      16.9°

      你确定要举报MEUX 「一月」 AI设计观察

      如果查出恶意举报,十天内禁止提交任何举报申请。

      0/200

      上传证据: 超过10M的附件请使用网盘地址

      点击上传附件

      对谁可见:

      全部设计师
      • 全部设计师
      • 推荐设计师和认证设计师

      您确认要推荐?

      该作品发布时间:2025年02月06日

      评分

      完整度

      启发性

      勤奋性

      排版布局

      推荐心得

      建议20-200字以内

      0/200

      18
      8
      0

      账号或密码错误,请重新输入

      账号或密码错误,请重新输入

      登录

      手机号

      发送验证码 120s 验证码错误

      登录
      第三方账号登录