提交需求
赛事与广告咨询合作,请填写需求表单,我们会在第一时间与您联系!
AI设计观察是MEUX发起的体验洞察系列内容,定期汇总国内外设计动态,为大家带来最新行业资讯。
【1】Domo AI推出v2v真实模型
【2】讯飞星火浏览器插件新升级
【3】Hume AI发布语音引擎OCTAVE
【4】南洋理工大学推出超分技术InvSR
【5】腾讯推出ColorFlow
【6】OpenAI正式发布o3模型
【7】Krea AI上线自定义功能
【8】支付宝面向商家营销推出AI创意生成服务
【9】可灵1.6版本提升物理规律真实感
【10】Google推出AI生图工具Whisk
Domo AI推出v2v真实模型,可以进行反向操作,将动漫类型的视频转换成真人视频,还可以通过Prompt将视频里的对象转成别的真实事物,如将一个圣诞老人转成一只圣诞兔子,功能类似于Runway推出的Act one功能。
讯飞星火对其浏览器插件进行升级,增加了多项AI能力。集成了讯飞星火V4.0底层能力,兼容Chrome、Edge等主流浏览器。新增“继续提问”功能,随时深入讨论,获取高质量答案;实现网页全局对照翻译;新增“一键朗读”功能,实现边听边看;支持句子、段落总结。
Hume AI推出OCTAVE的文本与语音引擎,该引擎能够通过简单的文本描述一段5秒的语音录音,生成或克隆出逼真的语音和人格特质。不仅能够生成自然的语音,还能精确地模仿说话者的性别、年龄、口音、情绪语调及职业特定的说话风格,能够在毫秒级别内完成语音生成,实现了真正的实时对话,并且还允许用户实时动态地调整生成内容。
南洋理工大学的研究团队发布图像超分辨率(SR)技术,该技术基于扩散反演(Diffusion Inversion),通过充分利用大型预训练扩散模型中的图像先验信息,提升图像的分辨率和清晰度。与现有的超分辨率方法相比,这项技术具有更加灵活高效的采样机制,可以支持从一个到五个任意数量的采样步骤。
清华大学与腾讯ARC实验室的研究团队推出ColorFlow的新型图像序列上色模型。解决了在黑白图像序列上色的同时,保持角色和物体身份一致性的问题,能够利用上下文信息,通过参考图像池为黑白图像序列准确生成颜色。与以往需要针对每个角色进行微调的技术不同,ColorFlow通过具备泛化能力的检索增强上色管道,简化了色彩生成的过程。
OpenAI在第十二天技术直播中正式发布了o3模型,在全球著名的编码竞赛平台Codeforces中得分是2727,位于排列榜单第175名,超越了99.99%的人类。在数学竞赛AIEM2024中接近满分,在评估人工智能在高级数学推理方面能力的FrontierMath中成功率为25.2%,与之对比,GPT-4和Gemini1.5Pro的成功率不足2%。目前不知道o3什么时候放出,但是OpenAI又基于o3训练了3个小尺寸的o3模型,其中o3-mimi预估在1月底可以对外开放。
AI创意工具Krea AI宣布在Krea Editor推出自定义训练功能,可以在几秒钟内将真实产品添加到任何图像中。从官方的演示视频来看,在实际操作中只需涂抹需要替换的区域,如“涂抹模特脸上的墨镜”,然后选择商品图“VR眼镜”,AI就会自动处理,将VR眼镜戴到模特脸上。用户还可以继续扩图处理,用同样的方法继续涂抹区域,选择其它商品,AI就会把商品融合到模特身上。
支付宝宣布推出AI创意平台“蚂上有创意”,这是一个面向商务机构的AI营销服务。“蚂上有创意”可以为客户提供AI快速生成创意素材、营销广告智能分析等服务,还免费开放多项营销图片素材。据介绍,过去一年支付宝将AI全面应用于商业开放生态,共接入近70个业务场景,累计为生态商家机构生成8700万张AI素材。
快手旗下AI视频生成工具可灵(Kling)发布1.6版,主要在物理规律真实感、人物表演能力和语义理解水平三个核心维度提升。①对物理世界的精准演绎:在切西红柿的测试中,可灵1.6版展现出近乎专业厨师的精准操作,无论是刀具与食材的互动,还是切片的力度都非常真实。倒茶、猫咪踩沙发、狗狗奔跑等日常场景中的物理效果也更加真实;②人物表情和动作:从细微的眉头皱起到优雅的芭蕾舞姿,再到中国古典水下舞蹈,可灵1.6版都能准确捕捉人物细微的情感变化和复杂的肢体动作;③语义理解:更强的场景理解能力,无论是“摘下眼镜拥抱小鹿”这样的连续动作,还是“后退举枪”等复杂场景,都能准确理解并生成符合预期的视频内容。
Google发布新AI工具Whisk,允许用户使用图片作为提示词生成图片。可以上传图片来指定AI生成图像的主题、场景和风格,并且可以为这三者分别使用多张图片。如果你手头没有合适的图片,可以点击骰子图标,让谷歌自动填充一些图片作为提示。Whisk还为每张生成的图片提供了文字提示。如果对结果满意,可以收藏或下载图像,如果想要进一步优化,可以在文本框中添加更多文字,或直接点击图像编辑文字提示。
感谢阅读,转载请注明出处,违者必究,谢谢您的合作。申请转载授权后台回复【转载】。也欢迎加入MEUX,交互/视觉/用研,可投简历至meux-talent@baidu.com (注明信息获取来源如:UI中国)
关于我们:
MEUX,百度移动生态用户体验设计中心,负责百度移动生态体系的用户/商业产品的全链路体验设计。服务的产品包括百度APP、百度搜索、百度百科、百度贴吧、百度商业产品等。MEUX以「简单极致」为设计理念,创造极致用户体验的同时赋能商业,推动设计行业的价值和影响力,让生活因设计而更美好。
Powered by Froala Editor
大牛,别默默的看了,快登录帮我点评一下吧!:)
登录 立即注册