智象未来团队荣膺ACM MM 2025最佳演示奖:从头界说对话式视觉创造
ACM世界多媒体会议由世界计算机学会(ACM)主办,致力于推进多媒体全范畴的研讨立异与工业使用落地,是全球多媒体范畴最具威望性与影响力的学术盛会之一。每年会议评选的最佳演示奖,具有极高含金量和职业认可度,代表着评定委员会和与会学者对该技能立异性、实用性、成熟度和现场展示作用的最高必定。
智象未来获奖的“构思智能体”(Chat Generation)统一多模态智能体,以革命性技能将杂乱的视觉内容创造,转化为直观的对话体会。其中心长处是打破碎片化多模态技能东西的限制,在单一界面内无缝整合了文本生成图画、指令式图画修改及文本/图画生成视频功用,有用处理了跨模态语义对齐的职业难题。该技能根据170亿参数量的HiDream-I1模型,依托稀少分散Transformer(DiT)结构与动态混合专家(MoE)规划,在HPS、GenEval等世界威望基准测验中表现优异。而针对指令式图画修改使命,团队经过上下文视觉条件优化HiDream-I1模型,使其能够在必定程度上完结精准的图画修正作用。
![]()
该智能体创始了可及性、交互式视觉叙事和多模态生成AI中协作内容创造的新方法,经过将生成和修改融合于一个对话驱动的体会中,降低了高质量视觉内容创造的门槛,并明显缩短了迭代周期,实现从主意到优质产出的 “一次会话” 构思循环。现在,这一技能原型已成功迭代使用于智象未来旗舰产品vivago.ai的对话生成功用中,为用户更好的供给更天然、个性化的多模态对话交互体会。
![]()
此外,在本次ACM世界多媒体会议上,智象未来举办了Identity-Preserving Video Generation(IPVG)挑战赛。赛事招引了北大、上海交大、腾讯等国内外顶尖科研及企业团队参与,参赛者需求在生成视频的过程中坚持给定身份的一致性,完结人脸或全身身份坚持的使命。智象未来担任本次赛事主办,是世界顶会对其多模态视觉生成才能处于世界前沿的威望认证,显示了其研制团队在职业界的强壮号召力。
![]()
![]()
智象未来研制团队继续致力于将前沿学术效果落地,以中心技能驱动产品系统迭代晋级,并在剧烈商场之间的竞赛中赢得业界认可。自创建以来,智象未来对职业革新和商场开展坚持敏锐嗅觉,无论是对根底模型的研制立异,仍是对工业化开展的深度了解,均处于职业领头羊。此次取得ACM世界多媒体会议最佳演示奖,更是智象未来在技能、产品两边均具有硬实力的威望表现,印证了团队科研效果的前瞻性和打破性。
智象未来成立于2023年3月,由加拿大工程院外籍院士梅涛创建。在坚持自主研制的一起,智象未来继续推进高质量模型的开源敞开,并打造出首个登顶世界威望榜单的我国自研生成式AI模型。作为多模态生成式人工智能草创企业,智象未来正以自主立异为中心驱动力,继续推进我国生成式AI技能迈向更高水平,并以敞开、务实的姿势活跃融入全球AI立异生态,展示我国AI技能实力与立异担任。
下一篇:大余县人民政府