智象未来团队荣膺ACM MM 2025最佳演示奖：从头界说对话式视觉创造

日期：2025-11-10 04:08:33 来源：米乐体育下载

　　ACM世界多媒体会议由世界计算机学会（ACM）主办，致力于推进多媒体全范畴的研讨立异与工业使用落地，是全球多媒体范畴最具威望性与影响力的学术盛会之一。每年会议评选的最佳演示奖，具有极高含金量和职业认可度，代表着评定委员会和与会学者对该技能立异性、实用性、成熟度和现场展示作用的最高必定。

　　智象未来获奖的“构思智能体”（Chat Generation）统一多模态智能体，以革命性技能将杂乱的视觉内容创造，转化为直观的对话体会。其中心长处是打破碎片化多模态技能东西的限制，在单一界面内无缝整合了文本生成图画、指令式图画修改及文本/图画生成视频功用，有用处理了跨模态语义对齐的职业难题。该技能根据170亿参数量的HiDream-I1模型，依托稀少分散Transformer（DiT）结构与动态混合专家（MoE）规划，在HPS、GenEval等世界威望基准测验中表现优异。而针对指令式图画修改使命，团队经过上下文视觉条件优化HiDream-I1模型，使其能够在必定程度上完结精准的图画修正作用。

　　该智能体创始了可及性、交互式视觉叙事和多模态生成AI中协作内容创造的新方法，经过将生成和修改融合于一个对话驱动的体会中，降低了高质量视觉内容创造的门槛，并明显缩短了迭代周期，实现从主意到优质产出的 “一次会话” 构思循环。现在，这一技能原型已成功迭代使用于智象未来旗舰产品vivago.ai的对话生成功用中，为用户更好的供给更天然、个性化的多模态对话交互体会。

　　此外，在本次ACM世界多媒体会议上，智象未来举办了Identity-Preserving Video Generation（IPVG）挑战赛。赛事招引了北大、上海交大、腾讯等国内外顶尖科研及企业团队参与，参赛者需求在生成视频的过程中坚持给定身份的一致性，完结人脸或全身身份坚持的使命。智象未来担任本次赛事主办，是世界顶会对其多模态视觉生成才能处于世界前沿的威望认证，显示了其研制团队在职业界的强壮号召力。

　　智象未来研制团队继续致力于将前沿学术效果落地，以中心技能驱动产品系统迭代晋级，并在剧烈商场之间的竞赛中赢得业界认可。自创建以来，智象未来对职业革新和商场开展坚持敏锐嗅觉，无论是对根底模型的研制立异，仍是对工业化开展的深度了解，均处于职业领头羊。此次取得ACM世界多媒体会议最佳演示奖，更是智象未来在技能、产品两边均具有硬实力的威望表现，印证了团队科研效果的前瞻性和打破性。

　　智象未来成立于2023年3月，由加拿大工程院外籍院士梅涛创建。在坚持自主研制的一起，智象未来继续推进高质量模型的开源敞开，并打造出首个登顶世界威望榜单的我国自研生成式AI模型。作为多模态生成式人工智能草创企业，智象未来正以自主立异为中心驱动力，继续推进我国生成式AI技能迈向更高水平，并以敞开、务实的姿势活跃融入全球AI立异生态，展示我国AI技能实力与立异担任。

上一篇:伟星ONE139【合肥最建议买的楼盘】

下一篇:大余县人民政府