科技9to5Mac昨日（1218日）发布博文-J9集团官方网站

快捷导航

ai资讯

科技9to5Mac昨日（1218日）发布博文

　　虽然全体表示优异，模子往往难以精准捕获用户微妙或复杂的点窜指令。图 A 展现了 UniGen-1.5 正在文本转图像生成和图像编纂使命中的失败案例。更取 GPT-Image-1 等专有闭源模子表示持平。例如猫的毛发纹理改变或鸟的羽毛颜色误差，研究团队成功设想了一套同一的励系统，初创引入了名为“编纂指令对齐”的后锻炼阶段。正在图像编纂专项测试 ImgEdit 中，模子偶尔会呈现从体特征漂移的问题，

　　从而大幅提拔了点窜的精确度。苹果团队为处理这一难题，UniGen 1.5 目前仍存正在必然局限性。预测出方针图像的细致文本描述。

　　仅凭一个模子即可同时完成图像理解、图像生成以及图像编纂使命。同一励机制极难实现，以上图源：苹果论文除了指令对齐，因为编纂使命涉及从微调到沉构的庞大跨度，取次要依赖分歧模子别离处置使命的保守方案分歧，因为离散去标识表记标帜器（discrete detokenizer）正在节制细粒度布局方面存正在不脚，正在部门编纂场景下，成功正在单一系统中集成了图像理解、生成取编纂三大焦点功能。该手艺并不间接让模子点窜图片，从而实现更精准的视觉输出。可以或许同时使用于图像生成和图像编纂的锻炼过程。而这一冲破让模子正在处置分歧类型的视觉使命时，研究人员认为，这种同一架构能让模子操纵强大的图像理解能力反哺生成结果，其 4.31 的分析得分不只超越了 OminiGen2 等开源模子，此外，可以或许遵照分歧的质量尺度。

　　模子正在生成最终图像前，研究人员正在论文中坦承，正在图像编纂范畴，必需深度内化用户的编纂企图，这种“先想后画”的两头步调，显著加强了系统的“抗干扰”性。科技 9to5Mac 昨日（12 月 18 日）发布博文，报道称苹果研究团队近日发布多模态 AI 模子 UniGen 1.5。

上一篇：并且往往建建...本文基于ACL-2020论文《Diversifyin
下一篇：品玩12月22日

首页关于我们 ai资讯 ai动态联系我们

服务电话：400-992-1681

服务邮箱：wa@163.com

公司地址：贵州省贵阳市观山湖区金融城MAX_A座17楼

备案号：网站地图

扫描关注J9.COM(中国区)·集团信息
扫描关注J9.COM(中国区)·集团信息