百度开源ERNIE-Image,消费级显卡也能跑AI生图了

2026年4月22日

87

847

百度开源ERNIE-Image,消费级显卡也能跑AI生图了

AI生成图片赛道近年来竞争日趋激烈,从Midjourney到DALL-E,各家产品持续迭代升级,但始终采用闭源收费模式——要么收取订阅费,要么按API调用次数计费。这种商业模式虽然保障了厂商的收益,却也将大量个人开发者和中小企业拦在了高算力门槛之外。直到百度近期的一项决定,彻底打破了这一局面。

实测表现:10秒出图,质量究竟如何?

百度宣布开源文生图模型ERNIE-Image,采用业界最宽松的Apache 2.0协议,这意味着用户可以自由下载、修改,甚至商业使用,无需支付任何费用。更令人惊叹的是,ERNIE-Image包含8B DiT参数版本,能够在4090等消费级显卡上流畅运行,堪称消费级显卡领域的"Nano Banana"。同时开源的还有蒸馏版本ERNIE-Image Turbo,仅需8步推理即可生成高保真图片,在保持质量的前提下大幅提升出图速度。

与GPT-IMAGE-2对比:消费级显卡的逆袭

经过实测,ERNIE-Image基本能在10秒左右完成一张图片的生成。在多个场景测试中,其表现堪称惊艳:漫画手稿复刻高度还原手绘痕迹;纪录片视频截图除了画面主体外,还精准还原了播放器UI和双语字幕;写实照片在玻璃白板上的手绘作品呈现完美的景深和反光效果;商业摄影级别的产品图展现出高级感的光影处理;人像照片发型挑战中,角色一致性保持得相当出色。更值得一提的是,ERNIE-Image在文字渲染方面表现出色,中文、英文、数字、拼音乃至符号都能精准呈现。

人,才是一切的目的。能交回到普通人手里的技术,才是好技术。

“科技评论人”

多项对比测试显示差距

在创意海报、动漫角色、游戏截图等场景与GPT-IMAGE-2的对比中,可以明显看到:ERNIE-Image在整体布局和审美上与GPT-IMAGE-2相差无几,但在细节丰富度上确实略逊一筹。然而,考虑到ERNIE-Image能够在消费级显卡上运行,而GPT-IMAGE-2可能需要更高端的计算资源,这种差距就显得可以接受了。可以说,ERNIE-Image就像一位零氪平民玩家,凭借精妙的走位与氪金大佬打了个五五开。

技术普惠的更大意义

除了模型本身,百度还提供了提示词增强器功能,能够将用户简短的输入扩展为更详细、结构化的提示词,进一步激发模型的生成能力。同时上线的官方提示词库,也为用户提供了丰富的参考案例。 开源不仅是技术层面的突破,更体现了百度将AI能力普惠化的决心。百度这次表面上是开源,实际上是把被算力门槛拦在门外的人,重新拉回了AI这张牌桌。正如文章所言:"人,才是一切的目的。能交回到普通人手里的技术,才是好技术。"

如有侵权,请联系删除。

Related Articles

联系我们 获取方案
小墨 AI