{dede:global.cfg_webname/}

当前位置: 首页 > 科技 > 科技快讯 > 正文

最强文生图开放模型!超大杯Stable Diffusion免费:更简单

来源:快科技    时间:2023-07-27 15:41:35

  7月27日,Stable Diffusion最强版本,来了!

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  刚刚,SDXL 1.0正式发布,可免费在线试玩。

  效果上,无论是以假乱真的写实大片:

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

超现实的熊猫喝啤酒:

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

还是赛博朋克漫画,都非常nice~

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024 x 1024)。

  而且还支持在网页上直接对生成图像进行后期编辑。

  (有一股和Midjourney、Firefly打擂台的味儿了)

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

网友们已经按捺不住上手试玩了~

  和基础Stable Diffusion相比,SDXL 1.0生成结果更加准确和逼真。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  而且官方表示,提示词也能比之前更简单了。

  这是因为SDXL 1.0的基础模型参数量达到了35亿,理解能力更强。

  对比基础版Stable Diffusion,参数量只有10亿左右。

  由此,SDXL 1.0也成为当前最大规模的开放图像模型之一。官方甚至直接说这就是世界上最好的开放图像模型。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

话不多说,我们来上手体验了~

  把马斯克印在青花瓷上

  SDXL 1.0在操作上很便捷,直接输入prompt即可,还能从下面勾选风格、尺寸参数等。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  一次生成默认是出4张图,如果不满意还可以点下方“加号”让它继续画。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  官方介绍说,现在让SDXL 1.0生成大作,无需再加入“杰作”这种提示词了。

  让它生成一幅日漫风格的图像,画风非常贴合,而且在光影的处理上也更加自然了。

  1990s anime low resolution screengrab couple walking away in street at night

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  或者是一幅风景照?也能以假乱真了。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

甚至是让马斯克站在中式庭院里,抬头斜望着天空……

  Elon Musk in an ancient Chinese palace

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  或者是把苹果收购了?

  在「WWDC」上,他举着全新款iPhone向人们展示,身边还围满了记者和粉丝(doge)。

  Elon Musk releasing new iPhone at WWDC

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  除了这些老马的洋葱新闻之外,绘画风格的作品效果也不错。

  左边的是齐白石水墨风格,而右边是一幅漫画。

  左:Elon Musk delivering a speech, ink painting, Qi Baishi style右:Elon Musk comic

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  除了绘画,也可以把老马放进我们的元青花。

  Elon musk in the shape of Yuan Dynasty Blue and White Porcelain

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  上面展示的这些「老马的故事」,用的prompt都比较简单。

  但从效果并没有因为提示词简单而拉胯,这也与官方的说法相印证。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  不过我们还是想看看,如果用更加复杂精致的prompt,会是什么样子?

  我们找到了Midjourney创作的一张老马在苏联担任汽修工人的珍贵照片,重新喂给MJ,让它生成个prompt。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

MJ生成了下面这样的prompt,我们就用它来测试SDXL:

  Elon Musk(这里MJ生成的是a man) standing in a workroom, in the style of industrial machinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  风格完全符合我们的预期,细节也还不错。

  再来一个复杂prompt的图作为收尾,同样是MJ根据此前的作品生成后喂给SDXL。

  elon musk eating food with chopsticks, in the style of peter coulson, cross-processing/processed, pinhole photography, herb trimpe, james tissot, transavanguardia, spot metering

  左边是SDXL的作品,右边是MJ的原版,大家可以对比一下。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  提示词同样支持中文,不过似乎会在给出结果中倾向于国风,准确性可能也会受到影响。

  比如输入“一只老虎在海边”后,意外给出了一个国风妹子。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  效果大家都已经看到了,那么SDXL生成图片的速度如何呢?

  对于免费用户来说,时间主要花费在排队上了,不过也不会等待太久。

  在5.5秒的时间内,排队人数从160减少到了99。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  除了生成图像外,SDXL还提供了很多后期编辑功能。

  具体来说,包括去除背景、细节处理、画幅扩增等等。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  这些功能是SDXL所在的Clipdrop平台上已有的,而SDXL可以一键将生成的图片传入对应模块。

  这里我们选择背景消除功能展示一下,可以看出边缘的细节几乎没有什么破绽。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  目前,SDXL的免费使用额度还是比较高的,登录后每个账户每天可生成400张(需要排队)。

  月付的价格是9美元每月,年付则相当于7美元(约50元人民币)每月,包含了1500张每天的SDXL额度,且无需排队。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  不过不同区域的价格似乎也有所区别,比如阿根廷的年付价格平摊到每月是742比索(约合19.4元人民币或2.7美元)。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  此外,由于付费版本实际上是Clipdrop平台的Pro订阅,所以也包含了该平台的其他功能。

  除了Pro账户,还有API版本可供开发者使用(可以访问Stability AI、Amazon等平台)。

  开放图像模型中的“最大杯”

  在最新博客中,Stability AI介绍了SDXL 1.0的更多技术细节。

  首先,模型在规模和架构上都有了新突破。

  它创新性地使用了一个基础模型(base model)+一个细化模型(refiner model)。

  二者的参数规模分别为35亿和66亿。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  这也使得SDXL 1.0成为目前规模最大的开放图像模型之一。

  Stability AI创始人莫斯塔克(Emad Mostaque)表示,更大规模的参数量能让模型理解更多概念,教会它更深层次的东西。

  同时在SDXL 0.9版本还进行了RLHF强化。

  这也是为什么现在SDXL 1.0支持短提示词,而且能分清红场(the Red Square)和一个红色的广场(a Red Square)。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  在具体合成过程中,第一步,基础模型产生有噪声的latent,然后由细化模型进行去噪。

  其中基础模型也可以作为独立模块使用。

  这两种模型结合能生成质量更好的图像,且不需要消耗更多计算资源。

  官方介绍SDXL 1.0可以运行在8GB VRAM的消费级GPU上,或者是云端。

  除此之外,SDXL 1.0在微调也有了提升,可以生成自定义LoRAs或者checkpoints。

  Stability AI团队现在也正在构建新一代可用于特定任务的结构、风格和组合控件,其中T2I/ControlNet专门用于SDXL。

  不过目前这些功能还处于beta测试阶段,后续可以关注官方更新。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  总结来说,文生图都是一个逐渐迭代的过程,SDXL 1.0的目标就是让这个过程更加简单。

  莫斯塔克表示,现在只需要5-10张图片,就能快速微调模型。

  从用户反馈中也能看到,相较于Stable Diffusion,SDXL 1.0更能让大家满意。

最强文生图开放模型!超大杯Stable Diffusion免费来袭:提示词也更简单

  实际上,从今年4月以来,Stability AI就发布了SDXL最早的测试版。

  6月份开始进行内测,前段时间发布了0.9版本,当时就预告了会在7月发布一个开放版本,即最新的1.0版本。目前相关代码权重已经发布在GitHub上。

  而且Stability AI机器学习负责人表示,相较于SDXL 0.9,1.0版本降低了对算力的需求。

  感兴趣的童鞋快去试玩吧~

  试玩入口:https://clipdrop.co/stable-diffusion

  GitHub:https://github.com/Stability-AI/generative-models

  参考链接:

  [1]https://stability.ai/blog/stable-diffusion-sdxl-1-announcement

  [2]https://venturebeat.com/ai/stability-ai-levels-up-image-generation-launch-new-stable-diffusion-base-model/

  [3]https://techcrunch.com/2023/07/26/stability-ai-releases-its-latest-image-generating-model-stable-diffusion-xl-1-0/

声明:来源非IT商业科技网的作品均转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:342 4350 938@qq.com

频道精选
最强文生图开放模型!超大杯Stable Diffusion免费:更简单

最强文生图开放模型!超大杯Stable Diffusion免费:更简单

  7月27日,Stable Diffusion最强版本,来了!  刚刚,SDXL 1 0正式发布,可免费在线试玩。  效果上,无论是以假乱真的写实大片:
2023-07-27
没5G 华为手机暴涨76.1%!份额已追平小米

没5G 华为手机暴涨76.1%!份额已追平小米

  7月27日,第二季度,华为手机市场份额同比暴涨76 1%,追平小米,并列第五。  快科技7月27日消息,IDC发布的手机季度跟踪报告显示,20
2023-07-27
加拿大森林大火直接排放超10亿吨二氧化碳,已成全球性环境事件

加拿大森林大火直接排放超10亿吨二氧化碳,已成全球性环境事件

  7月27日,于今年5份发生的加拿大森林大火已经烧了两个多月,但至今仍未被扑灭。  截至当地时间7月26日,加拿大全国累计发生4774处火
2023-07-27
国内刚批准收购 美国公司宣布放弃收购SSD主控一哥

国内刚批准收购 美国公司宣布放弃收购SSD主控一哥

  7月27日,2022年5月份美国半导体公司迈凌科技宣布斥资38亿美元收购SMI慧荣科技,后者是全球最大的SSD主控芯片厂商。  过去一年中,这
2023-07-27
小米最强无短板全能折叠屏来了!这些第一要拿到手软

小米最强无短板全能折叠屏来了!这些第一要拿到手软

  7月27日,小米手机今天终于官宣与徕卡联合打造的小米MIX Fold 3将于8月发布,没意外的话,该机将在2023雷军年度演讲上发布。  据了
2023-07-27
已有上千人拼团成功,携程火车卧铺女性拼团功能走红

已有上千人拼团成功,携程火车卧铺女性拼团功能走红

  7月27日,携程旅行近期上线了卧铺同性拼团功能,该功能引发关注,目前已有上千人体验了这一功能。  携程火车票产品总监刁洪雨表示,
2023-07-27
鸿蒙智杖”上架华为商城 买到手我人傻了

鸿蒙智杖”上架华为商城 买到手我人傻了

  7月27日,众所周知,万物互联是华为鸿蒙的终极目标,手机平板都是基本操作,鸿蒙汽车也见怪不怪,哪怕是一只电动牙刷都能加入鸿蒙生态
2023-07-27
东方甄选回应抖音直播间被关:突发情况 紧急在APP上销售

东方甄选回应抖音直播间被关:突发情况 紧急在APP上销售

  7月27日,新东方旗下的电商品牌东方甄选这两年靠抖音直播走红,迅速成为头部电商之一,然而日前网友发现他们的抖音直播间被关了,东方
2023-07-27
国内玩家规模已接近人口一半,你玩游戏么?

国内玩家规模已接近人口一半,你玩游戏么?

  7月27日,本届ChinaJoy的 CDEC(中国国际数字娱乐产业大会)高峰论坛上,中国音数协游戏工委主任委员张毅君正式对外发布《2023年1-6月
2023-07-27
等iPhone 15还是Mate 60,九月份旗舰大战我站华为

等iPhone 15还是Mate 60,九月份旗舰大战我站华为

  7月27日,根据目前已知消息看,苹果、华为的年度旗舰产品将会在9月份正式开战,先不说两者到底谁强谁弱,单说敢在9月份正面对抗iPhone
2023-07-27

2017-2019 Copyright © IT商业科技网 备案许可证号粤ICP备2022153948号 豫公网安备110102003388号

紧急处理QQ:133 4673 445@qq.com