AI 文生图新赛道:Ideogram 精准生成文字,海报设计更轻松
当 AI 文生图比拼真实度、艺术感, 开辟了一个刁钻的赛道:在图片上精准生成文字,并且字体和排版都好看。
这个需求并不小众,一键生成海报、插画,还不用 P 图,能够省不少事,很适合对设计一窍不通的普通人。
我们之前写过 的 1.0 版本。8 月 21 日,2.0 版本来了,真实感更好了,海报更有设计感了,文字这个看家本领也更强了。
你或许从来没有听说过它,这是一款前 员工开发的 AI 产品,缺点不少,但长板能「弯道超车」。
指路
AI 想知道,你说的悟空,是哪个悟空
有个特别新手友好的功能:「魔法提示」。
你直接输入中文提示词,它会帮你翻译成英文,同时帮你优化。作为一款海外产品,这样的操作很能收买人心。
同时, 主打五种风格:普通、写实、设计、3D、动漫,都很好理解,所以选择起来也不会让人纠结。
先来个简单的中文提示词,「拿着金箍棒的孙悟空」,动漫风格,让 AI 帮我翻译和优化,看看它能自由发挥成什么模样。
当水灵灵的《七龙珠》版悟空出来的时候,我惊了一下,一看提示词,AI 把孙悟空翻译成了「Son Goku」,那就不奇怪了。
而且,也很想问问 ,是不是太明目张胆,给版权费了么。
为了避免 AI 再误解,再输入提示词的时候,我不偷懒了,强调「孙悟空」是「Sun 」,不是「Son Goku」。
这次走写实风格,并且规定了比较详细的场景,大圣身穿铠甲,手拿金箍棒,神情肃穆,威风凛凛,站在佛窟前,温暖的橙色调,图片底部写着「Black Myth: 」(黑神话:悟空)。
文字没有错误,大写字母冲击感强,佛窟的氛围也营造了三分,但「大圣」的气质差了点、形象返祖了点,眼神里也没有光。
用相同的提示词让 生成一次,文字既有错误又没设计感,但稍帅一筹的「大圣」和页游的画风弥补了这一点。
▲ 生成
不甘心的我又试了 3D 风格,提示词基本保持不变,只是把底部的文字改成了「8 月 20 日游戏上线」。
结果, 生成的结果很像某个国风 Q 版盲盒系列的宣传图,画面处理得很干净,但完全不是我脑海里的 3D 游戏风格,还把美猴王画出了二郎神的模样。
并且 AI 也从中暴露了自己,虽然它对英文的文字渲染得心应手,却对中文一窍不通,这个缺陷从 1.0 延续到了 2.0。
看来海外产品不够理解国内的传统文化, 第一回合的表现有些令人失望,却也不失趣味。
团队说过,2.0 版本不输 Flux 和 DallE。最近,Flux 真实版 LoRA 生成的 TED 演讲照片因为真假难辨,骗过了不少网友的眼睛。那么就来测测, 生成的结果能多像照片。
▲ Flux 生成
选择写实风格后,我输入了中文提示词,TED 演讲照片,幻灯片标题为「 2.0 发布」,上面有三个要点:「文字准确」「擅长设计」和「更真实」,女性演讲者站在白板前,背景中有几个人。
可以看出, 的语义理解是不错的,该有的元素都有,TED 的标志几乎以假乱真,演讲者和观众的表情都很生动,头发和皮肤比较自然。
不过,细节处理得还不够好,虽然要求生成的文字没有问题,随机出现的一些小字坏了一锅粥,人物的手指和身体也不太对劲,但已经比之前的 1.0 版本强太多了。
至于海报设计,可以说是 吊打其他文生图 AI 的「舒适区」了。
如果以票房异常火爆的《异形:夺命舰》为考题,AI 能设计出那种不可名状的恐怖感觉吗?
我选择了设计风格,用提示词描述了一下画面的要素,并特别提及,海报底部写上一句:「未成年观众谨慎观看。」
总体的效果让人眼前一亮,长串的文字也成功生成了,只有一处小错误,但特别不写实,更像美漫的画风,和真人电影不太相配。
我再以暑期档烂片《红楼梦之金玉良缘》为灵感,让 生成海报,提示词写到的背景、装饰物乃至人物都在其中了,再次感叹提示词的跟随性真的不错。
片名当然也写对了,但字体像借鉴了指环王,有些出戏,整体风格更像花木兰动画电影。
的「设计风格」偏向二次元,比较独特,但反过来想,这也局限了海报的使用场景。
小结一下, 是一款很有自己特色的 AI 文生图产品,写实的水平和 Flux 相近,艺术感和 各有千秋。
▲「rainy 」图案
但文字生成水平独一档,比较适合用来生成海报、插画、广告、表情包、T 恤印花等。
人类评估的结果显示, 2.0 在提示词对齐、整体表现和文本渲染质量方面,都比 Flux Pro 和 DALL·E 3 更好。
▲ 但这是 自己的说法
可玩性高又接地气,这样的 AI「甜品」不妨多来一些
去年 8 月 22 日, 宣布成立,与 2.0 发布正好相隔一年。
创始团队共 7 人,来自 Brain、加州大学伯克利分校、卡内基梅隆大学和多伦多大学,其中 4 位是 文生图扩散模型 研究论文的作者。
这次除了发布 2.0, 还推出了 iOS app,国内可以直接下载, 版计划稍晚发布,从网页到移动端,我们可以随时随地生成图片了。
▲ 手机端界面
目前向所有用户免费开放,不过,额度非常有限,生成 5 次共 20 张照片后, 就提醒我,10 个积分用完了,请明天再来。(当然,隔壁的 免费生成 25 张也没有显得多大气。)
如果很少接触文生图,想要一款文生图 AI 用来入门的, 是个不错的选择。
输入中文提示词、用「魔法提示」翻译和优化是一方面,另外, 还有很多选项帮你生成更接近脑海所想的画面。
提供范围有限的选项让用户「点击」,相比在空白的输入框完成「输入」,交互起来更简单。想要什么图片比例、什么风格、什么色调, 都可以让你挑选。
▲ 不同色调的「戴珍珠耳环的少女吃麦当劳」
不会写提示词,那也可以画出来,让 帮我们化腐朽为神奇。
我为我的糟糕画工感到抱歉,但 AI 能够领会意思,优化了线条和上色,还加了个背景,格调一下子上去了。有了 AI,谁不是神笔马良。
另外,网页版的输入框下面,都是他人生成的作品,遇到喜欢的,我们可以查看和参考提示词。 表示,他们的用户在过去一年生成了超过 10 亿张公开可见的图片。
如果想要生成一个特定的对象,但又不知道怎么写提示词, 这次还推出了用文本搜索公共创作库的功能,但这个功能目前需要会员。
▲ 搜索「cat」的结果
总而言之, 是一款可玩性较强的文生图产品。
它可以比较精准地生成用户所需的文字内容,并适配各种风格的图片,就业领域很广。
▲ 博客
偶尔还能带来情绪价值,以图言志,虽然做的表情包太偏欧美互联网的审美了。
▲「我想玩《黑神话:悟空》」表情包
的整体质量不差,文本功能强大,对新手友好,使用方便,交互也让人愉悦。当 AI 工具兼具了创意、便利和分享价值,就很容易让人上头。
一个照着模子刻出来的世界太无聊了,洞察到很小的需求,然后将解决办法做到行业第一,那也很有意思。
世界上有很多的产品,同时有更多的受众,我们可以期待更多这样的 AI「甜品」。
- 1vivo X200 Ultra 舍弃一英寸主摄?传闻中的蓝厂超大杯影像详解
- 2东风悦达起亚k3报价及图片,供了多种动力选择,以满足不同消费者的需
- 3你的幸福是我们最好的礼物,有时候,最好的礼物并不是一件物品,而是一
- 4传祺gs4和哈弗h6哪个好,外观风格迥异,挑来挑去真是让人头疼
- 5怎样避免冬天刷车冻,只要咱们掌握了应对技巧和预防措施,这些问题还
- 6丰田车suv全部车型,它不仅继承了丰田的品质,还融入了流行的设计元
- 7登陆页面(腾达路由器)路由网,一定要在浏览器的地址栏中仔细输入IP
- 8什么能让厚冰快速化掉,这方法成本低,操作简单但得注意,别撒太多
- 9冬天刷车应该注意什么,不管哪个季节,洗车高峰期去洗车都是这么个情
- 10洗车店冬天怎么才不冻,在路上遇到这种情况,那可就太危险了
- 11用不了5年,增程汽车就不吃香了?不是瞎扯,3大理由超实在!
- 12国家级寒潮预警确定升级,超大范围雨雪在扩大!权威预报:局部特大暴雪
- 13suv销量排行榜前十口碑最好品牌,其产品线丰富,覆盖多个细分市场
- 14汽车保养口诀,要是为了省钱就忽略了保养,那车辆出问题的几率可就大
- 15REDMI K80 Pro影像对标小米15 产品经理:除了徕卡 能给的都给了
推荐
最新标签