Ghibli 风格图片生成
OpenAI GPT-4o 上线了原生图片生成模型,其生成的吉卜力风格图像风靡全球社交网络。ChatGPT 中全新改进的图像生成功能背后的技术也已引入其 API,由名为 “gpt-image-1” 的 AI 模型提供支持,开发人员能将这一技术集成到应用程序和服务中。
商业化平台
- ChatGPT:需打开指定链接上传图片,输入提示词「创建图像。将此图像转换为吉卜力风格。」,实际效果更动漫化,人物眼睛超大。提示词示例:
A serene village with windmills and fluffy clouds, Studio Ghibli art style, vibrant but muted colors, reminiscent of 'Howl’s Moving Castle'.
; - MidJourney:通过精准提示词生成艺术风格图像,适合模拟吉卜力的手绘质感。提示词示例:
Studio Ghibli style, Hayao Miyazaki, whimsical forest, soft colors, detailed watercolor texture, magical atmosphere
,附加参数:添加--niji 5
(动漫优化模式)或--style expressive
增强风格。 - Grok:上传图片并写下信息即可生成。实际效果是直接输出 2 张图片,还添加了新环境。
- Flux:黑森林出品,上传文件并选择风格就能快速生成。
- insMind:适合人像摄影,实际效果中少年服饰变化较大,风格局限于和服的表现不够全面。
经测试国内的豆包、千问等相关平台也可以用该提示词,不过测试生成的效果更偏向国风漫画。
开源项目
- HiDream-I1:智象未来科技有限公司自主研发的图像生成大模型,是拥有 17B 参数的新型开源图像生成模型,可在几秒钟内实现最先进的图像生成,涵盖多种风格,其生成的图在真实感、细腻度上和 GPT-4o 非常接近,有时更胜一筹,商业化的产品是vivago.ai;
- EasyControl Ghibli:基于 Diffusion Transformer(DiT)打造的轻量级模型,是 EasyControl 框架下的一个分支项目,专注于将照片转化为吉卜力风格图像。它以高效控制和高质量输出挑战 GPT - 4o,可在 Hugging Face 上直接体验,完全免费。该模型具有高还原吉卜力风格、轻量 LoRA、灵活分辨率支持、合成速度快、版权安全、开源零门槛等特点,提供在线体验和本地部署两种方式。
- InstantCharacter:腾讯混元团队开源的模型,可以选择生成 Ghibli style 和 Makoto Shinkai style 两种风格,而且可以对于上传的原图进行动作和场景调整,但会保持原人特的风格化,
非常推荐的一个开源项目
。
提示词相关
生成图片风格 | 文字指令说明 |
---|---|
日本动漫风格 | 请生成一张日系动漫风格的男孩插画,带有大眼睛、金头发、并有细腻的头发细节。 |
美式漫画风格 | 请生成一张美式超级英雄漫画风格的角色,具有强烈的线条与鲜明的色彩。 |
水彩画风格 | 请生成一幅温暖柔和的水彩画风景,色调为粉橘色与蓝色。 |
像素艺术风格 | 请生成一张8-bit 像素风格的游戏场景,包含复古RPG 风格的村庄与小人物角色。 |
油画风格 | 请生成一幅印象派油画风格的夜晚城市街道,灯光柔和,笔触细腻,色彩层次丰富。 |
手绘素描风格 | 请生成一张铅笔素描风格的男子肖像,强调细节与阴影,背景为简单的几何线条。 |
赛博庞克风格 | 请生成一张赛博庞克风格的未来城市景象,充满霓虹灯与高科技建筑,画面色彩对比强烈。 |
可爱卡通风格 | 请生成一张可爱卡通风格的猫咪插画,角色拥有大眼睛、圆润的身形,色彩鲜艳温暖。 |
写实人像风格 | 请生成一张高解析度的写实人像照片,人物表情自然,肤色与光影细节丰富,背景为柔和的暖色灯光。 |
参考链接:
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))