跳转至

Ghibli 风格图片生成

OpenAI GPT-4o 上线了原生图片生成模型,其生成的吉卜力风格图像风靡全球社交网络。ChatGPT 中全新改进的图像生成功能背后的技术也已引入其 API,由名为 “gpt-image-1” 的 AI 模型提供支持,开发人员能将这一技术集成到应用程序和服务中。

Ghibli art style

商业化平台

  • ChatGPT:需打开指定链接上传图片,输入提示词「创建图像。将此图像转换为吉卜力风格。」,实际效果更动漫化,人物眼睛超大。提示词示例:A serene village with windmills and fluffy clouds, Studio Ghibli art style, vibrant but muted colors, reminiscent of 'Howl’s Moving Castle'.
  • MidJourney:通过精准提示词生成艺术风格图像,适合模拟吉卜力的手绘质感。提示词示例:Studio Ghibli style, Hayao Miyazaki, whimsical forest, soft colors, detailed watercolor texture, magical atmosphere,附加参数:添加 --niji 5(动漫优化模式)或 --style expressive 增强风格。
  • Grok:上传图片并写下信息即可生成。实际效果是直接输出 2 张图片,还添加了新环境。
  • Flux:黑森林出品,上传文件并选择风格就能快速生成。
  • insMind:适合人像摄影,实际效果中少年服饰变化较大,风格局限于和服的表现不够全面。

经测试国内的豆包、千问等相关平台也可以用该提示词,不过测试生成的效果更偏向国风漫画。

开源项目

  • HiDream-I1:智象未来科技有限公司自主研发的图像生成大模型,是拥有 17B 参数的新型开源图像生成模型,可在几秒钟内实现最先进的图像生成,涵盖多种风格,其生成的图在真实感、细腻度上和 GPT-4o 非常接近,有时更胜一筹,商业化的产品是vivago.ai
  • EasyControl Ghibli:基于 Diffusion Transformer(DiT)打造的轻量级模型,是 EasyControl 框架下的一个分支项目,专注于将照片转化为吉卜力风格图像。它以高效控制和高质量输出挑战 GPT - 4o,可在 Hugging Face 上直接体验,完全免费。该模型具有高还原吉卜力风格、轻量 LoRA、灵活分辨率支持、合成速度快、版权安全、开源零门槛等特点,提供在线体验和本地部署两种方式。
  • InstantCharacter:腾讯混元团队开源的模型,可以选择生成 Ghibli style 和 Makoto Shinkai style 两种风格,而且可以对于上传的原图进行动作和场景调整,但会保持原人特的风格化,

    非常推荐的一个开源项目

提示词相关

生成图片风格 文字指令说明
日本动漫风格 请生成一张日系动漫风格的男孩插画,带有大眼睛、金头发、并有细腻的头发细节。
美式漫画风格 请生成一张美式超级英雄漫画风格的角色,具有强烈的线条与鲜明的色彩。
水彩画风格 请生成一幅温暖柔和的水彩画风景,色调为粉橘色与蓝色。
像素艺术风格 请生成一张8-bit 像素风格的游戏场景,包含复古RPG 风格的村庄与小人物角色。
油画风格 请生成一幅印象派油画风格的夜晚城市街道,灯光柔和,笔触细腻,色彩层次丰富。
手绘素描风格 请生成一张铅笔素描风格的男子肖像,强调细节与阴影,背景为简单的几何线条。
赛博庞克风格 请生成一张赛博庞克风格的未来城市景象,充满霓虹灯与高科技建筑,画面色彩对比强烈。
可爱卡通风格 请生成一张可爱卡通风格的猫咪插画,角色拥有大眼睛、圆润的身形,色彩鲜艳温暖。
写实人像风格 请生成一张高解析度的写实人像照片,人物表情自然,肤色与光影细节丰富,背景为柔和的暖色灯光。

参考链接:

捐赠本站(Donate)

weixin_pay
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))