政安晨的AI笔记——Bard大模型最新提示词创作绘画分析_ar

ai大模型进入商业应用元年后的第一年，顶级模型大混战终于开始了。

bard在追赶openai的过程中，还是补上了画图的短板。

（相比于视频的5阶张量处理而言，图画做为4阶张量处理虽然不新鲜，但却是跨不过去的基础条件）

大模型的混战开始

bard新增图像生成功能，只需要给bard一段文字描述，例如：创造一张猫在冲浪板冲浪的图片，“create an image of a cat riding on a surfboard”，bard就能生成出客制化且种类多元的图片，这项新功能是采用升级版的imagen 2模型来实现。

（上面的截图咱们存下来留作纪念，毕竟bard不会一直都是实验版本）

当然，如果选择生成更多的话，可以这样（可以看到，它给出了不同风格的创作）：

虽然目前生成的提示词仅支持英文，但此服务现为免费，无需额外付费。
bard将使用synthid工具，在生成的图像中嵌入数位可识别的浮水印来协助区别，并对涉及不良内容做出限制。

此次更新还包括bard 将扩大运行gemini pro模型，支援超过40种语言与230个国家／地区，涵盖繁体中文。此外，回复查核功能也扩展超过40种语言。

使用复杂一点的提示词

咱们创作如下提示词：

因为当前bard仅支持英文，所以咱们将创作提示词从中文翻译成英文：

效果确实不同凡响，咱们放大看看。

不过面部处理还稍微有些不够细致，但整体感觉已经很不错了。

我点击更多，又生成了一张，这次面部处理稍好一些。

同样提示词的随机化差异比较

我从网上找了某位大神的提示词及生成的图片，

第一组提示词随机度比较实验（艺术）：

翻译为：

大神生成的：

我生成的：

我用同样的提示词继续创作：

挑出其中一张，确实可以做壁画：

这组生成图画从艺术感、3d、风格这几个方面看，都确实有不错的表现。

第二组提示词随机度比较实验（商业）：

翻译为：

大神生成的：

我生成的：

挑选左上第一张打开：

我是真心觉得不错！

这组生成图从写实、环境融合、角度等多个方面，其实都已经触及到了商业化的门槛。

第三组提示词实验（社媒生活-图文同创）：

翻译为：

我的生成如下（bard现在只支持英文）：

它真的帮我写出了一篇像模像样的社媒帖子。

写在最后

超级大模型的博弈虽然才刚刚开始，但人工智能领域的迭代不可能是线性的，人类智能与机器智能孪生的时代正在朝我们走来。

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

本文记录了从环境部署到微调模型、效果测试的全过程，以及遇到几个常见问题的解决办法，亲测可用（The installed version of bitsandbytes was co…

2024年07月28日 • 游戏开发

【OpenCV】计算机视觉图像处理基础知识

本文将非常细致的讲解相关与计算机视觉OpenCV图像处理的相关知识即操作，非常的简单易懂。经过大量的科学家验证，发现3*3的Sobel算子可能并不是特别的精确，于是又提出了相应的S…

2024年07月28日 • 游戏开发

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

DALLE2是可以根据文本描述去生成这种原创性的真实的图片，DALLE2学习了图片文本中的特征，可以任意的组合这些概念、属性、风格。DALLE2也可以根据文本对已有的图片进行编辑和…

2024年07月28日 • 游戏开发

论文精读--DALL·E 2

对比学习模型，如CLIP，已被证明能够学习到同时捕获图像的语义和风格的鲁棒表示。为了利用这些表示进行图像生成，我们提出了一个两阶段模型：一个先验网络，它根据文本描述生成CLIP图像…

2024年07月28日 • 游戏开发

DALL·E 2 文生图模型实践指南

此篇博客分享使用DALLE·2预训练模型进行图片生成的操作指南。 [阅读全文]

51-34 DALLE2 结合预训练CLIP和扩散模型实现图像生成

DALLE2模型包括三部分，CLIP text/img encoder、先验模块prior和img decoder。主要作用是根据输入文本 text 描述生成原... [阅读全文]


验证码：

验证码：

政安晨的AI笔记——Bard大模型最新提示词创作绘画分析

2024年07月28日 • ar •我要评论

大模型的混战开始

使用复杂一点的提示词

同样提示词的随机化差异比较

写在最后

相关文章:

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。

【OpenCV】计算机视觉图像处理基础知识

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

论文精读--DALL·E 2

发表评论

政安晨的AI笔记——Bard大模型最新提示词创作绘画分析

2024年07月28日 • ar •我要评论

大模型的混战开始

使用复杂一点的提示词

同样提示词的随机化差异比较

写在最后

相关文章:

llama3 微调教程之 llama factory 的 安装部署与模型微调过程，模型量化和gguf转换。

【OpenCV】计算机视觉图像处理基础知识

【论文精读】DALLE2: Hierarchical Text-Conditional Image Generation with CLIP Latents

论文精读--DALL·E 2

发表评论

llama3 微调教程之 llama factory 的安装部署与模型微调过程，模型量化和gguf转换。