启示录:ComfyUI与AIGC工作流的完美结合

发表时间: 2023-11-06 09:50

今年,ChatGPT的火热和Midjourney、Stable Diffusion等产品的火热,让AIGC这个概念影响了大多数人。大家在担忧AI工具将自己替代的同时,也在考虑如何将AIGC产品融入到我们的工作流程中;而ComfyUI,就是这么一款工具。

在我过去的文章里有说过,产品经理是“帮助团队交付正确产品给用户的人”。从客户需求挖掘到最后产品使用体验,产品经理要确保产品价值能够端到端地传递给用户,产品经理需打破团队成员的分工壁垒,这考验着产品经理综合能力和素质,这也是产品经理的领导力的体现。

如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(AI生成内容)能力融入到自己的产品中,然而这并非易事,在项目实践的过程中产品经理面临着诸多的挑战和困惑……

一、AIGC的产品管理挑战

在传统的互联网产品的开发流程中,产品原型图是不可或缺的工具。产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框图,并通过页面流程图来阐释产品的交互逻辑。通过这种方法,团队成员能直观地理解产品的最终呈现效果,方便地讨论问题并形成共识,从而保证最终交付的产品体验与预期保持一致。这是过去十几年来,互联网和软件行业一直奉行的最佳实践。

然而在AIGC产品中,用户更关心的是AIGC的数据体验,而不是界面的交互体验,传统的体验设计范式已经不再适用。例如,著名图片生成工具Midjourney以对话机器人的形式呈现,用户只要在Discord中和它对话就能获得高质量的图片,因为Midjourney很清楚地知道:用户更关心的是我们能不能根据提示词生成优质的图片,而不是别的什么东西。

题外话:“知道自己应该做什么,并把它做到极致”——正因如此才让这只有十几人的小团队能完成1亿美元的年营收。这是我们每一个创业者和产品经理都需要学习的能力。

因为AIGC产品体验的重心已从界面转向了数据。由于许多产品经理对数据和AI算法了解不足,让他们在技术沟通上遇到了极大的挫败感,而且传统的原型设计工具在应对AI产品时也显得力不从心,无法保证最终的交付效果和预期的一致性。对于一些想应用AIGC能力的产品经理而言,不仅AI模型是个不可解释的黑盒,连AI产品的研发过程也变成了一个不可知的黑盒。

正所谓“拿着旧地图无法抵达新大陆”,在新时代,我们应该放弃旧的思维方式拥抱新的工具和新方法。

二、AIGC工作流(Workflow)

ComfyUI,作为一款广受欢迎的图片生成的开源项目,为AIGC内容创作者提供了强大的助力。ComfyUI进一步拓宽了Stable Diffusion的创作可能性。ComfyUI通过节点流程的界面设计,让用户可以轻松拖拽、连接不同的模型、模块和参数,形成高度定制和可复用的Workflow(AIGC工作流),而用户无需编写任何代码。它可以帮助我们实现更加丰富和定制化的数据体验。

另外,ComfyUI还有以下优势:

  • 易于共享与协作:支持工作流的导出和分享,不仅加速了项目开发,也为团队间的学习和交流创造了条件。
  • 良好的性能优化:其内存管理和按需加载机制确保在资源受限的环境下,仍能加载大模型生成高质量图像。
  • 可扩展性:用户可以轻松添加自定义节点、插件和模型,社区已贡献了200多个自定义节点,为工作流的设计和优化提供了丰富的选择。

ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可视化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。在图形生成的过程中,ComfyUI能够实时为我们呈现数据处理的过程。让我们在设计和调试的时候,可以快速定位和解决问题。

ComfyUI不仅仅是让AIGC创作者可以更自由地创作,它的流程逻辑的可视化、可复用以及数据的实时可验证,不就等同于产品原型构建工具么?

在产品融图、营销海报和视频素材等应用场景中,AIGC正在发挥极大的价值。目前,一些前沿的团队已经在使用ComfyUI改进他们的工作方式,产品经理将ComfyUI作为产品原型设计工具,深度参与到模型训练和AIGC工作流的构建中,然后再交由开发人员和算法工程师进一步优化,最后转化成可稳定运行的Pipeline部署到正式环境中。

通过ComfyUI的可视化节点式工作流,产品经理和开发团队的沟通与协作得到了促进,使项目团队能在早期快速搭建和验证项目原型,缩短开发周期,降低试错成本,确保产品需求和体验目标的一致性,从而更好地实现端到端的产品体验目标。

三、UE蓝图系统的启示

拖拽式的节点编程并不是ComfyUI的独创,例如,Blender、Maya和Unreal Engine(虚幻引擎)也提供了类似的功能。

虚幻引擎的蓝图系统通过提供丰富的节点库和强大的可视化编程环境,使用户能够在无需编写代码的情况下构建复杂的游戏逻辑。

蓝图系统的高度可定制性和扩展性,允许用户创建自定义节点,甚至可以与传统的编程代码无缝集成,直接打包成跨平台的游戏,不仅为游戏开发提供了强大而灵活的解决方案,也缩短了从概念到可交付产品的时间周期。这种方式使游戏设计师、艺术家和小型工作室能快速地制作出可运行的游戏产品,极大地丰富了游戏创意的表达。

得益于虚幻引擎的强大表现力和无需编程的创作方式,使得其他行业的专家也可以使用虚幻引擎来实现想法。这也让其成为一款贯通各行各业的三维拟真创作工具,从游戏行业跨足至建筑设计、工业设计、城市规划和厂房规划等众多领域。

可视化的节点编程和模块化设计极大地降低了编程门槛,促进了不同背景的团队间的协作和交流,吸引了来自更多不同领域的创作者共同丰富产品应用场景和生态。

这也为ComfyUI提供了启示:强大的可视化和模块化能力不仅降低了产品开发和发布的门槛,还拓宽了创意和协作的空间,使得想法可以快速转化为实际可交付的产品成为可能,从而更好地满足不同用户和市场的需求。这就是“引擎”的魅力。

四、展望未来

目前,得益于ComfyUI的自定义节点的可扩展性,已有开发者创建了ChatGPT节点,为图像生成工作流赋予了大语言模型的思考能力,能快速生成提示词,可以方便快速创作大量的内容。如下图所示:

展望未来,随着ComfyUI自定义节点的丰富化,它将不仅局限于Stable Diffusion的图像生成能力,而会整合更多领域的AI模型,逐渐成为一个多模态的AIGC产品构建工具。未来也可能会出现类似虚幻引擎的多模态AI引擎平台,能直接将AIGC工作流打包成高可用和可交付的产品。

另外,由于企业级项目对硬件资源有较高要求,ComfyUI主要部署在团队的云端服务器上,这也将催生团队在线协同的需求,为创业者提供新的机会。我相信未来的ComfyUI在线版本可能会借鉴Figma的在线协同功能,让团队成员能共同参与AIGC工作流的搭建,为AIGC产品开发带来前所未有的在线协作体验。

结语

十年前,许多产品经理通过学习《网站蓝图:Axure RP高保真网页原型制作》这本书,步入了互联网产品领域。然而,在AIGC产品领域,Axure已无法满足现今的需求。

正如“拿着旧地图无法抵达新大陆”一样,当我们拿着旧“蓝图”时也难以创造新产品。现在,AIGC工作流已成为我们需要学习和掌握的新“蓝图”的能力。

通过学习和应用ComfyUI,产品经理和创业者能更深入地理解AI原理和工作方式,获得更为顺畅技术沟通能力。同时,通过快速构建和验证AI模型,我们可以确保产品需求与体验的一致性,大幅缩短产品开发周期。

掌握ComfyUI的AIGC工作流,产品经理和创业者不仅能自信应对AI产品开发的挑战,还能探索和实现创新的产品设计,树立在AIGC领域的领导力。

AIGC掀起的热潮也仅仅只有半年多的时间,技术正飞速发展和迭代,新事物层出不穷,在这个行业没有多年经验的老师傅。不管你是创业者还是产品经理,如果想转行到AIGC领域,现在是学习的最佳时机,只要学习的速度够快,你就可能成为该领域的专家。通过掌握ComfyUI,你能为未来的职业发展和团队协作打下坚实的基础,更好地适应这个行业的发展和需求。

专栏作家

PM熊叔,微信公众号:PM熊叔,人人都是产品经理专栏作家。教育类产品产品经理出身,学过设计,做过开发,做过运营的产品经理。

本文原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。