LLMs(大型语言模型)对产品设计会产生哪些影响

date
Apr 20, 2023
slug
the-impact-of-large-model-ai-on-product-design-opinion
status
Published
summary
ChatGPT 的面世给互联网和相关的科技行业带来了新的可能性和机遇,而其背后的 LLMs 也开始展现其革命性的潜力,这确实让人很兴奋。而对于产品来说,目前 LLMs 的出现意味着需要思考产品的设计。因此我从个人角度列举了一些产品方向和对于这些方向与 LLMs 结合的看法……
tags
AI
产品设计
GPT
LLMs
type
Post

前言

ChatGPT 的面世给互联网和相关的科技行业带来了新的可能性和机遇,而其背后的 LLMs 也开始展现其革命性的潜力,这确实让人很兴奋。不过需要注意的是,这只是技术,从技术落地到应用还有相当一段路需要走。
而落地这一动作分为两种可能:新应用和更好的应用。从我个人了解的情况出发,效率相关的产品,尤其是 SaaS 相关产品是最积极拥抱这一变化的,比如说 Notion、Fibery、ProcessOn 等,都推出了相关的特性更新。
  • Notion
    • 根据用户给定的自然语言内容自动地生成内容
    • 帮助用户开始写作的第一步:拟定大纲、撰写文章结构等
    • 提升写作效率:续写、拼写语言检查、翻译等
  • Fibery
    • 根据用户描述的场景自动创建对应的资源
    • 针对给定的内容进行快速撰写、总结和解释
    • 根据用户给定的自然语言内容自动化地填写文本、数字或富文本字段
  • ProcessOn
    • 根据用户给定的自然语言生成思维导图或者流程图
而上述这些都属于更好的应用,也就是已经成熟的产品依靠 AI 增强自身产品能力,提高竞争力和壁垒。
而新应用的落地通常需要比较长的时间,需要花费大量的时间和资源进行调研和探索(或是花费大量的时间等待一个合适的时机出现一个合适的产品)。
因此在这段时间内,我认为现有的成熟产品将成为主要的受益者,他们可以利用 LLMs 技术来改善产品的用户体验和功能。这些改进将使得产品更加智能化,更加易于使用,同时也会提高用户的忠诚度和满意度。
而对于产品来说,目前 LLMs 的飞速发展意味着需要思考产品的设计。因此我从个人角度列举了一些产品方向和对于这些方向与 LLMs 结合的看法。

方向

替代现在的 AI?

LLMs 目前并不一定能够在所有任务上都表现出优异的性能。例如,在个性化推荐领域,双塔模型可能比 LLMs 更适合。因此, LLMs 不是一枚万能的“银弹”。
由于 LLMs 使用了大量参数和数据进行训练,它们可以表现出出色的自然语言理解能力,并在多个领域和任务上发挥作用。相比之下,目前常见的机器学习推荐算法通常只针对特定领域和任务进行优化。因此, LLMs 在个性化推荐方面的优势在于可以利用上下文学习和世界知识来向用户推荐相关内容。
然而,目前的 LLMs 还存在许多问题:生态系统、训练和优化方法还不够完善以及如何控制最终输出结果仍然是问题。
从某种程度上说, LLMs 更应该被称为预训练模型,只是其使用的预训练数据集比较大而已。与当前的其他 AI 技术相比,它可能会得到一个较高的初始分数,但相对于许多技术的 85 分和 90 分而言,它并不是非常出色。
因此,我个人认为在短时间内, LLMs 难以改变已广泛应用的各种 AI 技术和生态。但是,在未来,如果上述问题得到解决, LLMs 仍有可能成为大多数 AI 技术的基础模型。

更强大的智能客服?

以 ChatGPT 举例,目前 ChatGPT 在通用场景上的自然语言理解能力和人机对话能力远超现有的智能客服,而如果能够结合 OpenAI 的 Fine-tuning 和 Embeddings 来结合细分场景精调,那么可以在我认为利用 OpenAI API 能够训练出来胜任绝大部分场景的智能客服,甚至比现有的体验会更佳。
但是我认为智能客服这一场景下的问题不在于 LLMs 本身的能力,而是成本。因为一般来说智能客服主要是降低公司运行成本的产品,为得就是减少人力、资金投入(可以看到有很多 APP 可能是原生的,但是里面的客服页面很多都是嵌套网页)。而目前来说,模型训练成本、对话成本都比较高(可以自己创建一个 Dataset 使用 Embeddings 试试,或者使用 Langchain 来针对某篇文档进行问答)。
因此一个本来就是要降本的能力,怎么可能增加成本增强它?我觉得没有任何一个脑子正常的老板会接受客服回复一句话就要多耗费几毛钱吧?

数据分析与预测

LLMs 的主要优势在于可以自主的从大规模的数据集中发现模式和趋势,同时对于自然语言(用户评论、弹幕等)的理解和判断会更加精准一些(对于 GPT3.5 来说中文不一定)。
但是缺乏实时世界知识(基础数据训练集只到2021)、业务知识(不同业务的底层逻辑也很难通过数据的方式喂给 AI),也导致数据分析与预测上 LLMs 也很难替代人类的作用。
而且 LLMs 说到底是基于统计学的技术,它只能总结提炼以前的知识,对于新的趋势并不一定有能力预测,因此我认为目前阶段只能作为数据分析的一种重要辅助工具。

文字内容工具迎来发展?

当前,许多文字类工具都在积极探索如何利用 LLMs 来改善产品的文字内容生成和编辑能力。
其中一个显著的例子是 Notion AI(我并不是说 Notion 是文字内容工具这种单一品类的工具,只是拿它举例),它可以根据用户给定的自然语言内容自动地生成内容、帮助用户开始写作的第一步:拟定大纲、撰写文章结构等,提升写作效率:续写、拼写语言检查、翻译等,极大地提高了用户的工作效率。
但是依我个人的看法这里有一个很矛盾的点,那就是 Notion AI 目前能做的,其他的产品很快就能跟进实现,这并不能成为 Notion 的壁垒。
由此推导到所有的文字类工具,可能绝大部分产品都会跟进,因为当用户习惯了这样的功能后,你没有就会丧失对于这部分用户的吸引力,而如果绝大部分产品如果都有这样类似的功能,那 LLMs 似乎对于单个产品本身并没有起到预期中颠覆性的作用。
因此在这个品类下,我个人认为目前要在 AI 上做精、做出别人做不到的东西是很难的,因为文本处理本身就是 LLMs 最擅长和最容易训练的,但是你又不能不做。。。这就很纠结了。
所以我觉得不能太过于注重 AI,把 AI 作为自身产品的护城河。

解决复杂的场景问题?

我认为这个反而是目前这阶段 AI 的最佳实践场景,这一类工具要解决的场景远比文字内容工具要复杂。国内比较典型的这一类产品有飞书、钉钉等企业 IM,还有维格表、伙伴云、明道云、ONES 等低代码/无代码工具。
其实在这一类工具中一直存在很多痛点问题无法解决只能被暂时搁置,LLMs 的出现则为解决这些问题提供了想象空间,下面举一些例子:
  • 自动总结摘要
    • 昨天的会议有很多,可能并不是每一场都有认真记录,但是我想知道昨天那场关于 ABC 客户的讨论具体提到了哪些点,下一步行动是什么?
      我是一名销售人员,口头表达是我的强项,但是文字撰写真不太行,每天需要和很多家客户开会沟通相关合作机会,然后都要写纪要,一方面给上司看,一方面给自己后续跟进使用,但是每次都要写上一两个小时,实在太费力气
  • 在消息列或话题中跟进讨论的内容和进度
    • 飞书最近上线了点击消息创建话题的功能,这样大家可以聚焦讨论,充分了解上下文,避免碎片化信息的打扰。可问题是,当外人想要看到某一话题当前的讨论进度时,需要一条消息一条消息过一遍,没办法快速预览,如果这人是老板就会直接 @我,我还要帮他总结一遍?
  • 快速提取信息
    • 我有很多张表,我想要快速找到某个数据,我该怎么办?继续回忆?问人?但是通常这么做都要花更多时间,也会打扰到别人,我能不能直接表达需求给表格,让表格给我找啊?
  • 智能公式
    • 我经常使用表格类产品搭建各种有用的工具,但是在涉及到一些复杂场景时难免需要用到公式来实现一些特殊的业务需求,可是想用公式实现这些需求实在太难了,我只能不断在网上查找类似的公式或是找客服询问,但是这样的效率太低了,老板都催了两次了
  • 脚本
    • 我当前使用的表格提供了一个叫做脚本的功能,官方说可以实现非常多的自定义能力,可是问题是它要求具有一定的代码编写能力才能使用,尽管官方说编程新手也可以慢慢入门,问题是我完全一窍不通啊,但是我就是想用它实现一些东西啊,谁能帮我写一下?
  • 数据分析
    • 经过一年的记录,表格里存了很多的数据了,我想要在年终的时候总结一下发给相关同事,但是这些数据也太多了,我要花一周的时候才能全部处理完,太麻烦了。
  • 测试用例
    • 为了一个需求编写测试用例是非常耗费精力,而测试用例可以用来评价一个需求的实现效果,那什么东西能够衡量测试用例呢?首先就需要这一衡量根据拥有足够的世界知识和相关的业务知识,这样才能拥有衡量测试用例的能力
  • 信息过载
    • 在日常的项目管理中,可能会有大量的任务和评论需要处理,这都容易导致信息过载。因此需要一种工具来自动识别和提取关键信息,并对其进行摘要和分类,从而帮助项目成员更快地找到所需的信息
……
上面这种复杂的场景需求还有很多,最重要的特征有两个:
  1. 和人打交道
  1. 变量多、不确定性高
一款 SaaS 产品中想要解决的这种复杂场景还有很多很多,不胜枚举。因此如何通过 LLMs 来解决就将成为很多 SaaS 产品之后的主要方向,而如何使用 LLMs 这一附魔也有很多种解,未来很有可能会看到一些产品利用 LLMs 创新了一些特殊的解决方案也未可知,当然国内复制能力还是很强的,说不定一下就普及开来了 0.0

新的技术工具?

当有一种新的技术诞生或一条新的技术方向被验证后,首先繁荣起来的通常不是产品而是围绕这一技术搭建的新的技术工具。前段时间 Auto-GPT 突然火起来了,这一工具最大的特点是能自主分析和执行 User Query ,甚至还会自己给自己提出新的问题并回答,然后进一步实现。这一下就让很多人特别惊奇,现在竟然可以做到这样?
是的,但是其实不是只有它实现了这一能力,最近还有一个叫做 LangChain 的 LLMs 应用框架也能实现这样的效果,国内也有浙大和微软联合发布的 HuggingGPT。他们都是基于 ReAct(Reason+Act) 的 Prompt 设计,我目前能找到的相关文章最早在去年 10 月份就出现了:https://arxiv.org/abs/2210.03629。它通过将 LLMs 与外部工具集成来改进决策制定,它的主要目的是更方便地将 LLMs 与外部应用程序集成。某种程度上你可以理解为类似 ChatGPT 的 Plugins。
而我这段时间也主要在研究 LangChain 如何与 OpenAPI or SDK 交互的问题,体验了包括 API Chains 和 OpenAPI Agent 的分层规划代理、JSON Explorer 等方式。目前阶段想要实现 LLM(大型语言模型)与外部应用程序的无缝连接确实还有很多路要走,不管是模型还是生态的搭建,但是最重要的是已经在路上了。
这里放一下我这段时间的一个小小的研究成果:,能够初步实现通过自然语言和 APITable 交互。

全新的交互?

大部分产品,做到后面,越做越复杂,因为功能越来越多,入口越来越多,交互越来越复杂,而能够十几年间产品的入口和交互依然没有发生大幅度变化的产品是少之又少(虽然我对于微信怨言很多,但是这一点很难不佩服),而放在面向 B 端、面向效率的产品就更少了。
而 LLMs 也许就是一个简化交互的机会。想像一下,以前我要创建一套模板表格,需要思考、寻找示例、动手,或者干脆用官方模板中心里的,然后自己再手动一个一个改,而有了 LLMs 后也许只需要最多花个 3 分钟描述一下自己的需求,即可得到一套几乎不需要再手动修改的模板表格。再比如你说,我想要将查找xxx的数据,然后存进表里,在之前可能还涉及到爬虫技术,而有了 LLMs 后可能就真的只需要动动嘴。
因此如何重新结合 LLMs 去设计甚至简化交互也许会成为下一个最重要的设计课题?

尾巴

上述内容完全都是个人的观点,可能不够中立,也不够全面,有问题希望可以留言批评。
但不管怎么样我依然相信这一次的 LLMs 尽管可能带来不了新的机会或新的产业(我始终认为它只是一种能够极大提高效率的工具而已),因此它和所谓的元宇宙和 Web3 不一样,在目前阶段可以真真切切地改变我们的生活方式和日常工作,所以希望大家不要轻视它,但也需要理性看待,让它能够真正地为你服务。