AI解决方案落地的一些问题——2025原动力大会摘录

2025-06-12

昨天下午去参加了2025火山引擎原动力大会,觉得里面有些东西挺务实的,可以记录下来。

下面是火山引擎通信行业解决方案高级总监杜宁的分享摘要:

那么 AI 用的效果由什么来保障呢?第一个跟你选的模型有很大的关系,那模型是不是适合你的场景是非常重要。第二个跟你治理的知识和数据有非常大的关系。第三个跟你写了什么样的提示词标什么样的流程有很大的关系。不同的模型要写不同的提示词才能激发出它的效果。比如说去年上海有个高中生。写了一个 1380 字的 提示词, Claude 3.5 的输出完全模拟成了一个像DeepSeek深度思考的模式。

(然而)你可能有90分的数据治理,模型选得好,也 90 分的水平,还有一个是提示词选得好, 90 分的水平,三个 90 分的元素叠加起来,你的智能体的分数是多少?大概是 70 多分,这就是现状。也就是 0.9*0.9*0.9

那么怎么样去做出一个好的企业的一个应用?我认为几件事,第一件事就是你要先确定你要做什么,什么场景,第二个就是你要选什么样的模型。第三个就是你要怎么做这件事情?那分解开来说做什么场景呢?其实在医疗医药的场景里面,可能我简单举一些例子,当然还有很多。上次有一个,这个也是一家人民医院,院长问我,就说我有很多场景我都想做,但是我的预算有限。那其实也不一定非得都要做。AI,不是目的(注:这个观点和我之前的一篇文章是相契合的,不要为了渠道而渠道)。

做 AI 是为了帮助你的业务系统更加提效、更加获客,更加有竞争力,让你的企业更能够在竞争中胜出。不是为了做这样做AI,所以当你去梳理这些场景的时候,你会发现至少可以有八九个维度过去,我们一般是拿八九个维度来去评价这些场景,那至少我们今天可以看到两个维度是什么?一个是 AI 在目前的现状下和在未来预判半年它的发展趋势下这个场景的可行性。

第二个是对于这个场景来说,对于业务价值的体现是不是真的有必要去做?所以如果我们把这个变成一个四象限的话,那右上角的一个第一象限它展示的是什么?是高性价比的场景,可行又很强,你的业务价值又很大,那这些高价值的场景就应该优先地去落地,而且比较容易做出效果的价值。

就“AI,不是目的”这个观点再啰嗦两句。我最近在参与一个医疗数据收集项目,我曾考虑过是否在统计报告中引入AI,也就是让AI来参与数据分析。如果我打算弄一个噱头出来或许就加了,但是里面还是有一些要考虑的点的:诚然加入AI可以给用户更多互动,但,第一,数据安全怎么保证?这些都是医学数据,是团队好不容易收集来的数字资产,泄漏风险怎么管理?而以现在的规模,本地部署成本收益明显不匹配;第二,AI输出的准确性如何保证?医学数据统计报告是用于科研分析等场景的,必然要保证准确性,我也和Data Agent的PM交流过,目前对于严谨数据的计算,尽管AI已可以自动调用Python计算,但结果并不尽如人意。这样看来,引入AI可能是一件吃力不讨好的事情,还不如老老实实用jStat等传统方案;第三,下面也有提到,AI也需要防护黑客攻击。当然,这也不是说对AI敬而远之,AI还是能有很多想象空间的,前提是用于服务合适的场景。

这个模型第一个能征善战,适合你的场景,第二个他得非常懂你的这个行业和企业,要找到更合适的模型。第三个他得听话,而且对这个作风用他得合规。因为在医疗医药行业里面去用的时候还要去注意医疗的风险,因为模型安全现在已经变成了一个很大的话题,很多企业在把一些智能体发布到外部去使用的时候,我发现它的准确性就会变得很低,这个智能体上面会被经常问到一些你预想之外的问题,所以过去很多企业说我上来选的场景就是智能客服,但是你会发现智能客服这个场景非常不好做。

为什么不好做呢?因为无论是内部,比如说企业内部用 HR 咨询,还是企业外部用的用户的智能客服的产品,都是一个非常不可控的,企业内部的这个场景很多我们都会问了很多你想象不到的,我们有一家企业的这个员工就问他们的 HR 咨询智能体,我们企业的薪资水平是不是不如我们同类企业薪资水平?外部的这个自然语言黑客更多,他会用各种方法引导你的模型去输出一些不该输出的一些涉黄、涉政、涉暴的问题,他的目的是什么?理解吗?利益驱使。所以过去我们看到有些比如说语言陪练类的,他会诱导你说一些反动的翻译,我就给你优化成反动,让你去翻译。

模型 Ops 除了选模型之外,还有在模型上做数据增长、数据优化这样一个过程,让他去更好地理解你这个行业,甚至可能要做一些强化学习让他理解。数据和知识的过去,我们积累了大量的数据,但是这些数据今天不是为了语言模型服务。就像过去我们积累的很多数据都不是为人工智能深度学习训练服务,所以当这些新的技术来的时候,你积累的数据信息要不断地向今天 AI 要用的方式去转变、去调优、去治理。比如说曾经国家把这个就是软硬件的税率从 17% 调整到了13%。如果你对于模型给他的支持,他还是停留在17%,他今天去 review 一份合同的时候,他就不能够准确地review。所以你要让模型理解一些最新、最准确的知识,尤其是企业里面相关场景里面的一些知识,要不断地去不断优化。

省流版:

  1. AI 效果的影响因素:数据治理质量、模型场景是否合适、提示词与思考流程;

  2. AI,不是目的。优先考虑的还是要做什么、在什么场景用;

  3. 模型安全性也是十分重要的,要预防语言黑客诱导模型输出违法违规内容

  4. 数据要及时更新、调优