AI大模型实践与实用技巧青瓜传媒

随着ChatGPT的问世,各行各业深受震撼,国内外各种新的大模型也如雨后春笋般相继出现。一些对机遇反应迅速的人已经开始将AI运用到学习和工作中,甚至已经开始借助AI赚钱了。

目前市场上的AI模型众多,包括国外的ChatGPT、Claude、Bard等,国内的文心一言、通义千问、讯飞星火大模型等。现阶段不是缺少AI工具,而是缺乏使用这些工具的经验。多人由于缺乏经验,用了几次大模型后发现回答不符合预期就感到失望弃之不用,这非常可惜。其实不同的模型之间能力有差异,但是相同的模型不同人用起来效果也会相差很大,这里的关键在于提示词技巧和使用和业务接入过程中遇到的常见问题是否有好的办法去解决。

虽然现在已经进入AI时代,已经可以用自然语言和模型交互,但对提示词的要求还是有点高,在AI工具发展的相对早期,很多问题还没有完全解决,很多功能还不完善。在我看来,现在大多数人使用大模型存在两类主要问题:

提示词掌握不好,可能会遇到下面的困惑:

大模型的回答总是简略、空洞和机械,怎么办?

大模型的回答总是不能够按照自己想要的格式输出,怎么办?

大模型的回答总是不够完善,怎么办?

大模型使用技巧掌握不足,可能会遇到下面的困惑:

优化了很多版本提示词,答案总不满意,怎么办?

想在公司里使用ChatGPT,但是又担心数据泄露,怎么办?

和AI多轮对话之后,AI似乎忘记了自己的任务是什么,怎么办?

问AI问题,但又担心它“说假话”,怎么办?

每次都要输入相似的提示词,嫌麻烦,怎么办?

收费模型有次数限制(如GPT-4),如何让它发挥更大作用?

业务接入大模型的经验不足,可能会遇到下面的问题:

认为大模型是万能的,啥功能都想用大模型来解决,结果事倍功半。

刚开始调通模型就匆忙上线,导致效果不理想,用户流失。

算法工程师不足,开发人员自己训练模型,做了很多优化效果都不理想。

如果你也遇到上述问题,那么本文将对你有所帮助。接下来我将主要介绍如何通过精准的提示词技巧获得想要的答案,以及在使用大模型使用和接入的过程中遇到的常见问题该如何解决。

很多人试用几次大模型,得不到想要的答案,顿感失望然后弃之不用。其实多半是自己的提示词写的不够好导致的。网上的提示词教程五花八门,要么不成体系,要么过于复杂。接下来将用相对接地气的方式,谈谈提示词的标准、提示词该如何写效果更好。

在我看来,一个粗略而简单的标准就是:你身边的人是否能够轻松听懂。如果你写一个提示词,还需要别人再问你好几个问题才能真正明白什么意思,那么这个提示词就不是好的提示词。

好的提示词应该遵循清晰具体,重点突出,充分详尽的原则。在提示词中给出他回答问题所需要的主要信息,并且清楚具体地告诉它要做什么事情。

对于相对简单、通用的任务,由于模型对这类任务通常比较擅长,一般遵循前面所讲的原则直接写提示词即可

示例1:

请根据XXX起5个有吸引力的标题

示例2:

请帮我找出下面段落中的错别字,段落内容为:XXX。

示例3:

请给我一个Java语言实现策略设计模式的示例代码。

对于相对复杂、专用的任务,可以参考下面的公式:立角色+说问题+定目标+给示例+加背景+补要求,往往可以得到更好的回答。实际使用过程中并非这四项都要有,可以根据实际情况进行灵活组合。

示例:

我想让你充当我的导游(立角色),我计划从青岛出发去杭州旅游,预算是10000元,总共2个人,行程3天,请给我出一份攻略(说问题,定目标)。注意行程不要安排过于紧凑,不想去网红打卡点,想去有文化底蕴的景点,另外推荐景点时,请附上景点的价格,不去太高档的餐厅吃饭(补要求)。

提示词的技巧有很多,这里给出一些自己实践过的非常有用的一些经验,更多进阶技巧大家可以再网上搜索更多资料进一步学习。

加分隔符帮助模型区分不同的区块如果提示词包含多个部分,为了更好地区分开来,可以使用分隔符。如使用三个反引号将命令和待处理的段落分开。

执行下面的步骤:

1将下面由三个引号分隔的文本总结为一句话。

2将总结翻译成英文

3统计英文中的每个字母的数量

4参考三个#分割的文本格式进行输出

通过加限定词提要求规范模型的输出

你是一位知名儿童文学作家,请使用亲和力的口吻,帮我写一篇面向幼儿园儿童的,能够体现亲情重要性的故事。

要求:

说明:提示词中讲口吻、面向人群和具体要求给出到模型,更容易写出让你满意的故事。在提示词中通过“绝不能”的限定,模型构造故事时会刻意避免。

请使用PlantUML的语法,帮我生成一个时序图。

时序的对象包括:A、B、C。时序如下:XXX

说明:如果不交代时序对象,模型提取的对象可能和你想的有偏差,而提示词中直接将时序对象交代给AI模型,更容易绘制出让你满意的时序图。

5不需要输出中间过程,只需要参考三个#分割的文本格式输出最终结果即可(一定不要输出开头和结尾分隔符#)

说明:如果不加上“一定不要输出开头和结尾的分隔符#”,有些模型会输出结果时前后带上三个#,通过限定可以完美解决这个问题。

提供参考示例让模型更好理解你的意图

在提示词中给出一些示例,有助于大模型更好地理解你的意图,回答出更符合你要求的答案。

请你充当标题优化助手,我将给你发送一个主题,请从下面的原则中选择最适合的一个原则,给出5个参考标题。

(2)给出结论和价值。如“重构的必要性和方法”、“关于软件复杂度的思考”、“工程师也要有产品思维”。

(3)激发好奇心。如“DDD最短学习路径”、“原来设计模式还可以这么用”、“99%程序员理解错了字符串的可变性”、“不写代码,程序员最重要的技能”。

主题:XXX

请帮我写一个正则表达式,匹配的规则如下:数字或下划线#some.com,并且不能以下划线开头。

正确示例:123#some.com、123#some.com、1_23#some.com

错误示例:123#some.com、12ac#some.com

你是一个知名互联网论坛的编辑,请帮我校对一篇专业博文,请指出其中的专业术语错误、拗口的句子等,并给出修改建议。

参考输出格式见三个引号分隔的部分:

第1处

原文:在软件开发流程中代码审校非常重要,能够帮助程序员提前发现问题。

原因:“代码审校”专业术语错误,应该是“代码审查”

修改:在软件开发流程中代码审校非常重要,能够帮助程序员提前发现问题。

第2处

原文:使用命令duneinitprojectmy_compiler创建新项目。

原因:此句中对命令的描述不够通顺,建议增加“来”字来连接动作与目的。

修改:使用命令duneinitprojectmy_compiler来创建新项目。

思维链(Chain-of-Thought,CoT)

人们解决复杂问题时,通常会将其分为一些中间的步骤逐步解决,最终得到答案。思维链就是参考人类的解决办法,思维链提示词模式包括输入问题、思维链和输出结论。让模型可以学习这种推理过程,从而提高大模型在复杂推理时的准确率。

很多人想在公司里使用AI工具,但对业务数据泄露持有顾虑。

如果你在大厂,可以考虑公司内部自研的合规模型。也可以选择公司代理(会进行安全过滤)的外国AI模型。如果想直接使用ChatGPT、Bard之类的外国大语言模型试试效果,可以将数据先脱敏、构造mock数据或者尝试将遇到的问题转成一个通用的问题来提问即可,得到靠谱的方案或代码再移植到公司内部。

现在AI很智能,但是AI产品并不智能。ChatGPT官方聊天页面只有一个输入框,似乎秉承着“SimpleisBetter”的理念,但很多时候并非越简单越好,使用ChatGPT经常需要输入相似的提示词,用起来效率极低。

下面将从四个方面简要解释如何通过预定义提示词提高输入效率。

单平台层面,如果你使用ChatGPT官网,推荐ChatGPTPromptPlus插件,支持自定义提示词,可以快速呼出,还支持提示词中定义变量,支持为提示词分组,在呼出提示词时选择或者填写即可进行提问,非常方便。下图就是通过该插件预定了“解释某句”的界面,可以将需要填写的内容定义为变量,使用时呼出后填充即可。

直接通过“/解释某句”即可呼出,不需要每次都输入重复的提示词,每次只需要必要的内容,如这里的内容和问题即可自动拼接好提示词发送给ChatGPT进行提问。

如果你使用Poe平台,可以在平台上预定义机器人,具体方法和上面大同小异,感兴趣可以自行研究。

浏览器层面,可以通过安装ChatGPTSidebar这类的AI插件,可以在页面上选择一段内容后,直接选择内置或预定义的提示词进行处理即可。

在输入法层面,可以通过自定义短语设置,来预先定义提示词,输入内容时,可以通过输入缩写自动填充提示词。

在通用方法层面,你可以利用Alfred的Snippets功能(支持将剪切板内容作为变量自动替换预定义提示词中的占位符)或者utools的备忘功能,来预定义并快速粘贴提示词。

在使用AI工具时,如果回答不满意,可以检查自己的提示词是否真正符合“清晰具体、重点突出和充分详尽”的原则。如果调整优化提示词还是得不到想要的答案,可以尝试通过下面的方法解决。

有时候你以为你表达很清楚,其实模型理解和你的表达有偏差,你可以尝试让模型重述你的任务,你可以根据他的重述发现偏差,对提示词进行针对性纠正。

对于提示词并不是很复杂,但是模型似乎不能很好理解你的意图的情况,可以考虑使用英文提问,有时候会有奇效。这可能与模型的语料中英文占比更多,模型更擅长英语有关,也可能是中文提问优先匹配中文语料,但是中文语料质量不高原因导致的。之前就遇到过一个技术问题,用中文对NewBing提问很多次都没得到想要的答案,换成英文提问,一次就得到了靠谱的答案的情况。大家如果英文不好,也可以采用“套娃”的方法,如让ChatGPT帮你翻译成英文提示词再对ChatGPT进行提问。

如果模型理解无误,使用英文提问也没有效果,建议换更高级的模型。在我看来不同的模型就像不同层次的学生,比如有些模型可能是中学生水平,有些模型可能是高中生水平,有些模型则相当于大学生甚至研究生水平。而且不同的模型的擅长之处也有所不同。因此当提示词已经写得很好,但模型回答并不满意时,有条件可以考虑切换到更强大的模型。在我的实际中,能够明显的感觉到GPT-4在大多数任务上都会比GPT-3.5回答更好,未来或许还会出现更强大的模型。

当使用更高级模型也得不到满意的答案,说明当前任务对大模型来说过于复杂,此时可以考虑任务分解。对于复杂任务,建议大家先进行拆解,拆解到模型比较容易完成的步骤,然后每个步骤让模型去完成,往往效果更好。比如你想让模型写出一个类,可以拆解成不同的函数,然后每个函数让模型去写。

当尝试上述方法还是效果不满意时,可以尝试任务接力。所谓“任务接力”是指,将任务拆解后分步骤让AI分步完成或者人与AI分工合作完成。比如写代码,你可以开一个对话窗让AI写代码,用另外一个对话框让AI去找出其中的问题,再让AI工具优化代码。比如写稿件,你可以让AI写目录供自己参考,也可以让AI写草稿自己优化或者你自己直接写稿子,最终再让AI去润色。这样复杂任务通过每个步骤拆解成AI比较容易完成的粒度或者通过将简单重复的任务分配给AI,将复杂AI不擅长的部分分配给人,可以实现更好地效果。

在使用AI工具过程中,经过多轮对话之后,你可能会发现模型已经忘了最初的任务是什么。

对于这种情况,最简单的处理办法就是重新开一个对话窗口,重新表述问题,继续处理后面的材料。

如果步骤特别多,需要重新开太多对话非常麻烦,可以尝试下面的方法。

前面讲到模型重述任务有助于检查模型是否真正理解任务,在我看来对上下文丢失的问题也有帮助,如果你的任务需要多轮对话才可以完成,可以尝试没隔几轮对话问AI任务是什么,通过提醒可以降低“遗忘”的概率。

我在实践过程中经常使用“简述任务”这一方法。例如,当需要让模型概括每个段落的重点时,我会在第一个提示词中详细写明要求。然后,在第二轮发送段落前,我都会重述或简述这个要求。这样即使模型忘记了最初的任务,也能根据第二轮之后的简述完成任务。如“请按照我最初的要求,继续提取下面段落重点发送给我。段落内容:XXX”。

如果模型确认或者简述任务方法还不能解决问题,侧面说明这个任务可能对于模型来说有些复杂了,建议可以将任务进一步拆解,让每一个Chat界面只做其中的一个步骤或者有些步骤让AI来做,有些步骤让人来完成。

很多人用大模型时偶尔会碰到明明回答错误,但是大模型回答的却很有自信的情况,很容易被大模型所“唬住”。

建议对于自己拿不太准的问题可以问多个不同的模型,他们答案之间相互印证,降低都“胡说”的概率。有时,对于相对严谨的内容,可以将AI的回答仅作为基本参考,并需结合传统的研究方式,如使用搜索引擎、查阅论文和其他资料等。

最关键的还是自己要具备辨识能力。因为即使不是AI时代,你让其他人帮你准备材料,如果你没有足够的辨识度,也很容易出现问题。虽然AI能够提高我们的效率,但是我们比以往更需要提高专业素养,提高对信息真伪的辨识能力。

以ChatGPT为例,GPT-3.5目前免费使用,GPT-4则需要开通Plus服务,而且还有每3小时50个message的限制(未来有可能进一步提高,甚至完全放开)。在Poe平台上,ChatGPT和Claude也分为免费版和收费版本,收费版也有次数限制。

很多简单的任务免费的模型就可以做的很好,优先可以使用免费模型进行处理。对于复杂的任务,可以安排给收费模型进行处理。

在使用收费模型时,可以将多个步骤合并成一个提示词,节省收费模型的调用次数。

可以使用免费模型产出草稿版本,然后让收费的高级模型进行二次优化,这也是一个不错的选择。

现在很多公司开始自研大模型,很多业务也开始接入大模型,下面谈谈业务接入大模型的一些经验,掌握这些经验可以让你少走一些弯路。

大模型不是万能的,我们不应该“为了使用AI而使用AI”。就像汽车虽然方便快捷,但不是在所有情况下都是最佳选择。在实践过程中,我们发现某些任务通过工程化方式解决效果更佳且成本更低。因此,在接入大模型时,我们需要权衡哪些任务适合工程化解决,哪些任务更适合用大模型来解决。

有些复杂任务需要对模型进行微调,需要大量的人工标注,以及评估模型效果工作。为了提高效率,建议大家可以自己编写脚本,或借助AI模型进行辅助,实现自动化或半自动化的流程。

在将AI模型落地到业务的过程中,开发人员虽然熟悉业务,但可能不了解模型优化的方法;算法人员虽然更专业,却可能对业务不够了解。因此,想要不断优化大模型的效果,就需要开发同学和算法同学通力合作。而且由于有些公司大模型团队的算法人员紧缺,很多业务又想尽早上线,有些开发人员也开始亲自训练大模型。但缺乏专业指导可能会导致许多优化思路不科学,从而会走许多弯路。因此,建议大家在考虑将业务加入AI能力,让AI为业务提效时,增加算法同学的投入,让算法和开发同学通力合作,更好地解决问题。

或许,提示词只是大语言模型发展早期阶段的一种折中方案。可以类比为汽车的发展,从手动挡逐渐演化到辅助驾驶和自动驾驶,未来我们和大模型的交互可能也会采用更先进的方式,如脑电波、意念等。

虽然ChatGPT的出现让人眼前一亮,但是大语言模型还存在很多其他待解决的问题,现在还需要我们去迁就它。

不过,在我看来,这却是一件值得庆幸的事情。正是因为AI的不完美,我们才没那么容易失业。

在AI发展的当前阶段,我认为最重要的是学好提示词,掌握AI工具的最佳实践,才能成为最早一批灵活驾驭大模型来更好解决你生活和工作问题的人,才能在AI时代的早期取得一些竞争优势。希望本文提供的一些经验能够让大家少走一些弯路。

THE END
1.ai大模型和小模型的区别ai大模型和小模型的区别 人工智能领域中的模型分为两种,一种是大模型,另一种是小模型,两者在训练和应用中有着明显的区别。 本文将从定义、特点、应用等方面详细介绍这两种模型的区别。 一、概念定义 ,大模型通常指参数数量较多、结构比较复杂、精度较高、计算量较大的模型。它们能够处理更复杂的问题,能够提高模型...https://m.elecfans.com/article/2207224.html
2.AI大模型应用入门实战与进阶:Part16AI大模型未来趋势1.背景介绍 随着人工智能技术的发展,AI大模型已经成为了许多领域的核心技术,例如自然语言处理、计算机视觉、推荐系统等。这些大模型通常具有高度的参数量和复杂性,需要大量的计算资源和数据来训练和优化。在这篇文章中,我们将探讨AI大模型的未来趋势,以及如何应对其所面临的挑战。 https://www.jianshu.com/p/f3b441e1fbe4
3....哪家公司研发的kimichat语言模型性能详细介绍kimi人工智能作为一款备受关注的产品,其出色的性能和广泛的应用领域引发了人们对其研发公司的浓厚兴趣。那么,究竟是哪家公司研发了这款引领潮流的人工智能产品呢?小编这里整理了些相关资料,快来和我一起看看吧! kimichat语言模型性能详细介绍 1、Kimi智能助手是由国内AI公司月之暗面开发的,创始人是杨植麟。 https://www.crsky.com/zixun/592457.html
1.一文让你搞懂什么是AI大模型(非常详细),零基础入门到精通,看这一篇就够...大模型的复杂性使得其内部机制难以解释,如何提高模型的透明度和可解释性是一个重要研究方向。 尽管如此,AI大模型的未来依然充满希望。随着计算能力的提升和算法的不断优化,大模型将在更多领域展现出其强大的能力和应用前景。 结语 通过本文的介绍,相信你已经对AI大模型有了全面的了解。无论是自然语言处理、图像识别,...https://blog.csdn.net/weixin_49892805/article/details/142652947
2.探索AI大模型的分类方法与技术在人工智能领域,AI大模型是指参数量庞大的深度学习模型,拥有强大的学习能力和推理能力,能够解决更加复杂的问题和任务。在技术层面,AI大模型的分类方法与技术主要包括模型结构、训练策略和推理加速等方面的技术突破。以下将详细介绍这些技术方面的发展和应用。 https://yaotai.163.com/cs/metaverse/ZsKcwY4BLmgvlgK6_Shl.html
3.AI大模型应用入门实战与进阶:大模型在知识图谱构建中的应用...1.背景介绍 知识图谱(Knowledge Graph, KG)是一种以实体(Entity)和关系(Relation)为核心的数据结构,用于表示实际世界的知识。知识图谱的应用范围广泛,包括信息检索、问答系统、推荐系统、语义搜索等。随着大规模机器学习(Deep Learning)和自然语言处理(Natural Language Processing, NLP)的发展,大模型(Large Model)在知...http://www.zhangshiyu.com/post/68325.html
4.人工智能大模型原理与应用实战:大模型的基本概念51CTO博客1.背景介绍 人工智能(Artificial Intelligence, AI)是计算机科学的一个分支,研究如何使计算机具备人类智能的能力。随着计算能力的提升和数据量的增加,人工智能技术在过去的几年里取得了巨大的进展。在这一进程中,大模型(Large Models)发挥了关键作用。大模型是指具有大量参数(通常超过百万或千万)的机器学习模型,它们可以...https://blog.51cto.com/universsky/8997109
5.关于举办AIGC技术与大模型应用实战师资培训的通知同时为助力战略性新兴产业融合集群发展和现代化产业体系建设,以实现高水平科技自立自强、建成教育强国、科技强国、人才强国的远大目标,深圳信息职业技术学院(通信类国家级职业教育“双师型”培训基地)结合当前新兴产业技术发展趋势与人才培育需求,拟定于2024年4月11日-17日举办“AIGC技术与大模型应用实战师资培训”活动,...https://www.sziit.edu.cn/info/1038/16020.htm
6.万字长文详解:大模型时代AI价值对齐的问题对策和展望在弱人工智能时代,人们可能难以设想一个具有通用任务执行能力的AI存在如此具体紧迫的危险,但在大语言模型(LLM)爆发式发展的今天,我们需要更好地理解并能够具象化感知这一危险发生的可能性。因此,本文将从这一带有科幻色彩的故事走入,将AI价值对齐拆解为几项比较具体的研究方向,从学术的角度进行详细阐释。https://36kr.com/p/2469833834666113
7.“积极拥抱AI大模型”!腾讯云胡利明发声问:能否简单介绍AI大模型对于金融机构有何价值? 胡利明:本轮AI大模型热潮给包括金融行业在内的各行各业都带来了深远的影响。AI大模型通过大规模的参数和预训练技术,使得AI具备了比过去更强大的理解能力和表达能力,因此应用场景非常广泛。 对于金融机构而言,善用AI大模型,就相当于配备了一群不限数量的优秀“大学毕业...https://finance.eastmoney.com/a/202309102842760628.html
8.大模型综述:万字长文详解AI大模型的原理应用与未来趋势(非常...在自然语言处理(NLP)和人工智能(AI)的浩瀚星空中,大语言模型(Large Language Models, LLMs)如同一颗璀璨的新星,正在改变我们与语言、与机器交互的方式。本章将带您踏上一段探索之旅,揭示大语言模型的发展历程、独特魅力及其在现实世界中的多彩应用。 1.1 语言模型的进化史 ...https://www.jindouyun.cn/document/industry/details/236141
9.公司介绍蜜度Midu公司介绍 蜜度科技股份有限公司 坚持以实用的AI产品,为客户创造更大价值使命 科技赋能千行百业愿景 蜜度成立于2009年,是一家以人工智能技术为核心的语言智能和垂直大模型企业,专注于多模态、多语言智能科技,以数据与AI算法双轮驱动,赋能千行百业实现数智化转型升级。 蜜度基于自主研发的蜜巢、文修两个垂直大模型,利用...https://www.midu.com/about
10.AI摄影仅需要了解这几款AI绘画大模型!一秒生成胶片风拍立得...介绍 随着AI技术的快速发展,AI绘画技术也在不断进步。 通过训练大模型,AI能够学习并复现现实世界中的各种人和事物,使生成的照片具有更高的真实性和艺术性。加上最新新的AI绘画模型不断涌现,为用户提供更多选择,使得生成的照片更加多样化和精致。 我向你推荐三个时下最火热的真实人大模型,并与你分享利用各种embe...https://www.yizz.cn/3127.html
11.全球十大最强大模型AI大模型实力排名全球知名大模型盘点→...人工智能技术是全球科技竞争的重要领域,全球数家科技公司已加快布局和发展人工智能产业。本文中Maigoo小编将带大家看看全球十大最强的AI大模型,如ChatGPT、Claude、Gemini,以及LLaMA、MPT、StableLM、Falcon、通义千问、文言一心等都较具代表性。下面一起来详细了解下这https://www.maigoo.com/top/440978.html
12.使用Jmeter对AI模型服务进行压力测试腾讯云开发者社区在上文我们介绍了如何使用腾讯云的GPU部署大模型,我们使用了FastChat框架部署了ChatGLM3-6B的模型。 但是通常我们在对模型选型时,还需要对大模型进行评测。 在评估AI模型时,我们除了要关注模型本身的性能指标外,还需考虑提供的模型服务性能、吞吐量以及并发性等方面。本文将介绍如何利用JMeter进行压力测试,并获取关键的...https://cloud.tencent.com/developer/article/2356687
13.一周AIGC丨Pika完成5500万美元融资,国内首套AIGC汉服亮相韩媒:三星 Galaxy Book 4 系列笔记本 12 月 15 日发布,将支持本地运行高斯 AI 大模型 据IT之家援引韩联社报道,有业内人士透露称,三星电子将于本月 15 日推出搭载英特尔下一代处理器酷睿 Ultra 的 Galaxy Book 4 系列笔记本电脑,号称是全球首款 AI 笔记本。 https://www.thepaper.cn/newsDetail_forward_25540020