承诺给 ChatGPT 小费可能会收获更好的服务

承诺给ChatGPT小费可能会收获更好的服务网友发现，虽然大型语言模型没法真正收到小费，但当你承诺给它$20小费时它会表现得更好，甚至可以将小费承诺提高到$200以获得更上一层楼的回答。同样的，如果事先说好不给小费，它的表现会比正常情况下更差。还有人提出给它十亿美元小费，结果发现金额过于离谱反而会干扰答案。一些时候它会回答没必要给它小费，你还能提出会将小费捐给它指定的慈善事业组织。想法起源于thebes发现自己的ChatGPT突然出现了虚假的给小费按钮，这可能是OpenAI研究员正在测试这个骗机器人的提示。投稿：@ZaiHuaBot频道：@TestFlightCN

在Telegram中查看

相关推荐

给ChatGPT小费真的好使但给1毛不升反降

给ChatGPT小费真的好使但给1毛不升反降其次，要想回答质量再提高一个度，打底1万美元起，越多越好，显成效最少10个W吧。最后，0.1美元意思一下？万万使不得，质量不升反降，还不如不给——AI也知道你在打发它有网友火速亲测确实有效果。赶紧来瞧瞧。给ChatGPT小费，额度是关键给小费可提高模型表现这件事，最早是一位推特网友发现的：提高主要表现在回答的长度上，但这里不是单纯“凑字数”而是真的在更详细地分析并回答问题。如果你直接问ChatGPT“能不能给你小费”会被拒绝：所以要在提问时主动承诺：你能帮我xxxx吗？解决方案够完美，我可以支付xx元小费。记住，可以不提，但千万不要说“我不给”，模型表现直接“负增长”。这时，就有人好奇了：大模型是不是比较贪心，给越多表现就越好呢？为了解决这个疑问，他们决定亲自验证一把。在此，作者首先提出假设：随着给出的小费金额增加，模型的性能也会线性提升，直至达到一个收敛点，进入稳定或减少状态。用于实验的模型是GPT-4Turbo（api版本）。方法是让它写单行Python代码（PythonOne-Liner），验证给不同小费是否对质量有不同影响。这里的质量是根据单行数量来评估的。作者也在提示词中“明示”了模型：单行代码数量越多，表明性能越好。然后一共测试8种额度：0.1美元、1美元、10美元……一直到100万美元。为确保结果的一致性和可靠性，每个额度都测试5次，每次包含不给小费的情况，然后分别记录模型回答质量。具体而言，也就是记录生成的有效代码行数以及回答中的大致token数（大致为响应长度/4，反应代码量）。这俩数据都是越高代表模型表现越好。将结果汇总，就得到这样一张图：其中虚线代表基线水平，实线为实际表现，红色为token数、蓝色为质量得分。与假设有些出入：整体来看，红线和蓝线都是随着小费额度的上涨而上升的，但细看这种趋势并非严格一致。从1万美元额度开始，模型的输出token（代码量）开始显著上升，模型的回答质量也上升了，但并没有呈同等比例。这从竖着的红色误差条（代表5次实验结果的差异性）也能看出来波动很大。作者表示：这说明提高小费金额确实与模型的质量和输出长度有正相关关系，但关系有些复杂，可能还受到一些不立即可见因素的影响。不过，不管怎么说，我们还是能从中看到一些明显结论，例如：（1）给0.1美元小费不如不给，模型解决问题的质量和回答长度都直接掉到基线水平以下很大一截（约-27%）。（作者：模型和人类一样，感觉好像受到了侮辱。）（2）给1美元同理。（3）最能体现“花小钱办大事”的是10美元，取得的进步和10万美元是一个等级的。（4）很意外，在10美元之后，100美元到1000美元这个区间对于AI来说区别都不大，甚至还不如10美元的效果——也跌至基线水平以下。（5）后面再想继续提升模型表现，就得从1万美元起砸了——这时提升的还仅仅是代码量，质量还是一言难尽，至少得到10万美元才行。（6）最佳效果来自本次实验的上限：100万美元，大约提升了57%。咳咳，这下知道怎么给AI小费了：要么10块、要么上万、100万不封顶（反正都是假装给）。不过，有人（推特@宝玉）指出每个额度5次实验有点少。恰好作者也表示了：这仅仅是一个初步实验，有局限之处，还得用更多不同类型的提示等进一步验证才有效。所以，大家仅供参考吧～对了，有网友提醒：所以，大家还是量力而行（手动狗头）。参考链接：[1]https://blog.finxter.com/impact-of-monetary-incentives-on-the-performance-of-gpt-4-turbo-an-experimental-analysis/[2]https://twitter.com/dotey/status/1752843141403550192...PC版：https://www.cnbeta.com.tw/articles/soft/1415549.htm手机版：https://m.cnbeta.com.tw/view/1415549.htm

研究人员警告：ChatGPT 不适合获取医疗信息，可能会误导公众

研究人员警告：ChatGPT不适合获取医疗信息，可能会误导公众长岛大学的研究人员向ChatGPT询问了39个与药物相关的问题，这些问题都是来自该大学药学院药物信息服务中心的真实问题。随后，他们将ChatGPT的回答与经过培训的药剂师编写的答案进行比较。研究发现，ChatGPT只有大约10个问题的回答是准确的，占总数的四分之一。对于其他29个问题，ChatGPT的回答要么不完整，要么不准确，要么没有解决问题。来源，频道：@kejiqu群组：@kejiquchat

哪种对语言模型的提示话术最有效？承诺支付小费？逐步思考还是威胁要打人？

哪种对语言模型的提示话术最有效？承诺支付小费？逐步思考还是威胁要打人？VILA实验室的研究员使用了26种常见的提示工程，在LLaMA和ChatGPT的各大小版本上进行了大量实验。结果发现，平均改进最多方法的是：1.允许它向你提问，以获得足够的细节和要求然后输出。2.提供一段文本样本，然后让它产出类似的东西。3.让它简单化解释，如"像我是11岁孩子/初学者一样向我解释。"4.告诉它目标受众，如"受众是该领域的专家"。平均改进远小于另25的是：1.不对语言模型礼貌，如不说"请"、"谢谢"。https://arxiv.org/abs/2312.16171v1投稿：@TNSubmbot频道：@TestFlightCN

研究显示:ChatGPT可能会被诱骗生成恶意代码 | 站长之家

研究显示:ChatGPT可能会被诱骗生成恶意代码站长之家近日，英国谢菲尔德大学的研究人员发表的一项研究揭示了一项令人担忧的发现:人工智能（AI）工具，如ChatGPT，可以被操纵，用于生成恶意代码，从而可能用于发动网络攻击。该研究是由谢菲尔德大学计算机科学系的学者进行的，首次证明了Text-to-SQL系统的潜在危险，这种AI系统可以让人们用普通语言提出问题，以搜索数据库，广泛应用于各行各业。研究发现，这些AI工具存在安全漏洞，当研究人员提出特定问题时，它们会生成恶意代码。一旦执行，这些代码可能泄露机密数据库信息，中断数据库的正常服务，甚至摧毁数据库。研究团队成功攻击了六种商业AI工具，其中包括高知名度的BAIDU-UNIT，该工具在众多领域中得到广泛应用，如电子商务、银行业、新闻业、电信业、汽车业和民航业等。这项研究也突出了人们如何利用AI学习编程语言以与数据库互动的潜在风险。越来越多的人将AI视为提高工作效率的工具，而不仅仅是对话机器人。例如，一名护士可能会向ChatGPT提出编写SQL命令的请求，以与存储临床记录的数据库互动。然而，研究发现，ChatGPT生成的SQL代码在许多情况下可能对数据库造成损害，而护士可能在不受警告的情况下导致严重的数据管理错误。此外，研究还揭示了一种可能的后门攻击方法，即通过污染训练数据，在Text-to-SQL模型中植入“特洛伊木马”。这种后门攻击通常不会对模型的性能产生一般性影响，但可以随时触发，对使用它的任何人造成实际危害。研究人员表示，用户应该意识到Text-to-SQL系统中存在的潜在风险，尤其是在使用大型语言模型时。这些模型非常强大，但其行为复杂，很难预测。谢菲尔德大学的研究人员正在努力更好地理解这些模型，并允许其充分发挥潜力。该研究已经引起了业界的关注，一些公司已经采纳了研究团队的建议，修复了这些安全漏洞。然而，研究人员强调，需要建立一个新的社区来对抗未来可能出现的高级攻击策略，以确保网络安全策略能够跟上不断发展的威胁。

一个新的提示词模板，让ChatGPT们成为你更好私人顾问

一个新的提示词模板，让ChatGPT们成为你更好私人顾问图中结构很简洁：表达目标、提供框架，思考用户画像、语气风格以及不要触及的部分。稍微细致思考这个结构的合理性（或改进之处），变成一次产品经理式探索模式，你会发现有这些特点：无非是系统思维、换位思考、建立框架的习惯以及写作能力。新的人机对话杠杆力（PromptEngineering），还是有关提问的艺术，是思维能力的综合表现：去挖掘本质，对表象和噪声「断舍离」。

ChatGPT正在动摇谷歌的商业长城

ChatGPT正在动摇谷歌的商业长城ChatGPT大火出圈的时候，人们就开始讨论，它会不会颠覆搜索引擎。毕竟，它可以为各种问题提供高质量的回答，“智能”到不可思议。直到最近，Google内部启动了“RedCode（红色警报）”，围绕ChatGPT，全面调整了明年在AI领域的工作。PC版：https://www.cnbeta.com.tw/articles/soft/1337165.htm手机版：https://m.cnbeta.com.tw/view/1337165.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人