SILO是一种新的语言模型,通过在推断时使用非参数化数据存储来平衡法律风险和性能,从而在不训练高风险数据的情况下提高性能,并支持
是一种新的语言模型,通过在推断时使用非参数化数据存储来平衡法律风险和性能,从而在不训练高风险数据的情况下提高性能,并支持数据归因和内容移除。SILO的构建方式如下:1.在开放许可语料库(OLC)上训练参数化LM,这是一个我们用公共领域的228B代币和许可文本策划的新语料库2.使用更通用且易于修改的非参数数据存储对其进行增强(例如,包含受版权保护的书籍或新闻),仅在推理过程中查询。数据存储允许使用高风险数据而无需对其进行训练,支持句子级数据归因,并使数据生产者能够通过从商店中删除内容来选择退出该模型。这些功能可以促进对数据使用法规的遵守,例如美国的合理使用原则和欧盟的GDPR。
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人