一些使用国产 AI 大模型的细节限制。

一些使用国产 AI 大模型的细节限制。 1.kimi 的文本生成很强,但没有数据分析能力,会把上传的 Excel 识别为文本。kimi 无法识别图片,只能识别图片的文本,OCR。 2.智谱清言可以识别图片内容,可以做数据分析,但是要用数据分析的智能体,经常抽风。你不和他特地强调 Excel 里有几个 sheet,他只默认识别第一个 sheet。 3.coze 里上传 Excel 分析的体验很差,coze 的知识库是无法理解数据集的,还是当成文本来处理。

相关推荐

封面图片

#AI #图转文 #web

#AI #图转文 #web Image to Text 一个图像转文本工具,不仅可以识别图像中的文字,还可以对图像进行分析和描述,免费使用,无需注册。 这个蛮不错的,我上传了很多图片去测试,描述的挺精准,不过过大的图片无法识别。 https://2txt.vercel.app 频道 @WidgetChannel

封面图片

继续总结一些AI,这次是一些办公室使用的神经网络工具:

继续总结一些AI,这次是一些办公室使用的神经网络工具: ▫ - 一个AI会议助手,可以将通话记录转为文本笔记,自动捕获幻灯片并形成摘要。可与Zoom、Google Meet和Microsoft Teams一起工作。 ▫ - 帮助您的团队记录、转录、搜索和分析语音对话。 ▫ - 撰写对电子邮件的回复。 ▫ - Chrome扩展,可生成电子邮件。 ▫ 简化了谷歌电子表格的工作。 ▫ 总结任何文章。撰写执行摘要将为您提供关键点和反驳论据。提高阅读速度。 ▫ 苹果设备的助理撰稿人,提供从提案和求职信到博客和创建社交媒体帖子的一切帮助。 ▫ 生成演示文稿。将撰写文本并就给定的主题提出设计方案。 ▫ 生成幻灯片的助理。 ▫ 将自动处理日常的文本、电子邮件和文件。 ▫ - 从工作聊天记录、文件和云驱动器中搜索任何东西。 更多AI工具: #tools

封面图片

AI领域里面大家可能更多关注的是LLM相关的内容,但是AI画图的一些数据往往难以找到。

AI领域里面大家可能更多关注的是LLM相关的内容,但是AI画图的一些数据往往难以找到。 今天一个团队发布了一份关于AI画图领域的数据分析,里面的数据显示过去一年多时间AI生产的图片数量已经超过了150年间人类拍摄的所有照片数量,太离谱了。 详细的内容可以看这里: 下面是这个数据分析的主要内容: →自去年以来,使用文本转图像算法创建了超过 150 亿张图像。客观地说,从 1826 年拍摄第一张照片到 1975 年,摄影师花了 150 年的时间才达到 150 亿张大关。 →DALLE-2 推出以来,人们平均每天创建 3400 万张图像。 →增长最快的产品是 Adobe Firefly,自推出以来仅三个月内就创建了 10 亿张图像。 →Midjourney 拥有 1500 万用户,是公开统计的所有图像生成平台中最大的用户群。 →大约 80% 的图像(即 125.9 亿张)是使用基于开源 Stable Diffusion 的模型、服务、平台和应用程序创建的。 DALL-E 2 2022 年 4 月,OpenAI 发布了其图像生成模型 DALL-E 2。然后 OpenAI 报告称,用户每天使用 DALL-E 2 生成超过 200 万张图像。我们不确定 OpenAI 所说的这个数字意味着什么时间段,或者他们是否获取了生成的平均图像量。我们假设这是一个平均值,这意味着 15 个月内在单个平台上生成了大约 9.16 亿张图像。 Midjourney Midjourney 于 2022 年 7 月上线。根据 Photutorial 的估计,Midjourney 的 Discord(该算法只能通过 Discord 获得)每秒接收约 20 至 40 个作业,拥有 1500 万注册用户和 150 万至 250 万活跃用户任何特定时间的成员。考虑到这一点,我们使用每秒 30 个作业作为平均创建图像数,每天创建多达 250 万个图像。因此,自 Midjourney 推出以来,已创建了 9.64 亿张图像。 Stable Diffusion

封面图片

【SEC主席:SEC将针对AI应用的一些潜在负面影响对相关规则制定提出建议】

【SEC主席:SEC将针对AI应用的一些潜在负面影响对相关规则制定提出建议】 6月28日消息,SEC 主席 Gary Gensler 在社交媒体上发文表示,预测数据分析和人工智能正在改变我们经济中很大一部分,金融也不例外。人工智能已经被用于呼叫中心、开户、合规计划、交易算法和情绪分析等。人工智能推动了机器人顾问和经纪应用程序的快速变化。当预测数据分析和这些应用程序背后的算法针对投资者利益进行优化时,可以有利于市场准入、效率和回报。但这一样可能导致潜在的冲突。当顾问或经纪人为了自己和他人的利益而优化时,可能会出现冲突。此外,这些分析模型中使用的基础数据可能基于反映历史偏差的数据,从而对市场的公平准入和价格产生影响。SEC 的工作人员将针对这些事项的潜在规则制定提出建议。 快讯/广告 联系 @xingkong888885

封面图片

一晚上把 coze 的大部分插件都玩了一遍,下图记录了一些比较好玩的插件

一晚上把 coze 的大部分插件都玩了一遍,下图记录了一些比较好玩的插件 把这些插件利用工作流串起来放到 bot 中,很多小想法都可以实现了 例如小宇宙链接分享至微信获取播客摘要:小宇宙链接提取工具 音频处理成文本工具 文本总结摘要工具 发布至微信客服 就可以达到分享至微信就获取摘要的目的 对于一些不复杂的产品,coze 把做产品变得像写 prd 一样简单

封面图片

阿里巴巴开源能理解图像的 AI 模型 Qwen-VL

阿里巴巴开源能理解图像的 AI 模型 Qwen-VL 阿里巴巴周五开源了能理解图像和完成更复杂对话的 AI 模型和 Qwen-VL-Chat。阿里巴巴称,Qwen-VL 基于 Qwen-7B,可以以图像、文本、检测框作为输入,并以文本和检测框作为输出,它使用了约 1.5B 的图文数据训练。在四大类多模态任务的标准英文测评中上,Qwen-VL 均取得同等通用模型大小下最好效果;支持英文、中文等多语言对话,端到端支持图片里中英双语的长文本识别;支持多图输入和比较,指定图片问答,多图文学创作等;相比于目前其它开源 LVLM使用的 224 分辨率,Qwen-VL 是首个开源的 448 分辨率的 LVLM 模型。更高分辨率可以提升细粒度的文字识别、文档问答和检测框标注。Qwen-VL 和 Qwen-VL-Chat 使用名为 Tongyi Qianwen LICENSE AGREEMENT 的许可证,有限制条件,如果商业使用,则需要从阿里巴巴获得授权。来源 , 频道:@kejiqu 群组:@kejiquchat 投稿:@kejiqubot

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人