BBLIVE自动监听并录制B站直播和弹幕（含付费留言、礼物等），根据分辨率转换弹幕、语音识别字幕并渲染进视频，根据弹幕密度切分精

BBLIVE 自动监听并录制B站直播和弹幕（含付费留言、礼物等），根据分辨率转换弹幕、语音识别字幕并渲染进视频，根据弹幕密度切分精彩片段并通过视频理解大模型生成有趣的标题，根据图像生成模型自动生成视频封面，自动投稿视频和切片至B站，兼容无GPU版本，兼容 x64 及 arm64 超低配置服务器与主机。 #哔哩哔哩 #录制项目地址：

在Telegram中查看

相关推荐

是一个使用百万级动漫数据进行训练的，结构与 Waifu2x 兼容的通用图像超分辨率模型，支持 2x3x4x 倍超分辨率，其中

是一个使用百万级动漫数据进行训练的，结构与 Waifu2x 兼容的通用动漫图像超分辨率模型，支持 2x3x4x 倍超分辨率，其中 2 倍模型支持 4 种降噪强度与保守修复，3 倍/4 倍模型支持 2 种降噪强度与保守修复这是哔哩哔哩弹幕网（B 站）最近在 GitHub 上线的一项全新的项目，其名为 Real-CUGAN 通用动漫图像超分辨率模型，可让老旧动漫画面变高清。需要注意的是，该模型在 Windows 10 64 位系统中测试，以及 cuda10 以上，可生成“降噪版”“无降噪版”“保守版” 三种图像类型。降噪版：如果原片噪声多，压得烂，推荐使用；目前 2 倍模型支持了 3 个降噪等级；无降噪版：如果原片噪声不多，压得还行，但是想提高分辨率/清晰度/做通用性的增强、修复处理，推荐使用；保守版：如果你担心丢失纹理，担心画风被改变，担心颜色被增强，总之就是各种担心 AI 会留下浓重的处理痕迹，推荐使用该版本。

MetaAI 开源 ImageBind，可让模型跨 6 种不同的模态（图像、文本、音频、深度、热能和 IMU 数据）进行联动

MetaAI 开源 ImageBind，可让模型跨 6 种不同的模态（图像、文本、音频、深度、热能和 IMU 数据）进行联动借助 ImageBind，则可以做到直接通过声音来直接生成图像。这使得 AI 能够更加深入了解人类情感，理解他们的喜怒哀乐，进而为人类提供更好的服务。当你举起手机，录制一个海边日落的视频时，AI 便能自动根据视频内容来生成文案和字幕，并匹配上合适的背景音乐。至 AI 还有可能通过一首歌，直接为歌手生成一段视频 MV。此举将为 AIGC 技术带来更为广泛的应用场景，一大波更为有趣、实用的 AI 项目也即将来袭。#AI 来源，来自：雷锋频道：@kejiqu 群组：@kejiquchat 投稿：@kejiqubot

：将webgi 3D渲染和AI结合，高效批量产出广告营销素材

：将webgi 3D渲染和AI结合，高效批量产出广告营销素材你只需上传素材，如你的标志或产品图片，然后描述想要的创意，Kartiv就会使用你的描述和素材来创建吸引人的视觉效果。这些都是自动化的，实时的，并在浏览器内部运行。KartivAI还实现了多种图形效果，同时还能生成复杂的3D 场景。 Kartiv 的特点包括：易于使用：不需要任何设计知识或经验。专业工具：可以编辑和配置创意中的每一个元素。变体：Kartiv 可以快速生成大量的变体，使得探索和可视化多种想法变得容易。自动调整大小：Kartiv 会自动调整你的创意的大小，以适应不同的媒介。 AI助手：Kartiv 的AI会学习和适应你的喜好，并在你的创意想法流动时提出建议。协作：与你的团队分享想法和创意的完美工具，从简报到生产就绪的视觉效果。测量：你可以使用 Kartiv 测试想法并衡量其影响。优化：可以帮助你根据创意的表现来改进它们。 KartivAI还实现了多种图形效果，如 SSR（屏幕空间反射）、SSGI（屏幕空间全局照明）、AO（环境光遮蔽）、渐进阴影、去噪等，这些都可以使生成的图片和视频看起来更加真实和专业。同时KartivAI还利用了最近在 LLMs（低级别模型）和扩散 AI 方面的进步，这使得它能够更好地理解和生成复杂的 3D 场景。

2024 年谷歌 I/O 大会：发布的全部内容

2024 年谷歌 I/O 大会：发布的全部内容 1⃣ 从下个月开始，Workspace 和 Google One AI Premium 的订阅用户将能够在 Gmail 应用内使用 Gemini 来为他们总结电子邮件 2⃣ 今年夏天，Google Photos 将推出自己的“询问照片”助手 3⃣ Google Lens 现在允许你通过录制视频来搜索内容。 4⃣ 谷歌又推出了一款新的 AI 模型：Gemini 1.5 Flash。它承诺将与 Pro 和谷歌的其他 Gemini 模型一样强大，但速度更快。 5⃣ 针对 OpenAI 的 Sora，Google推出了其新的生成式 AI 视频模型 Veo，，能够根据文本、图片和视频提示输出 1080p 视频 6⃣ 针对ChatGPT的GPTs，Google为Gemini推出了名为“Gems”的个性化选项，它允许用户创建具有不同个性的定制版 Gemini 助手。 7⃣ Google 将Gemini Nano AI 作为AI助手融入 Chrome 8⃣ 新推出的 Gemini Live 功能旨在使与 Gemini 的语音聊天更加自然 9⃣ 现在，Circle to Search 可以帮助解决数学问题了 1⃣0⃣ 安卓推出了 AI 驱动的诈骗检测功能 1⃣1⃣ 谷歌表示，Gemini 很快就能让用户对屏幕上的视频提问，并根据自动生成的字幕给出答案。对于付费的 Gemini Advanced 用户，它还可以处理 PDF 文件并提供信息。这些以及其他针对 Android 上 Gemini 的多模态更新将在接下来的几个月内推出。 1⃣2⃣ 谷歌升级了其 SynthID 人工智能水印技术，它将在其新的 Veo 视频生成器创建的内容中嵌入水印，并且现在也能检测出由 AI 生成的视频。 1⃣3⃣ Gemini将与日历、Tasks和 Keep 集成 1⃣4⃣ Gemini以在几秒钟内制定完整的度假行程标签: #Google 频道: @GodlyNews1 投稿: @GodlyNewsBot

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4

谷歌弃Bard发布超大杯Gemini 全面对标GPT-4 Gemini是品牌总称，相当于OpenAI的ChatGPT；Gemini Advanced付费服务，对应ChatGPT Plus；Gemini Ultra模型，对标的是GPT-4；切换到Gemini Advanced界面的操作也和ChatGPT类似，只需点击左上角的选项即可：在价格方面，Gemini Advanced的定价也是颇有意思19.99美元/月，比ChatGPT Plus（20美元/月）便宜了亿点点。不过Google也给出了一个小福利，订阅后的前两个月，免！费！！并且不会像GPT-4那样有每小时使用次数限制，可以放开了用。不仅如此，Google这次还顺带在Android手机里推出了Gemini的APP，特定的Android机长按电源键等按钮可以“直达”的那种：iOS用户也不用着急，Gemini将在未来几周会出现在Google App中，届时的打开方式会是这样的：毕竟Google此前发布Gemini Ultra这款大模型之际，便是一上来就在32个基准测试中拿下30个SOTA，并且第一个在MMLU基准上达到人类专家水平。现如今产品化的它终于上线，也是让众多网友纷涌而至，一时间也是出现了短暂的宕机。那么加持了Google自家最强大模型的Gemini Advanced，效果到底如何？我们在第一时间成功开通了试用。实测Gemini Advanced虽然Google声明目前只开放英语支持，但实测用中文提问，它不但能懂也能用中文回答。既然是Google出品，肯定少不了考验它的联网搜索能力。本来想试试能不能当吃瓜神器，结果因为Google严格的伦理道德限制，Gemini Advanced当场拒绝作答。那么退而求其次，问问纯事实不带价值判断的，它的表现就非常亮眼了。回答中，标绿色的语句展开就可以看到引用来源。标黄色的语句则表示没有找到明确引用来源，可以尝试进一步核实。AI在回答中生成的表格数据，也可以点击“Export to Sheets”一键导入到Google Docs进一步编辑处理，在工作场景可以说是非常实用了。接下来，还可以在“扩展程序”中打开对其他Google服务的支持，如地图、Gmail邮箱、YouTube视频。关联邮箱账号后，Gemini Adavanced就成变你的个人AI管家，可以帮你管理不少事情了，如找出可退订垃圾邮件。不过很可惜，扩展程序目前还不支持中文指令。用英语“find me youtube videos……”就可以触发搜索视频功能，辅助学习知识也是一把好手。除了联网搜索、集成应用，Google还特别强调了Gemini Advanced的推理能力。先来一道微软对GPT-4测试时的经典推理题，结果Gemini Advanced不仅成功作答，还考虑了额外的小概率情况。注意界面中的“Show drafts”按钮，代表Gemini Adavanced每次会生成三个“草稿”，并挑选其中最好的展示出来。三个草稿或使用不同的推理方式，或试用不同的写作风格，但答案无一例外都是正确的。如果实在不巧，遇到三个草稿都不满意的情况，也可以选择最右边的全部重来按钮。再注意答案最后面一排按钮，除了常规的点赞、点踩、分享之外，还有两个不常见的新功能。中间的滑块按钮代表“修改回答”，可以选择更短、更长、解释更简单、语气更轻松、语气更正式。尝试选择语气更轻松，整个回答就会变得更口语化。选择更正式，整个回答就像是在考场上答卷了。最后的GoogleG图标，代表使用搜索引擎核查AI生成的答案是否准确，结果同样也会用“绿色-有引用来源”，“黄色-无引用来源”的形式标出来。在更实用的场景中，要求生成一副科技主题春联，Gemini Adavanced也能满足“仄起平收”这个要求。生成代码也是小菜一碟，还“大义灭亲”，把自家广告也给隐藏了。一番体验之后，最后总结一下。Gemini Advanced在超大杯Gemini Ultra模型加持下，能力基本达到GPT-4同级别水平。设计上也更像一个成熟产品，而不是大模型的技术演示Demo了。与Google强大的互联网服务集成后，实用性上也有独到之处。另外在这次发布前，量子位也与GoogleGemini团队有过一次短暂的交流。团队表示这次发布更专注于把Gemini Ultra的语言能力释放到产品中，未来还会持续更新多模态能力、交互性更强的代码功能，以及上传文件分析数据等功能。与Google产品更深入集成，比如直接在Gmail里使用Gemini来回复邮件，目前还在“Coming soon”状态。不过我们要到一张示意图，敬请期待。另外在交流中，Google开发团队特别提醒了一点：由于产品刚刚从Bard改名为Gemini，AI偶尔会出现混乱，需要时间慢慢过渡。原来AI也像人类一样改名会不适应，也是让人哭笑不得了。都是20美元，你pick哪一个？就在这次Gemini Ultra刚刚有消息传出的时候，知名爆料账号Flowers from the future组织了一次投票。同样20美元，GPT-4和Gemini Ultra你会订阅哪个？最终2360人参与，有四成坚定的继续留在GPT-4，只有12.3%选择迁移到Gemini Ultra。不过这次投票是在真正发布之前几天了。在体验过之后，不知道又会有多少人因为产品的功能体验和服务集成“弃O投G”。而就在刚刚，沃顿商学院一位教授表示在他已经提前体验了Gemini Advanced长达6周的时间。他给出的一句评价是：Gemini Advanced显然处于GPT-4的水平，但并没有明显超过它。二者在使用过程中各有各的优势。例如在搜索能力方面，让它俩都去查看一下运动鞋的最新趋势，Gemini Advanced能够搜索YouTube，而ChatGPT使用的是Bing。这表明Gemini Advanced在搜索集成方面有所不同。这位教授还认为Gemini Advanced的界面比GPT-4更流畅，技术错误出现的也较少。它在“个性”上与GPT-4有所不同，更友好和愿意进行文字游戏。尽管两者在个性上有差异，但它们在处理复杂提示时表现出了兼容性。当然，这并非是教授在拿Gemini Advanced和ChatGPT直接做比较，而是借着二者探讨AI在未来可能发展的方向：Gemini Advanced与GPT-4相比的独特优势和劣势表明，模型仍有很大的改进空间，未来我们将继续看到快速的进步。AI的发展浪潮尚未达到顶峰，OpenAI的下一步可能是发布传闻中的GPT-4.5或GPT-5。如今距离ChatGPT发布已经过去14个月还要多，Google终于在模型-应用-生态上都准备好了与之竞争的对位产品。然鹅，老对手OpenAI却已悄然奔向下一个战场。根据The Information爆料，OpenAI正在开发新一代Agent应用，根据用户请求移动光标、点击、输入文本以及像人类一样使用各种APP。如将文档中的数据填写到电子表格中进行分析，或在会计软件中自动填写费用报告。换句话说，下一代ChatGPT将接管你的手机和电脑。参考链接：[1] ... PC版：手机版：

🔍 发送关键词来寻找群组、频道或视频。