Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做

Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做的不好。 同时他还把前几天自己的视频教程转成了文字内容,觉得视频太浪费时间的可以看文本。 AK 设想的完整工作流: 一个有趣的大语言模型 (Large Language Model) 挑战是:将我的2小时13分钟的分词器视频转换成一本书的章节(或者博客文章)形式,专门讨论分词。具体步骤如下: 为视频添加字幕或解说文字。 将视频切割成若干带有配套图片和文字的段落。 利用大语言模型的提示工程技术,逐段进行翻译。 将结果输出为网页形式,其中包含指向原始视频各部分的链接。 从更广泛的角度来看,这样的工作流程可以应用于任何视频输入,自动生成各种教程的“配套指南”,使其格式更加便于阅读、浏览和搜索。这听起来是可行的,但也颇具挑战。 LLM Tokenization课程文字版本:

相关推荐

封面图片

:将脚本转换为工作流和 UI 的开源开发者平台。

:将脚本转换为工作流和 UI 的开源开发者平台。 开源开发者基础架构,用于内部工具。自主托管的选择,可以替代Airplane、Pipedream、Superblocks和简化版Temporal,具备自动生成UI的功能和自定义UI,用于触发工作流和脚本作为内部应用。脚本将转换为UI和无代码模块,无代码模块可以组合成非常丰富的流程,并且脚本和流程可以从用低代码构建器制作的内部UI触发。支持的脚本语言包括:Python、Typescript、Go、Bash、SQL。

封面图片

- 将文本转换为旁白。敏感人士制作视频时如果不想暴露自己的声音,类似的服务都可以帮助您配音。

- 将文本转换为旁白。敏感人士制作视频时如果不想暴露自己的声音,类似的服务都可以帮助您配音。 elai 是其中领先的文本到视频转换平台,用人工智能为您的文本发声。 有一个方便的编辑面板。您可以添加文字、动画,改变演讲者的位置、背景等等。 该网站支持65种语言的配音,包括中文,还有更多不同类型的声音。您也可以上传自己的声音。 #tools

封面图片

古希腊掌管 Animatediff 工作流的神 Jerry Davos 的新作品,一个支持非常详细的面部修复和唇形同步的视频转视

古希腊掌管 Animatediff 工作流的神 Jerry Davos 的新作品,一个支持非常详细的面部修复和唇形同步的视频转视频 ComfyUI工作流。 工作流包括三个阶段: 阶段1:将原始视频的每一帧中的面部替换为风格化的面部(目的是使其更接近animatediff风格的面部),同时确保嘴唇同步效果不受影响。 阶段2:此时,从阶段1得到的“只包含面部”的每张图像被覆盖到更精细处理过的图像上,然后将这些图像保存到名为Swapped_A的目录中。 阶段3:(颜色匹配):接下来,Swapped_A目录中的每张图像将与细化目录中相同的图像进行交换。这一过程旨在尽可能实现颜色匹配的最佳效果,同时在一定程度上保持嘴唇同步的准确性。 查看教程及下载工作流:

封面图片

:推荐一下这款浏览器插件,YouTube Dubbing ,一键将英语视频转换为中文的声音进行播放,非常适合用来看国外教程类的,

: 推荐一下这款浏览器插件,YouTube Dubbing ,一键将英语视频转换为中文的声音进行播放,非常适合用来看国外教程类的视频,目前支持Youtube 和Udemy 。PC,Android ,IOS 都支持。官网: | : | 新版本上线,支持最新Azure语音(配音更自然),支持GPT-4和Claude-3(翻译更精准),打破语言障碍,用母语看任何视频,装起来 | |

封面图片

前“堂堂央视记者”王志安同志为视频节目制作指明了方向。还要学我把节目转换成文字稿修改成文章呢,有人看吗?王志安最著名的节目就是为

前“堂堂央视记者”王志安同志为视频节目制作指明了方向。还要学我把节目转换成文字稿修改成文章呢,有人看吗?王志安最著名的节目就是为董志民鸣冤叫屈说他是“铁链女”大恩人吧,以及那些谩骂、造谣我的节目,其他的节目过几天还有谁记得?所以整天回味他在央视的美好时光。其实他在央视的节目也没人记得

封面图片

Q-Chat-人工智能学习平台:

Q-Chat-人工智能学习平台: BiliGPT-一键总结BiliBili视频内容: Meerkat-将非结构性数据处理为结构性数据: Stability for Blender-Stable Diffusion官方Blander插件: Perplexity浏览器插件-一键生成网页摘要: Promptperfect-优化你的 AI 提示词: RoomGPT-优化你的房间装修: Auralbyte-将音频快速转换为视频: Elevenlabs-生成式语音AI模型: Spellbook-将你起草法律合同的效率提高三倍: Kraftful-将AI用于用户研究工作: Bifrost-从figma设计稿生成干净的前端代码: 学习资源: 如何将你的录音变成待办事项列表: 强烈推荐-如何在 Midjourney 中制作游戏资产: Midjourney教程-创建波西米亚风格内饰照片: 精选文章: 来自微软的交互式文本生成模型:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人