Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做

Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做的不好。 同时他还把前几天自己的视频教程转成了文字内容,觉得视频太浪费时间的可以看文本。 AK 设想的完整工作流: 一个有趣的大语言模型 (Large Language Model) 挑战是:将我的2小时13分钟的分词器视频转换成一本书的章节(或者博客文章)形式,专门讨论分词。具体步骤如下: 为视频添加字幕或解说文字。 将视频切割成若干带有配套图片和文字的段落。 利用大语言模型的提示工程技术,逐段进行翻译。 将结果输出为网页形式,其中包含指向原始视频各部分的链接。 从更广泛的角度来看,这样的工作流程可以应用于任何视频输入,自动生成各种教程的“配套指南”,使其格式更加便于阅读、浏览和搜索。这听起来是可行的,但也颇具挑战。 LLM Tokenization课程文字版本:

相关推荐

封面图片

:将脚本转换为工作流和 UI 的开源开发者平台。

:将脚本转换为工作流和 UI 的开源开发者平台。 开源开发者基础架构,用于内部工具。自主托管的选择,可以替代Airplane、Pipedream、Superblocks和简化版Temporal,具备自动生成UI的功能和自定义UI,用于触发工作流和脚本作为内部应用。脚本将转换为UI和无代码模块,无代码模块可以组合成非常丰富的流程,并且脚本和流程可以从用低代码构建器制作的内部UI触发。支持的脚本语言包括:Python、Typescript、Go、Bash、SQL。

封面图片

- 将文本转换为旁白。敏感人士制作视频时如果不想暴露自己的声音,类似的服务都可以帮助您配音。

- 将文本转换为旁白。敏感人士制作视频时如果不想暴露自己的声音,类似的服务都可以帮助您配音。 elai 是其中领先的文本到视频转换平台,用人工智能为您的文本发声。 有一个方便的编辑面板。您可以添加文字、动画,改变演讲者的位置、背景等等。 该网站支持65种语言的配音,包括中文,还有更多不同类型的声音。您也可以上传自己的声音。 #tools

封面图片

推主花了16小时10分钟使用 AE 和生成填充将静态的 Midjourney 图片转换为动画图片。

推主花了16小时10分钟使用 AE 和生成填充将静态的 Midjourney 图片转换为动画图片。 上图为原图,下图是转换后的动图。这里被作者放大了细节,还有60%的动图内容没放出来。原始比例为1:1。作者会在之后的几天里分享它的全貌以及工作流程。有兴趣的可以关注一下

封面图片

古希腊掌管 Animatediff 工作流的神 Jerry Davos 的新作品,一个支持非常详细的面部修复和唇形同步的视频转视

古希腊掌管 Animatediff 工作流的神 Jerry Davos 的新作品,一个支持非常详细的面部修复和唇形同步的视频转视频 ComfyUI工作流。 工作流包括三个阶段: 阶段1:将原始视频的每一帧中的面部替换为风格化的面部(目的是使其更接近animatediff风格的面部),同时确保嘴唇同步效果不受影响。 阶段2:此时,从阶段1得到的“只包含面部”的每张图像被覆盖到更精细处理过的图像上,然后将这些图像保存到名为Swapped_A的目录中。 阶段3:(颜色匹配):接下来,Swapped_A目录中的每张图像将与细化目录中相同的图像进行交换。这一过程旨在尽可能实现颜色匹配的最佳效果,同时在一定程度上保持嘴唇同步的准确性。 查看教程及下载工作流:

封面图片

网站Video To Blog

网站Video To Blog 网站功能:Youtube转播客 网站简介:一款将Youtube视频转为文字播客的工具。 粘贴要转换的视频链接,稍等片刻即可转换为播客形式的文章。 默认会转为英文,可以在设置中选择需要的语言后再转换。 网站网址:点击打开 频道 群聊 投稿

封面图片

:推荐一下这款浏览器插件,YouTube Dubbing ,一键将英语视频转换为中文的声音进行播放,非常适合用来看国外教程类的,

: 推荐一下这款浏览器插件,YouTube Dubbing ,一键将英语视频转换为中文的声音进行播放,非常适合用来看国外教程类的视频,目前支持Youtube 和Udemy 。PC,Android ,IOS 都支持。官网: | : | 新版本上线,支持最新Azure语音(配音更自然),支持GPT-4和Claude-3(翻译更精准),打破语言障碍,用母语看任何视频,装起来 | |

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人