Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做
Andrej Karpathy 提出了一个工作流希望自动将长视频内容转换为带对应示例的播客文章。现在虽然也有一些类似工具但是都做的不好。 同时他还把前几天自己的视频教程转成了文字内容,觉得视频太浪费时间的可以看文本。 AK 设想的完整工作流: 一个有趣的大语言模型 (Large Language Model) 挑战是:将我的2小时13分钟的分词器视频转换成一本书的章节(或者博客文章)形式,专门讨论分词。具体步骤如下: 为视频添加字幕或解说文字。 将视频切割成若干带有配套图片和文字的段落。 利用大语言模型的提示工程技术,逐段进行翻译。 将结果输出为网页形式,其中包含指向原始视频各部分的链接。 从更广泛的角度来看,这样的工作流程可以应用于任何视频输入,自动生成各种教程的“配套指南”,使其格式更加便于阅读、浏览和搜索。这听起来是可行的,但也颇具挑战。 LLM Tokenization课程文字版本:
在Telegram中查看相关推荐

🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人