一晚上跟3个智障AI斗智斗勇搞出来

一晚上跟3个智障AI 斗智斗勇搞出来 利用工具把视频按秒拆分成图片 并且图片是以视频里对应的时间命名的 使用AI把这个时间格式 转换成字幕文件的时间轴格式 一种新的硬字幕提取方式就诞生了 对于竖排硬字幕提取没有更好的方法了 提取出图片之后去喂漫画软件 用漫画软件的OCR得到文字 再合并到对应的时间轴上 就生成真正的日文字幕文件啦

相关推荐

封面图片

敲完等饭闲着无聊写下昨天这部的制作过程

敲完等饭 闲着无聊写下昨天这部的制作过程 因为妹妹的对话是滚动出现的字幕 传统的硬字幕提取 总是提取不全要么丢字 要么就一半 索性就放弃了用传统的硬字幕提取 改用之前自己研究出来的 https://t.me/galgameonHCG/4001 这个方法手动一点点的解决提取不全的问题 接着使用 这个工具 https://t.me/galgamenoHCG/68930 把图片都切了 然后使用 ImageTrans 对图片批量OCR 使用之前让AI写的拆分合并字幕的脚本 把提取出来的时间轴和独立的文本合并成 一个真的SRT 再手动重新校对画面轴文字的开始帧和结束帧 最后再进行AI翻译和润色 虽然方法很笨 很费时间 很费眼睛 很费人工 但是结果 还是挺满意的 至少比完全不能提取要强很多 匠人精神 纯手工打造

封面图片

ℹMyLens 透过 AI 一键生成各大品牌、产品的历史时间轴图片#

ℹMyLens 透过 AI 一键生成各大品牌、产品的历史时间轴图片# 有时候我们在做报告、介绍产品、写文章时,可能会需要说明某某品牌或产品的历史,为了更清楚让阅读者知道,有时候还绘制作时间轴图片,但这非常花时...

封面图片

《Video 2 Photo_5.8-视频导出图片.ipa》

《Video 2 Photo_5.8-视频导出图片.ipa》 简介:一款便捷的iOS工具,支持从视频中快速提取高清帧画面并保存为图片,适用于影视剪辑、动态捕捉或创作素材收集。提供多格式导出与自定义时间轴截取,满足多场景需求。 亮点:智能解析视频关键帧,可批量导出无损画质图片;兼容主流视频格式,支持手动微调截取节点,内置基础图片编辑功能。 标签: #视频处理#帧截图工具#高效剪辑#素材提取#iOS应用 更新日期:2025-04-24 04:04:07 链接:

封面图片

借助AI来自动生成和翻译字幕

借助AI来自动生成和翻译字幕 先把视频放到Google Drive,然后从Google Colab上运行代码,并且在Colab加载整个Whisper模型,这样并不受API请求限制的影响,可以快速完成转录。语音转字幕后,再借助ChatGPT的API对字幕逐行翻译,最后再人工校对就好了。 是基于 Google Colab 的应用。开发初衷旨在提高乃木坂46(以及坂道系)字幕组的工作效率。但本应用也适于所有日语视频的字幕制作。此应用基于AI语音识别模型 Whisper,应用输出文件为ass或srt格式,内置指定字幕组的字幕格式,可直接导入 Aegisub 进行后续翻译及时间轴校正 使用方法: 在Google Colab中打开应用. 上传要识别的文件并运行应用 识别完成后ass文件会自动下载到本地.

封面图片

我发现不管是做视频字幕

我发现不管是做视频字幕 还是做漫画字幕 在AI跑完之后 我都会手动检查下 字幕的时间轴 还有漫画的气泡 软件是否识别的正确 准确 妈的 软件是智障 人也不完美 开发出来的软件也不可能完美 不可能可丁可卯的100%准确 这个人工手动检查的过程 就必不可少

封面图片

昨天研究出来一个新方法

昨天研究出来一个新方法 用沉浸翻译 https://github.com/immersive-translate 这个扩展 可以支持第三方openApi 速度跑起来是嗖嗖的 优点是快 弊端有2个一个是不能直接导出译文必须跟着原文 另外一个是不会联系上下文就是一句一句的 优点就是快 而且 直接跑txt 无法知道哪行没翻译 而且就是没翻译 也无法手动修正 而Srt 一行一行对应的 字体大而且可以手写在上边修正 我的方法是先把TXT转成虚拟的SRT格式 我用到是指环王3小时的字幕的时间轴 一共有2030句台词 足够一般漫画文本伪装成SRT了 然后用沉浸翻译扩展跑这个SRT 跑完之后得到一个 双语字幕的SRT 这个时候把srt 丢到Arctime 上 字幕轴是重叠的 不用管 直接导出 sRT 就会得到一个只有翻译的SRT文件 然后再把SRT转成TXT 就得到了一个翻译完的TXT 然后导入翻译虽然很折腾但是 翻译的速度快 就是折腾这一溜十三道 也很快

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人