一晚上跟3个智障AI斗智斗勇搞出来

一晚上跟3个智障AI 斗智斗勇搞出来 利用工具把视频按秒拆分成图片 并且图片是以视频里对应的时间命名的 使用AI把这个时间格式 转换成字幕文件的时间轴格式 一种新的硬字幕提取方式就诞生了 对于竖排硬字幕提取没有更好的方法了 提取出图片之后去喂漫画软件 用漫画软件的OCR得到文字 再合并到对应的时间轴上 就生成真正的日文字幕文件啦

相关推荐

封面图片

敲完等饭闲着无聊写下昨天这部的制作过程

敲完等饭 闲着无聊写下昨天这部的制作过程 因为妹妹的对话是滚动出现的字幕 传统的硬字幕提取 总是提取不全要么丢字 要么就一半 索性就放弃了用传统的硬字幕提取 改用之前自己研究出来的 https://t.me/galgameonHCG/4001 这个方法手动一点点的解决提取不全的问题 接着使用 这个工具 https://t.me/galgamenoHCG/68930 把图片都切了 然后使用 ImageTrans 对图片批量OCR 使用之前让AI写的拆分合并字幕的脚本 把提取出来的时间轴和独立的文本合并成 一个真的SRT 再手动重新校对画面轴文字的开始帧和结束帧 最后再进行AI翻译和润色 虽然方法很笨 很费时间 很费眼睛 很费人工 但是结果 还是挺满意的 至少比完全不能提取要强很多 匠人精神 纯手工打造

封面图片

ℹMyLens 透过 AI 一键生成各大品牌、产品的历史时间轴图片#

ℹMyLens 透过 AI 一键生成各大品牌、产品的历史时间轴图片# 有时候我们在做报告、介绍产品、写文章时,可能会需要说明某某品牌或产品的历史,为了更清楚让阅读者知道,有时候还绘制作时间轴图片,但这非常花时...

封面图片

借助AI来自动生成和翻译字幕

借助AI来自动生成和翻译字幕 先把视频放到Google Drive,然后从Google Colab上运行代码,并且在Colab加载整个Whisper模型,这样并不受API请求限制的影响,可以快速完成转录。语音转字幕后,再借助ChatGPT的API对字幕逐行翻译,最后再人工校对就好了。 是基于 Google Colab 的应用。开发初衷旨在提高乃木坂46(以及坂道系)字幕组的工作效率。但本应用也适于所有日语视频的字幕制作。此应用基于AI语音识别模型 Whisper,应用输出文件为ass或srt格式,内置指定字幕组的字幕格式,可直接导入 Aegisub 进行后续翻译及时间轴校正 使用方法: 在Google Colab中打开应用. 上传要识别的文件并运行应用 识别完成后ass文件会自动下载到本地.

封面图片

我发现不管是做视频字幕

我发现不管是做视频字幕 还是做漫画字幕 在AI跑完之后 我都会手动检查下 字幕的时间轴 还有漫画的气泡 软件是否识别的正确 准确 妈的 软件是智障 人也不完美 开发出来的软件也不可能完美 不可能可丁可卯的100%准确 这个人工手动检查的过程 就必不可少

封面图片

昨天研究出来一个新方法

昨天研究出来一个新方法 用沉浸翻译 https://github.com/immersive-translate 这个扩展 可以支持第三方openApi 速度跑起来是嗖嗖的 优点是快 弊端有2个一个是不能直接导出译文必须跟着原文 另外一个是不会联系上下文就是一句一句的 优点就是快 而且 直接跑txt 无法知道哪行没翻译 而且就是没翻译 也无法手动修正 而Srt 一行一行对应的 字体大而且可以手写在上边修正 我的方法是先把TXT转成虚拟的SRT格式 我用到是指环王3小时的字幕的时间轴 一共有2030句台词 足够一般漫画文本伪装成SRT了 然后用沉浸翻译扩展跑这个SRT 跑完之后得到一个 双语字幕的SRT 这个时候把srt 丢到Arctime 上 字幕轴是重叠的 不用管 直接导出 sRT 就会得到一个只有翻译的SRT文件 然后再把SRT转成TXT 就得到了一个翻译完的TXT 然后导入翻译虽然很折腾但是 翻译的速度快 就是折腾这一溜十三道 也很快

封面图片

霸屏朋友圈的黏土滤镜到底是怎么搞出来的?

霸屏朋友圈的黏土滤镜到底是怎么搞出来的? 这是马斯克开车的样子,别说,脸型、五官还有发型还都挺传神的。还有这张合照,不用提示,咱们差友应该都能猜出来吧,就是皮衣黄和扎克伯格互换外套的合照。再丢一张火锅的照片过去,整得也挺像样,就是头身的分界线,有点过于明显了。说实话,玩着玩着还真有点上头……而除了黏土, Remini 里面其实还有各种千奇百怪的滤镜,像是玉石、噩梦、像素风等等。比如玉石风的马斯克还挺眉清目秀。像素风度的西瓜( 办公室的另外一条狗 )也挺像样的。不过, Remini 并不是完全零门槛,只能免费试用一周,一天只有五次机会,再想多试试的时候,就提示要充会员了,一周68 块钱,属于是白嫖党们看了价格是两眼一抹黑的程度了。这也让咸鱼上的二道贩子们发现了商机,整出了代做业务,一块钱一张……这火爆程度,只能说,希望他们把握住这波赚钱的机会吧。毕竟在一周一小变,一月一大变的 AI 圈,可倒了不少曾昙花一现的 AI 初创公司,毕竟持续流量和成功的盈利模式,才是最稀缺的。不过,这些话刚码出来,就立马后悔了……因为我资料一查,发现你丫的 Remini 根本不是啥AI 圈儿的新人,相反这些年,他们一直就没缺过流量和票子……早在 2019 年年底, Remini 就以 “ 修复旧照片 ” 的名头爆火过一次,当时的它算是刚出道就成名。爆火程度这么说吧, “ 你前方还有 40000 人在排队 ” 、 “ 还需要等待70 年 ” 这样的乌龙弹窗,都是 Remini 给整出来的……次年年初,在被电视台给报道之后,它的流量更是勇攀高峰,用户达到了千万量级。要不是及时找到了亚马逊合作,就凭 Remini 自己的服务器,这波天降的流量他们都差点没接住。差评的老粉可能会有点印象,四年前小辣椒还跟大伙推荐过这个工具,效果看起来挺像那么回事。就连被盘出包浆的表情包,在它手下都能给整成高清的。当然,这都算不上 Remini 的巅峰时刻。它抓热点、造热点的能力也是一绝,像是换发型 AI ,老钱风穿搭等等, Remini 都能在第一时间蹭上。甚至去年年中的时候,它还凭一己之力造了个新热点预测宝宝长相。只要上传几张双方的照片,然后选择性别就能生成,在 TikTok 上从素人火到了大 V 。光凭这个功能,让 Remini 在 7 月份一路狂飙,头两周的全球下载量就有 4000 万次,当月还登上了美国应用软件的榜首,这时它的日活量已经超过了两千万。并且这两千万的日活量里,舍得给 Remini 氪金的也不少。据 Insider 消息,靠会员费它一个月就赚到了700 万美元,还是刨掉了苹果应用商店30% 分成后的数字。虽说这两年, AI 应用圈子里的大风大浪是没少见,但大多都是赚不了钱,快不行了的消息,像 Remini 这种活了这么久还能保持热度的,真没几个。而且说实话, Remini 里面的各种 AI 功能在技术上门槛不算高。像是这次黏土滤镜出圈后,美图第一时间就跟进,也已经有人在 C 站( AI 绘画模型分享平台 )炼出了两个类似的模型, Claymation-miniature 和 Clay cartoon style 。还有预测宝宝长相的功能,在开源模型 StyleGAN 上有针对性地训练训练,就能达到同样的效果,现在有这个功能的 AI 插件、小程序更是一抓一大把。所以 Remini 能坚持五年不掉队,还是打心底里佩服它的。不过更让人好奇的是,这隔段时间就能出圈一次,它背后难不成有什么 “ 高人 ” 指点……查了一下,似乎还真有,而且前前后后还有两位,一个给它开路,一个给它加装备。给 Remini 开路的就是创建它的 “ 亲爸爸 ” 大觥科技,这还是咱国内的一家企业。它不仅敢做第一批吃螃蟹的人,而且吃螃蟹的姿势还贼上道儿。在 2019 就推出了 Remini ( 海外版 )和 “ 你我当年 ” ( 国内版 ),还在社交媒体上打起了“ AI 修复明星照片 ” 的广告,噱头直接拉满。反正一套组合拳下来,初期 Remini 就已经攒到了千万级用户。然而在给 Remini 开完路后,作为 “ 亲爸爸 ” 的大觥科技却没能陪它一直走下去,在 2021 年,因为数据隐私的问题, Remini 被卖给了一个意大利企业 Bending Spoons 。不过好在这个 “ 干爹 ” 肚子里的货足够多,它算是一家App 工厂,专门买市场上成熟的 App ,赚得就是运营产品的钱,像咱们比较熟的印象笔记,就是被他收购的。而在搞营销这块儿, Bending Spoons 的手段也比大觥科技还要高明点,在之前, Remini 打的广告都是说它 AI 修复图片的功能有多强。“ 干爹 ” 上来第二年,就打算走社媒病毒式传播那一套,给自己定位成一个“ 发帖助手 ” 。效果怎么样,看这次黏土滤镜的反应大家就知道了。但话说回来,在来看, Remini 能这么出圈,归根结底就一个秘诀,它能抓住大伙的心理需求,只要做到这点,就足以打败一大半 AI 应用了。反正还挺期待 Remini 后续会整出啥花活来的…… ... PC版: 手机版:

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人