FFmpeg 之父 Fabrice Bellard 发布音频压缩工具 TSAC

FFmpeg之父FabriceBellard发布音频压缩工具TSAC对于44.1kHz的音频，TSAC可将其压缩至5.5kb/s（单声道）或7.5kb/s（立体声）——并确保提供可感知的“良好”质量。此外还可将一首3.5分钟的立体声乐曲压缩至192KiB。TSAC需要大量的计算能力，推荐使用英伟达GPU加速；当然也支持CPU，但速度较慢。https://www.oschina.net/news/286856

在Telegram中查看

相关推荐

FFmpeg 之父发布音频压缩工具 TSAC，3.5 分钟立体声歌曲压缩至 192 KiB

FFmpeg之父发布音频压缩工具TSAC，3.5分钟立体声歌曲压缩至192KiBFFmpeg之父法布里斯・贝拉（FabriceBellard）发布音频压缩工具TSAC。TSAC可以把音频比特率压缩达到非常低，对于44.1kHz的音频，TSAC可压缩至单声道5.5kb/s或立体声7.5kb/s，同时保持良好的听感。TSAC号称可以将3.5分钟的立体声歌曲压缩为192KiB的文件。TSCA基于为立体声扩展的Descript音频编解码器的修改版本和Transformer模型，以进一步提高压缩比，两种模型都量化为每个参数8位。因为压缩过程需要调用CUDA，所以须使用英伟达GPU。如果只使用CPU，压缩速度会非常慢，且CPU必须支持AVX2指令集。TSAC官网提供了一系列原声与压缩片段，供用户对比试听：https://bellard.org/tsac/频道：@kejiqu群组：@kejiquchat

视频/音频压缩工具压缩能力登顶绿色便携版

名称：视频/音频压缩工具压缩能力登顶绿色便携版描述：平常录制视频或下载保存的视频时长往往都很长，很多时候都想要裁剪、截取出一些“精华片段”保留下来，而不必保存一整个大型视频那么浪费硬盘空间…但如今手机或电脑上大多数的视频剪辑软件，切割视频一般都要等待很长时间导出或转换，速度非常慢，还不如直接压缩来的快，于是我花费了几天时间，测试各种视频压缩工具，最终找到了一款完全免费且不损失画质的视频压缩工具！链接：https://pan.quark.cn/s/ae1e20f42228大小：x标签：#压缩工具#视频压缩#音频压缩#quark频道：@yunpanshare群组：@yunpangroup

AudioCraft Plus：Audiocraft是一个用于音频生成深度学习研究的 PyTorch 库，包含了最先进的EnCo

：Audiocraft是一个用于音频生成深度学习研究的PyTorch库，包含了最先进的EnCodec音频压缩器，以及MusicGen，一个简单且可控的音频生成模型。AudioCraftPlus是原版AudioCraft的一体化WebUI，在其基础上添加了许多优质功能。AudioGen模型多波段扩散定制模型支持生成元数据和音频信息选项卡单声道转立体声多重提示/带结构提示的提示分段视频输出定制音乐延续

Meta AI驱动的音频编解码器比MP3压缩率高10倍

MetaAI驱动的音频编解码器比MP3压缩率高10倍Meta公司于10月25日在一篇题为"高保真神经音频压缩"的论文中首次介绍了这项技术，论文作者是Meta公司的人工智能研究员AlexandreDéfossez、JadeCopet、GabrielSynnaeve和YossiAdi。Meta公司还在其专门介绍EnCodec的博客上总结了这项研究。Meta公司将其方法描述为一个由三部分组成的系统，经过训练可将音频压缩到所需的目标大小。首先，编码器将未压缩的数据转换为较低帧率的"潜空间"表示。然后，"量化器"将该表示法压缩到目标大小，同时跟踪最重要的信息，这些信息随后将被用于重建原始信号。(这个压缩信号将通过网络发送或保存在磁盘上）。最后，解码器使用一个神经网络在单个CPU上将压缩的数据实时地转变成音频。一个方框图说明Meta的EnCodec压缩是如何工作的Meta对鉴别器的使用被证明是创造一种尽可能多地压缩音频的方法的关键，同时又不失去信号的关键元素，使其与众不同并可被识别。"有损压缩的关键是识别人类无法察觉的变化，因为在低比特率下不可能实现完美的重建。为了做到这一点，我们使用鉴别器来提高生成的样本的感知质量。这就形成了一个猫捉老鼠的游戏，鉴别器的工作就是区分真实的样本和重建的样本。压缩模型试图通过推动重建的样本与原始样本在感知上更加相似来生成样本以欺骗鉴别器"。值得注意的是，使用神经网络进行音频压缩和解压远非新鲜事，特别是用于语音压缩时，但Meta公司的研究人员声称他们是第一个将该技术应用于48kHz立体声音频（比CD的44.1kHz采样率略好）的工作小组，这是在互联网上传播的最典型的音乐文件。至于应用方面，Meta公司表示，这种由人工智能驱动的"超压缩音频"可以在恶劣的网络条件下支持"更快、更优质的通话"。当然，作为Meta公司，研究人员还提到了EnCodec的元数据影响，说该技术最终可以提供"丰富的元数据体验，而不需要大幅提高带宽"。除此之外，也许有一天我们还能从它那里得到更小的音乐音频文件。目前，Meta公司的新技术仍处于研究阶段，但它指向一个高质量音频可以使用更少带宽的未来，这对流媒体造成网络负担过重的移动宽带供应商来说是个好消息。...PC版：https://www.cnbeta.com.tw/articles/soft/1331655.htm手机版：https://m.cnbeta.com.tw/view/1331655.htm

ffmpeg 6.1 多媒体转换工具

名称：ffmpeg6.1多媒体转换工具描述：FFmpeg是一个强大的多媒体框架，可以让用户处理和操纵音频和视频文件。具有易于使用的界面，用户可以在Windows、Mac或LinuxUbuntu系统上下载FFmpeg并将其提取到文件夹中。然后，该软件可以加入PATH环境变量，便于无缝集成到工作流中。无论是要添加对话还是增强音频过滤器，FFmpeg都能支持ipfs/ipns协议。链接：https://pan.quark.cn/s/a6c8271ab5b1大小：80M标签：#ffmpeg#quark频道：@yunpanshare群组：@yunpangroup

万能播放器的根基神级开源软件FFmpeg 6.0发布

万能播放器的根基神级开源软件FFmpeg6.0发布FFmpeg是一个开放源代码的自由软件，它包括了领先的音/视频编码库libavcodec等，可以执行音频和视频多种格式的录影、转换、串流功能，“FFmpeg”单词中的“FF”指的是“FastForward”。FFmpeg内核被多媒体应用广泛使用，包括流行的视频播放器MPC、MPlayer、VLC、暴风影音、QQ影音等等，堪称万能播放器的根基。视频转码软件格式工厂也是用了FFmpeg内核。FFMPEG的视音频编解码功能确实太强大了，几乎囊括了现存所有的视音频编码标准，因此只要做视音频开发，几乎离不开它。FFmpeg6.0下载地址：点此...PC版：https://www.cnbeta.com.tw/articles/soft/1347067.htm手机版：https://m.cnbeta.com.tw/view/1347067.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人