1 unstable release

0.1.0 May 4, 2023

#5 in #silk

MIT license

1MB
17K SLoC

C 13K SLoC // 0.3% comments GNU Style Assembly 4K SLoC // 0.1% comments Rust 44 SLoC

Silk V3 decoder

介绍和说明

SILK是一种语音编码格式,由Skype公司研发,最后的版本发布时间为2012年。

SILK 原始代码已上传到 Release , 包含规范文档

SILK编码格式和Tencent系语音的关系

  1. 标准silk文件以b'#!SILK_V3' 开始,以b'\xFF\xFF' 结束,中间为语音数据。
  2. 微信语音文件在标准SILK文件的开头插入了b'\x02',去除了结尾的 b'\xFF\xFF',中间不变。

语音数据

语音数据分为很多个独立 frame ,每个 frame 开头两字节存储剩余 frame 数据的大小,每个 frame 默认存储 20ms 的音频数据,

据此可通过程序计算出 语音文件 持续时间(duration) 的函数。

SILK格式规范,frame_ms 可分为20、40、60、80、100

Dependencies

~0.2–2.4MB
~48K SLoC