Skip to content

jerryshell/batch-groq-stt

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Batch Groq STT

批量将 data/ 目录下的音频文件转录为文字,支持生成 JSON、SRT 字幕和 TXT 纯文本。

支持的音频格式

格式 扩展名
FLAC .flac
MP3 .mp3
MP4 .mp4
MPEG .mpeg, .mpga
M4A .m4a
OGG .ogg
WAV .wav
WebM .webm

文件大小限制

  • 免费版:最大 25MB
  • 开发版:最大 100MB(超过 25MB 会显示警告)

环境要求

安装

bun install

配置

创建 .env 文件:

GROQ_API_KEY="your_api_key_here"

下载音频

可以使用 yt-dlp 从 YouTube 下载音频:

yt-dlp -t mp3 "https://www.youtube.com/watch?v=UF8uR6Z6KLc"

准备音频

将待转录的音频文件放入 data/ 目录。

运行

bun run index.ts

输出

每个音频文件会生成三个文件(以 audio.mp3 为例):

文件 说明
audio.json 完整转录结果(含时间戳段落)
audio.srt SRT 字幕格式
audio.txt 纯文本转录内容

已存在的 JSON 文件会被跳过,不会重复转录。

脚本

bun run lint      # 代码检查
bun run lint:fix  # 自动修复
bun run fmt       # 代码格式化
bun run fmt:check # 检查格式

Releases

No releases published

Packages

 
 
 

Contributors