codec.cpp

Neural audio codec inference in C/C++

The main goal of codec.cpp is to enable neural audio codec inference with minimal setup and state-of-the-art performance on a wide range of hardware — locally and in the cloud. Supports Mimi, DAC, WavTokenizer with quantization and multi-backend GPU acceleration.

Quick Start

1. Convert Models to GGUF

cd scripts

# From HuggingFace
python convert-to-gguf.py --model-id kyutai/mimi --output mimi.gguf

# From local checkpoint
python convert-to-gguf.py --input-dir ./mimi-checkpoint --output mimi.gguf

# With quantization (Q4_K_M, Q5_K_M, Q8_0)
python convert-to-gguf.py --model-id kyutai/mimi --output mimi-q4.gguf --quantization Q4_K_M

2. Decode Audio

./build/codec-cli decode --model mimi.gguf --codes input.npy --out output.wav

# With GPU acceleration (if built with CUDA/Vulkan/Metal)
./build/codec-cli decode --model mimi.gguf --codes input.npy --out output.wav --use-gpu

Build with GPU Acceleration

CUDA (NVIDIA)

cmake -B build -DGGML_CUDA=ON
cmake --build build -j
./build/codec-cli --model model.gguf --codes in.npy --out out.wav --use-gpu

Vulkan (Cross-platform)

cmake -B build -DGGML_VULKAN=ON
cmake --build build -j

Metal (macOS)

cmake -B build -DGGML_METAL=ON
cmake --build build -j

SYCL (Intel GPUs)

cmake -B build -DGGML_SYCL=ON
cmake --build build -j

OpenCL

cmake -B build -DGGML_OPENCL=ON
cmake --build build -j

CANN (Ascend)

cmake -B build -DGGML_CANN=ON
cmake --build build -j

HIP/ROCm (AMD GPUs)

cmake -B build -DGGML_HIP=ON
cmake --build build -j

MUSA

cmake -B build -DGGML_MUSA=ON
cmake --build build -j

WebGPU

cmake -B build -DGGML_WEBGPU=ON
cmake --build build -j

zDNN

cmake -B build -DGGML_ZDNN=ON
cmake --build build -j

VirtGPU

cmake -B build -DGGML_VIRTGPU=ON
cmake --build build -j

Multiple backends (fallback chain)

cmake -B build -DGGML_CUDA=ON -DGGML_VULKAN=ON
cmake --build build -j
# Runtime auto-selects: CUDA > Vulkan > CPU

CPU-only (default)

cmake -B build
cmake --build build -j
./build/codec-cli --model model.gguf --codes in.npy --out out.wav

License

MIT

Built and maintained by BRICKS.

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
.agents/skills		.agents/skills
.claude		.claude
.github/workflows		.github/workflows
examples		examples
ggml @ 68fee72		ggml @ 68fee72
include		include
input_audio		input_audio
scripts		scripts
src		src
tests/e2e		tests/e2e
.gitignore		.gitignore
.gitmodules		.gitmodules
AGENT.md		AGENT.md
CLAUDE.md		CLAUDE.md
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
README.md		README.md
requirements-e2e.txt		requirements-e2e.txt
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

codec.cpp

Quick Start

1. Convert Models to GGUF

2. Decode Audio

Build with GPU Acceleration

CUDA (NVIDIA)

Vulkan (Cross-platform)

Metal (macOS)

SYCL (Intel GPUs)

OpenCL

CANN (Ascend)

HIP/ROCm (AMD GPUs)

MUSA

WebGPU

zDNN

VirtGPU

Multiple backends (fallback chain)

CPU-only (default)

License

About

Uh oh!

Releases

Packages

Languages

License

mybigday/codec.cpp

Folders and files

Latest commit

History

Repository files navigation

codec.cpp

Quick Start

1. Convert Models to GGUF

2. Decode Audio

Build with GPU Acceleration

CUDA (NVIDIA)

Vulkan (Cross-platform)

Metal (macOS)

SYCL (Intel GPUs)

OpenCL

CANN (Ascend)

HIP/ROCm (AMD GPUs)

MUSA

WebGPU

zDNN

VirtGPU

Multiple backends (fallback chain)

CPU-only (default)

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages