TurboQuant

A Zig implementation of Google's TurboQuant vector compression library based on the paper "TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate".

Features

3 bits/dim compression - Near 6x compression ratio for typical vectors
Fast dot product - Estimate inner products without full decode
QJL - Quantized Johnson-Lindenstrauss for unbiased inner product estimation
SIMD optimized - Uses Zig's portable @Vector for ARM64 NEON
Engine-based API - Precompute state for repeated operations

Quick Start

const turboquant = @import("turboquant");

// Create an engine for repeated operations
var engine = try turboquant.Engine.init(allocator, .{ .dim = 1024, .seed = 12345 });
defer engine.deinit(allocator);

// Encode a vector
const compressed = try engine.encode(allocator, my_vector);
defer allocator.free(compressed);

// Decode it back
const decoded = try engine.decode(allocator, compressed);
defer allocator.free(decoded);

// Fast dot product without full decode
const score = engine.dot(query_vector, compressed);

API

pub const EngineConfig = struct {
    dim: usize,
    seed: u32,
};

pub const Engine = struct {
    pub fn init(allocator: std.mem.Allocator, config: EngineConfig) !Engine
    pub fn deinit(e: *Engine, allocator: std.mem.Allocator) void
    pub fn encode(e: *Engine, allocator: std.mem.Allocator, x: []const f32) ![]u8
    pub fn decode(e: *Engine, allocator: std.mem.Allocator, compressed: []const u8) ![]f32
    pub fn dot(e: *Engine, q: []const f32, compressed: []const u8) f32
};

Performance

At dim=1024: encode 2105µs, decode 1032µs, dot 997µs

Compression

Quality

Full (polar+QJL) MSE well below paper's theoretical bound, improving with dimension.

Near-perfect recall@10 across all dimensions (N=1000 database, 50 queries).

QJL residual encoding reduces MSE by 6-16% over polar-only quantization.

Inner product distortion decreases with dimension, with QJL consistently outperforming polar-only.

Building

cd turboquant
zig build-exe -O ReleaseFast -target aarch64-macos-none src/profile.zig

# Run quality benchmarks
zig build quality -- <dim> [N] [k] [num_queries]

Binary Format

Header (22 bytes):
- version: u8
- dim: u32
- reserved: u8
- polar_bytes: u32
- qjl_bytes: u32
- max_r: f32
- gamma: f32

Payload:
- polar encoded data (variable)
- qjl encoded data (variable)

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
.github/workflows		.github/workflows
docs/assets		docs/assets
scripts		scripts
turboquant		turboquant
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TurboQuant

Features

Quick Start

API

Performance

Compression

Quality

Building

Binary Format

License

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

TurboQuant

Features

Quick Start

API

Performance

Compression

Quality

Building

Binary Format

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages