Commits · Xenobd/whisper.cpp

metal : improve FA + improve MoE (llama/12612)

04a3389

ggerganov commited on Mar 28, 2025

llamafile : ppc64le GEMV forwarding for FP32. (llama/12594)

1843f18

amritahs-ibm commited on Mar 28, 2025

ggml : sync/merge cmake,riscv,powerpc, add common.cmake (ggml/0)

f695cbf

ggerganov commited on Mar 27, 2025

llamafile : ppc64le MMA implementation for Q4_0. (llama/12489)

d154905

amritahs-ibm commited on Mar 27, 2025

ggml : fix MUL_MAT_ID repack with Q8_K (llama/12544)

a13f78c

ggerganov commited on Mar 26, 2025

ggml-cpu : update KleidiAI to v1.5.0 (llama/12568)

9b4460a

Dan Johansson commited on Mar 25, 2025

ggml : fix quantized cpy op (llama/12310)

608b377

ggerganov commited on Mar 22, 2025

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (llama/12332)

0729506

Srihari-mcw commited on Mar 20, 2025

ggml : add SVE support for q6_K_q8_K (llama/12361)

607a196

fj-y-saito commited on Mar 18, 2025

llama: Add support for RWKV v7 architecture (llama/12412)

727de7e

mollysama commited on Mar 17, 2025

cmake: Enable specifying exact PowerPC CPU architecture (ggml/1138)

aac4d16

Christian Kastner commited on Mar 10, 2025

examples : command.wasm updates (#2904)

0db3249
unverified

danbev commited on Mar 20, 2025

ggml-cpu: faster AVX2 variant for IQ1_M (llama/12216)

591cbfb

Rémy O commited on Mar 7, 2025

ggml-cpu: Faster IQ1 mul_mat_vec on AVX2 using BMI2 instructions (llama/12154)

05466a9

Rémy O commited on Mar 6, 2025

ggml : ggml_compute_forward_concat() for arbitrary tensor type (ggml/1118)

c9a49f9

vmobilis commited on Mar 7, 2025

ggml : portability fixes for VS 2017 (llama/12150)

49e3343

mgroeber9110 Marcus Groeber commited on Mar 4, 2025

ggml : fix kleidiai build (llama/12159)

dbc0180

ag2s20150909 commited on Mar 3, 2025

ggml : upgrade init_tensor API to return a ggml_status (llama/11854)

d6b6852

William Tambellini slaren commited on Feb 28, 2025

ggml: aarch64: implement SVE kernels for q2_k_q8_k vector dot (llama/12064)

459beb1

Prashant Vithule vithulep commited on Feb 28, 2025

ggml-cpu: Fix build with sve (llama/12059)

4be146e

mollysama commited on Feb 25, 2025

cuda/cpu: Increase support for fp16 unary operations (ggml/1125)

67e8c32

cmdr2 commited on Feb 28, 2025

Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121)

2b94a24

cmdr2 commited on Feb 25, 2025

ggml-cpu: Support s390x SIMD Instruction Set (llama/12019)

4aa54ec

Aaron Teo Jinyang He junchao-zhao commited on Feb 22, 2025

ggml-cpu: Add CPU backend support for KleidiAI library (llama/11390)

9de6d81

Charles Xu commited on Feb 20, 2025

ggml: aarch64: implement SVE kernels for q3_K_q8_K vector dot (llama/11917)

1a1acd2

Prashant Vithule vithulep

ggerganov commited on Feb 20, 2025

repo : update links to new url (llama/11886)

9705bb5

ggerganov commited on Feb 15, 2025

ggml: optimize some vec dot functions for LoongArch ASX (llama/11842)

e3acbfc

Jinyang He commited on Feb 14, 2025

llamafile: use member variable instead of constant for iq4nlt (llama/11780)

0cb2d04

jmorganca commited on Feb 13, 2025

ggml-cpu : add chunking support to mul_mat_id (llama/11666)

e59d9a7

Diego Devesa commited on Feb 13, 2025

ggml : x2 speed for WASM by optimizing SIMD (llama/11453)

464a186

Xuan-Son Nguyen camel-cdr commited on Feb 12, 2025

ggml : fix multi-threaded clamp_f32 (llama/11824)

1b1d6a8

Richard commited on Feb 12, 2025

ggml-cpu: Fix duplicate MATMUL_INT8 (llama/11817)

05b9e78

ownia commited on Feb 12, 2025

Fix #11802: Compile bug - RegQueryValueExA changed to RegQueryValueEx (llama/11803)

86969ac

Sheldon Robinson commited on Feb 11, 2025

ggml: Fix data race in ggml threadpool (llama/11736)

5554d5f

Karol Kontny commited on Feb 8, 2025

ggml : optimize and build warning fix for LoongArch (llama/11709)

b82d241

Jinyang He commited on Feb 7, 2025

ggml : fix LoongArch compile error with 128-bit SIMD (llama/11701)

f7296aa

junchao-zhao commited on Feb 6, 2025

cmake : fix compile assumptions for power9/etc (#2777)

4683df3
unverified

midnight midnight commited on Feb 5, 2025

CPU/CUDA: fix (GQA) mul mat back, add CUDA support (llama/11380)

855a9fe

JohannesGaessler commited on Jan 24, 2025

vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (llama/11166)

3bb9e77

jeffbolznv commited on Jan 16, 2025

CUDA: backwards pass for misc. ops, add tests (llama/11257)

2fbcec1

JohannesGaessler commited on Jan 16, 2025

ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (llama/11227)

bf3dc93

fj-y-saito

ggerganov commited on Jan 16, 2025

RoPE: fix back, CUDA support for back + noncont. (llama/11240)

131a21e

JohannesGaessler commited on Jan 15, 2025

ggml-cpu : fix ggml_graph_compute_thread did not terminate on abort. (ggml/1065)

8e57313

issixx issi commited on Jan 17, 2025

llama: add support for QRWKV6 model architecture (llama/11001)

4a6b7e0

mollysama

ggerganov

compilade commited on Jan 10, 2025

llamafile : ppc64le MMA INT8 implementation (llama/10912)

6f18eed

amritahs-ibm commited on Jan 8, 2025

ggml-backend : only offload from host buffers (fix) (llama/11124)

9ac3c7e

Diego Devesa commited on Jan 7, 2025

ggml : fixes for AVXVNNI instruction set with MSVC and Clang (llama/11027)

d13ac16

Srihari-mcw slaren commited on Dec 31, 2024

ggml : more perfo with llamafile tinyblas on x86_64 (llama/10714)

b284406

Djip007 commited on Dec 24, 2024

ggml : use wstring for backend search paths (llama/10960)

656e8b1

Diego Devesa commited on Dec 24, 2024

ggml : fix arm enabled features check (llama/10961)

06cddad

Diego Devesa commited on Dec 24, 2024

Commit History

metal : improve FA + improve MoE (llama/12612) 04a3389

llamafile : ppc64le GEMV forwarding for FP32. (llama/12594) 1843f18

ggml : sync/merge cmake,riscv,powerpc, add common.cmake (ggml/0) f695cbf

llamafile : ppc64le MMA implementation for Q4_0. (llama/12489) d154905

ggml : fix MUL_MAT_ID repack with Q8_K (llama/12544) a13f78c

ggml-cpu : update KleidiAI to v1.5.0 (llama/12568) 9b4460a

ggml : fix quantized cpy op (llama/12310) 608b377

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (llama/12332) 0729506

ggml : add SVE support for q6_K_q8_K (llama/12361) 607a196

llama: Add support for RWKV v7 architecture (llama/12412) 727de7e

cmake: Enable specifying exact PowerPC CPU architecture (ggml/1138) aac4d16

examples : command.wasm updates (#2904) 0db3249 unverified

ggml-cpu: faster AVX2 variant for IQ1_M (llama/12216) 591cbfb

ggml-cpu: Faster IQ1 mul_mat_vec on AVX2 using BMI2 instructions (llama/12154) 05466a9

ggml : ggml_compute_forward_concat() for arbitrary tensor type (ggml/1118) c9a49f9

ggml : portability fixes for VS 2017 (llama/12150) 49e3343

ggml : fix kleidiai build (llama/12159) dbc0180

ggml : upgrade init_tensor API to return a ggml_status (llama/11854) d6b6852

ggml: aarch64: implement SVE kernels for q2_k_q8_k vector dot (llama/12064) 459beb1

ggml-cpu: Fix build with sve (llama/12059) 4be146e

cuda/cpu: Increase support for fp16 unary operations (ggml/1125) 67e8c32

Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121) 2b94a24

ggml-cpu: Support s390x SIMD Instruction Set (llama/12019) 4aa54ec

ggml-cpu: Add CPU backend support for KleidiAI library (llama/11390) 9de6d81

ggml: aarch64: implement SVE kernels for q3_K_q8_K vector dot (llama/11917) 1a1acd2

repo : update links to new url (llama/11886) 9705bb5

ggml: optimize some vec dot functions for LoongArch ASX (llama/11842) e3acbfc

llamafile: use member variable instead of constant for iq4nlt (llama/11780) 0cb2d04

ggml-cpu : add chunking support to mul_mat_id (llama/11666) e59d9a7

ggml : x2 speed for WASM by optimizing SIMD (llama/11453) 464a186

ggml : fix multi-threaded clamp_f32 (llama/11824) 1b1d6a8

ggml-cpu: Fix duplicate MATMUL_INT8 (llama/11817) 05b9e78

Fix #11802: Compile bug - RegQueryValueExA changed to RegQueryValueEx (llama/11803) 86969ac

ggml: Fix data race in ggml threadpool (llama/11736) 5554d5f

ggml : optimize and build warning fix for LoongArch (llama/11709) b82d241

ggml : fix LoongArch compile error with 128-bit SIMD (llama/11701) f7296aa

cmake : fix compile assumptions for power9/etc (#2777) 4683df3 unverified

CPU/CUDA: fix (GQA) mul mat back, add CUDA support (llama/11380) 855a9fe

vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (llama/11166) 3bb9e77

CUDA: backwards pass for misc. ops, add tests (llama/11257) 2fbcec1

ggml: aarch64: implement SVE kernels for q4_K_q8_K vector dot (llama/11227) bf3dc93

RoPE: fix back, CUDA support for back + noncont. (llama/11240) 131a21e

ggml-cpu : fix ggml_graph_compute_thread did not terminate on abort. (ggml/1065) 8e57313

llama: add support for QRWKV6 model architecture (llama/11001) 4a6b7e0

llamafile : ppc64le MMA INT8 implementation (llama/10912) 6f18eed

ggml-backend : only offload from host buffers (fix) (llama/11124) 9ac3c7e

ggml : fixes for AVXVNNI instruction set with MSVC and Clang (llama/11027) d13ac16

ggml : more perfo with llamafile tinyblas on x86_64 (llama/10714) b284406

ggml : use wstring for backend search paths (llama/10960) 656e8b1

ggml : fix arm enabled features check (llama/10961) 06cddad