Commits · Xenobd/whisper.cpp

metal : improve FA + improve MoE (llama/12612)

04a3389

ggerganov commited on Mar 28

ggml : fix quantized cpy op (llama/12310)

608b377

ggerganov commited on Mar 22

llama: Add support for RWKV v7 architecture (llama/12412)

727de7e

mollysama commited on Mar 17

examples : command.wasm updates (#2904)

0db3249
unverified

danbev commited on Mar 20

ggml-cpu: Faster IQ1 mul_mat_vec on AVX2 using BMI2 instructions (llama/12154)

05466a9

Rémy O commited on Mar 6

ggml : ggml_compute_forward_concat() for arbitrary tensor type (ggml/1118)

c9a49f9

vmobilis commited on Mar 7

ggml : portability fixes for VS 2017 (llama/12150)

49e3343

mgroeber9110 Marcus Groeber commited on Mar 4

cuda/cpu: Increase support for fp16 unary operations (ggml/1125)

67e8c32

cmdr2 commited on Feb 28

Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121)

2b94a24

cmdr2 commited on Feb 25

ggml-cpu: Support s390x SIMD Instruction Set (llama/12019)

4aa54ec

Aaron Teo Jinyang He junchao-zhao commited on Feb 22

ggml-cpu: Add CPU backend support for KleidiAI library (llama/11390)

9de6d81

Charles Xu commited on Feb 20

repo : update links to new url (llama/11886)

9705bb5

ggerganov commited on Feb 15

ggml-cpu : add chunking support to mul_mat_id (llama/11666)

e59d9a7

Diego Devesa commited on Feb 13

ggml : fix multi-threaded clamp_f32 (llama/11824)

1b1d6a8

Richard commited on Feb 12

ggml: Fix data race in ggml threadpool (llama/11736)

5554d5f

Karol Kontny commited on Feb 8

ggml : optimize and build warning fix for LoongArch (llama/11709)

b82d241

Jinyang He commited on Feb 7

CPU/CUDA: fix (GQA) mul mat back, add CUDA support (llama/11380)

855a9fe

JohannesGaessler commited on Jan 24

vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (llama/11166)

3bb9e77

jeffbolznv commited on Jan 16

CUDA: backwards pass for misc. ops, add tests (llama/11257)

2fbcec1

JohannesGaessler commited on Jan 16

RoPE: fix back, CUDA support for back + noncont. (llama/11240)

131a21e

JohannesGaessler commited on Jan 15

ggml-cpu : fix ggml_graph_compute_thread did not terminate on abort. (ggml/1065)

8e57313

issixx issi commited on Jan 17

llama: add support for QRWKV6 model architecture (llama/11001)

4a6b7e0

mollysama

ggerganov

compilade commited on Jan 10

ggml : more perfo with llamafile tinyblas on x86_64 (llama/10714)

b284406

Djip007 commited on Dec 24, 2024

ggml : fix const usage in SSE path (llama/10962)

38e6172

Diego Devesa commited on Dec 23, 2024

llama : add Qwen2VL support + multimodal RoPE (llama/10361)

219d12b

RzZ

ggerganov commited on Dec 14, 2024

ggml : Fix compilation issues on ARM platform when building without fp16 (llama/10811)

f76ba41

Karol Kontny commited on Dec 13, 2024

remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (llama/10797)

b38cecf

Diego Devesa commited on Dec 12, 2024

ggml : refactor online repacking (llama/10446)

163128e

Djip007

ggerganov commited on Dec 7, 2024

ggml : add predefined list of CPU backend variants to build (llama/10626)

1794b43

Diego Devesa commited on Dec 4, 2024

ggml-cpu : fix HWCAP2_I8MM value (llama/10646)

b3e6ea8

Diego Devesa commited on Dec 4, 2024

ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)

dd775d5

PABannier commited on Dec 4, 2024

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)

154bbc0

PABannier commited on Dec 3, 2024

ggml : move AMX to the CPU backend (llama/10570)

3732429

Diego Devesa commited on Dec 3, 2024

ggml : fix I8MM Q4_1 scaling factor conversion (llama/10562)

664be9a

ggerganov commited on Nov 29, 2024

ggml : fix row condition for i8mm kernels (llama/10561)

01c713f

ggerganov commited on Nov 28, 2024

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541)

bf73242

shupeif commited on Nov 28, 2024

ggml : add support for dynamic loading of backends (llama/10469)

b73266f

Diego Devesa

ggerganov commited on Nov 25, 2024

ggml : do not use ARM features not included in the build (llama/10457)

0001327

Diego Devesa commited on Nov 23, 2024

ggml : fix undefined reference to 'getcpu' (llama/10354)

2f9b147

FirstTimeEZ commited on Nov 17, 2024

ggml: new optimization interface (ggml/988)

dd33ace

JohannesGaessler commited on Nov 16, 2024

AVX BF16 and single scale quant optimizations (llama/10212)

e6ffed3

Eve commited on Nov 15, 2024

backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (llama/9921)

3541ee8

Charles Xu Diego Devesa commited on Nov 15, 2024

ggml : build backends as libraries (llama/10256)

3dc93f3

Diego Devesa

ggerganov R0CKSTAR commited on Nov 14, 2024

Commit History

metal : improve FA + improve MoE (llama/12612) 04a3389

ggml : fix quantized cpy op (llama/12310) 608b377

llama: Add support for RWKV v7 architecture (llama/12412) 727de7e

examples : command.wasm updates (#2904) 0db3249 unverified

ggml-cpu: Faster IQ1 mul_mat_vec on AVX2 using BMI2 instructions (llama/12154) 05466a9

ggml : ggml_compute_forward_concat() for arbitrary tensor type (ggml/1118) c9a49f9

ggml : portability fixes for VS 2017 (llama/12150) 49e3343

cuda/cpu: Increase support for fp16 unary operations (ggml/1125) 67e8c32

Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121) 2b94a24

ggml-cpu: Support s390x SIMD Instruction Set (llama/12019) 4aa54ec

ggml-cpu: Add CPU backend support for KleidiAI library (llama/11390) 9de6d81

repo : update links to new url (llama/11886) 9705bb5

ggml-cpu : add chunking support to mul_mat_id (llama/11666) e59d9a7

ggml : fix multi-threaded clamp_f32 (llama/11824) 1b1d6a8

ggml: Fix data race in ggml threadpool (llama/11736) 5554d5f

ggml : optimize and build warning fix for LoongArch (llama/11709) b82d241

CPU/CUDA: fix (GQA) mul mat back, add CUDA support (llama/11380) 855a9fe

vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (llama/11166) 3bb9e77

CUDA: backwards pass for misc. ops, add tests (llama/11257) 2fbcec1

RoPE: fix back, CUDA support for back + noncont. (llama/11240) 131a21e

ggml-cpu : fix ggml_graph_compute_thread did not terminate on abort. (ggml/1065) 8e57313

llama: add support for QRWKV6 model architecture (llama/11001) 4a6b7e0

ggml : more perfo with llamafile tinyblas on x86_64 (llama/10714) b284406

ggml : fix const usage in SSE path (llama/10962) 38e6172

llama : add Qwen2VL support + multimodal RoPE (llama/10361) 219d12b

ggml : Fix compilation issues on ARM platform when building without fp16 (llama/10811) f76ba41

remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (llama/10797) b38cecf

ggml : refactor online repacking (llama/10446) 163128e

ggml : add predefined list of CPU backend variants to build (llama/10626) 1794b43

ggml-cpu : fix HWCAP2_I8MM value (llama/10646) b3e6ea8

ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037) dd775d5

ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034) 154bbc0

ggml : move AMX to the CPU backend (llama/10570) 3732429

ggml : fix I8MM Q4_1 scaling factor conversion (llama/10562) 664be9a

ggml : fix row condition for i8mm kernels (llama/10561) 01c713f

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541) bf73242

ggml : add support for dynamic loading of backends (llama/10469) b73266f

ggml : do not use ARM features not included in the build (llama/10457) 0001327

ggml : fix undefined reference to 'getcpu' (llama/10354) 2f9b147

ggml: new optimization interface (ggml/988) dd33ace

AVX BF16 and single scale quant optimizations (llama/10212) e6ffed3

backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (llama/9921) 3541ee8

ggml : build backends as libraries (llama/10256) 3dc93f3