Spaces:

Duplicated from natasa365/whisper.cpp

Xenobd
/

whisper.cpp

Running

App Files Files Community

whisper.cpp / ggml

Commit History

metal : small-batch mat-mul kernels (llama/10581)

58b0822

ggerganov commited on Dec 3, 2024

SYCL: Fix and switch to GGML_LOG system instead of fprintf (llama/10579)

f083887

qnixsynapse commited on Dec 2, 2024

ggml-cpu: replace AArch64 NEON assembly with intrinsics in ggml_gemv_q4_0_4x4_q8_0() (llama/10567)

1c781a8

Adrien Gallouët commited on Nov 30, 2024

vulkan: Dynamic subgroup size support for Q6_K mat_vec (llama/10536)

59600b5

Eve commited on Nov 30, 2024

ggml : fix I8MM Q4_1 scaling factor conversion (llama/10562)

664be9a

ggerganov commited on Nov 29, 2024

ggml-cpu: fix typo in gemv/gemm iq4_nl_4_4 (llama/10580)

c7a861a

shupeif commited on Nov 29, 2024

sycl : offload of get_rows set to 0 (llama/10432)

47b6bff

Alberto Cabrera Pérez commited on Nov 29, 2024

sycl : Reroute permuted mul_mats through oneMKL (llama/10408)

af13def

Alberto Cabrera Pérez commited on Nov 29, 2024

CANN: RoPE operator optimization (llama/10563)

3ad7b0a

Chenguang Li

noemotiovon commited on Nov 29, 2024

vulkan: get the first command buffer submitted sooner (llama/10499)

e1c1e73

jeffbolznv commited on Nov 29, 2024

ggml : remove redundant copyright notice + update authors

c78cdd7

ggerganov commited on Nov 28, 2024

ggml : fix row condition for i8mm kernels (llama/10561)

01c713f

ggerganov commited on Nov 28, 2024

cmake : fix ARM feature detection (llama/10543)

c04a34f

ggerganov commited on Nov 28, 2024

ggml-cpu: support IQ4_NL_4_4 by runtime repack (llama/10541)

bf73242

shupeif commited on Nov 28, 2024

kompute : improve backend to pass test_backend_ops (llama/10542)

c8008b8

slpnix commited on Nov 28, 2024

CANN: Fix SOC_TYPE compile bug (llama/10519)

7f24ebb

leo-pony commited on Nov 28, 2024

CANN: ROPE operator optimization (llama/10540)

63ee002

Chenguang Li

noemotiovon commited on Nov 28, 2024

Add some minimal optimizations for CDNA (llama/10498)

bf49bbe

uvos commited on Nov 27, 2024

metal : fix group_norm support condition (llama/0)

20ee62d

ggerganov commited on Nov 27, 2024

vulkan: define all quant data structures in types.comp (llama/10440)

cea89af

jeffbolznv commited on Nov 27, 2024

vulkan: Handle GPUs with less shared memory (llama/10468)

18a0ad1

jeffbolznv commited on Nov 27, 2024

vulkan: further optimize q5_k mul_mat_vec (llama/10479)

cb018d4

jeffbolznv commited on Nov 27, 2024

vulkan: skip integer div/mod in get_offsets for batch_idx==0 (llama/10506)

c6d15e0

jeffbolznv commited on Nov 27, 2024

vulkan: optimize Q2_K and Q3_K mul_mat_vec (llama/10459)

c032c06

jeffbolznv commited on Nov 27, 2024

mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (llama/10516)

f2a87fc

R0CKSTAR commited on Nov 26, 2024

vulkan: fix group_norm (llama/10496)

8f5eeb8

jeffbolznv commited on Nov 26, 2024

cmake : enable warnings in llama (llama/10474)

26a670b

ggerganov commited on Nov 26, 2024

ggml-cpu: cmake add arm64 cpu feature check for macos (llama/10487)

6d586a0

Charles Xu commited on Nov 26, 2024

CANN: Improve the Inferencing Performance for Ascend NPU Device (llama/10454)

f9fd6d6

Shanshan Shen shanshan shen Frank Mai commited on Nov 26, 2024

CANN: RoPE and CANCAT operator optimization (llama/10488)

b357ea7

Chenguang Li

noemotiovon commited on Nov 26, 2024

vulkan: Fix a vulkan-shaders-gen arugment parsing error (llama/10484)

6a4b6ae

Sparkleholic commited on Nov 26, 2024

metal : enable mat-vec kernels for bs <= 4 (llama/10491)

6d07dee

ggerganov commited on Nov 25, 2024

llama : accept a list of devices to use to offload a model (llama/10497)

6d7599e

Diego Devesa commited on Nov 25, 2024

ggml : add support for dynamic loading of backends (llama/10469)

b73266f

Diego Devesa

ggerganov commited on Nov 25, 2024

metal : minor code formatting

385a521

ggerganov commited on Nov 25, 2024

ggml : do not use ARM features not included in the build (llama/10457)

0001327

Diego Devesa commited on Nov 23, 2024

CANN: Support Ascend310P to accelerate F32 and F16 Model (llama/10216)

c9e03e6

leo-pony commited on Nov 22, 2024

cuda : optimize argmax (llama/10441)

69ae50d

Diego Devesa

JohannesGaessler commited on Nov 21, 2024

vulkan: predicate max operation in soft_max shaders/soft_max (llama/10437)

0a14325

jeffbolznv commited on Nov 20, 2024

vulkan: copy iq4_nl LUT into shared memory (llama/10409)

c31abdb

jeffbolznv commited on Nov 20, 2024

vulkan: further optimize mul_mat_vec using larger loads (llama/10387)

50a2978

jeffbolznv commited on Nov 20, 2024

add cmake rvv support (llama/10411)

e0bf47c

haopeng commited on Nov 19, 2024

CUDA: remove unnecessary warp reduce in FA (ggml/1032)

9a8c238

mahorozte

mahorozte commited on Dec 3, 2024

feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019)

c7e59ef

PABannier Diego Devesa commited on Dec 2, 2024

metal : add `GGML_OP_CONV_TRANSPOSE_1D` kernels (ggml/1026)

9c845f4

PABannier commited on Nov 28, 2024

Do not include arm_neon.h when compiling CUDA code (ggml/1028)

80663f4

Frankie Robertson commited on Nov 26, 2024

ggml-opt: fix data corruption (ggml/1022)

a916e92

JohannesGaessler commited on Nov 20, 2024

ggml/sched : do not skip views in pre-assignments

b1eba61

slaren commited on Nov 20, 2024

whisper : adapt to new ggml (wip)

ec6f374

ggerganov commited on Nov 19, 2024

ggml : sync resolve (skip) (#0)

d4d67dc

ggerganov commited on Nov 19, 2024