whisper.cpp

Running

whisper.cpp / ggml /src /ggml-cuda /template-instances /fattn-mma-f16-instance-ncols1_16-ncols2_1.cu

CUDA: optimize FA for GQA + large batches (llama/12014)

6662d54 11 months ago

336 Bytes

	// This file has been autogenerated by generate_cu_files.py, do not edit manually.

	#include "../fattn-mma-f16.cuh"

	DECL_FATTN_MMA_F16_CASE(64, 16, 1);
	DECL_FATTN_MMA_F16_CASE(80, 16, 1);
	DECL_FATTN_MMA_F16_CASE(96, 16, 1);
	DECL_FATTN_MMA_F16_CASE(112, 16, 1);
	DECL_FATTN_MMA_F16_CASE(128, 16, 1);
	DECL_FATTN_MMA_F16_CASE(256, 16, 1);