Run_glue.py provides higher GLUE score on bert-base-uncased

pyjhzwh · April 6, 2023, 2:35am

According to transformers/README.md at main · huggingface/transformers · GitHub, I run run_glue.py for bert-base-uncased. I got similar number as in the README.md table. However, many tasks scores are much higher than the numbers reported in the Bert paper https://arxiv.org/pdf/1810.04805.pdf.
For example, Matthews corr of CoLA is 56.53 on README.md, and is 57.78 for my finetuned results using run_glue.py, but is only 52.1 in the Bert paper Table1.
Could any explain this? Do I miss someting? Thanks!

Zoe0427 · September 26, 2025, 5:21pm

Do you solve the problem? I think I met the same issue.

John6666 · September 26, 2025, 11:24pm

Hmm… Like this?

Topic		Replies	Views
Run my own model on GLUE tasks 🤗Transformers	0	252	August 8, 2021
Reproduce BERT and RoBERTa 🤗Transformers	1	1011	July 24, 2023
Models performances right out of the box Models	0	196	June 1, 2023
Error of run_glue.py: RuntimeError: CUDA error: device-side assert triggered 🤗Transformers	0	742	July 21, 2023
I am getting bad performance when evaluating on Huggingface test dataset (GLUE dataset) 🤗Transformers	0	305	October 26, 2021

Run_glue.py provides higher GLUE score on bert-base-uncased

Related topics