Nahrát soubory do „lm-eval-harness/slovak_toxic_classification“

2025-05-12 07:36:36 +00:00 · 2025-05-12 07:36:36 +00:00 · a055822d36
commit a055822d36
parent efc87ea3b3
1 changed files with 73 additions and 0 deletions
--- a/lm-eval-harness/slovak_toxic_classification/init.py
+++ b/lm-eval-harness/slovak_toxic_classification/init.py
@ -0,0 +1,73 @@
 from lm_eval.api.task import Task
 from datasets import load_dataset
 from sklearn.metrics import precision_recall_fscore_support
 class SlovakToxicClassification(Task):
    VERSION = 1
    DATASET_PATH = "TUKE-KEMT/hate_speech_slovak"
    DATASET_NAME = None
    def __init__(self):
        # Загружаем датасет
        self.dataset = load_dataset(self.DATASET_PATH)
    def has_training_docs(self):
        return False
    def has_validation_docs(self):
        return True
    def has_test_docs(self):
        return True
    def validation_docs(self):
        return list(self.dataset["test"]) 
    def test_docs(self):
        return list(self.dataset["test"])
    def doc_to_text(self, doc):
        return doc["text"]  
    def doc_to_target(self, doc):
        return int(doc["label"])  
    def construct_requests(self, doc, ctx):
        return self.loglikelihood(ctx, " 0"), self.loglikelihood(ctx, " 1")
    def process_results(self, doc, results):
        ll0, ll1 = results
        pred = int(ll1 > ll0)
        gold = self.doc_to_target(doc)
        return {
            "f1": (gold, pred),
            "precision": (gold, pred),
            "recall": (gold, pred),
        }
    def aggregation(self):
        return {
            "f1": self.f1_score,
            "precision": self.precision_score,
            "recall": self.recall_score,
        }
    def higher_is_better(self):
        return {
            "f1": True,
            "precision": True,
            "recall": True,
        }
    def f1_score(self, gold_and_pred):
        golds, preds = zip(*gold_and_pred)
        return precision_recall_fscore_support(golds, preds, average="binary")[2]
    def precision_score(self, gold_and_pred):
        golds, preds = zip(*gold_and_pred)
        return precision_recall_fscore_support(golds, preds, average="binary")[0]
    def recall_score(self, gold_and_pred):
        golds, preds = zip(*gold_and_pred)
        return precision_recall_fscore_support(golds, preds, average="binary")[1]