plip / Git / [7829e6] /reproducibility/evaluation/linear_probing/linear

Models:

DanielG/

plip

Downloads: 1

[7829e6]: / reproducibility / evaluation / linear_probing / linear_classifier.py

History

Download this file

42 lines (29 with data), 1.3 kB

from sklearn.linear_model import SGDClassifier
from reproducibility.metrics import eval_metrics
import numpy as np
from typing import List
from sklearn.preprocessing import LabelEncoder
import logging

class LinearProber:

    def __init__(self, alpha, seed=7):
        self.alpha = alpha
        self.seed = seed

    logging.info("LinearProber running")

    def train_and_test(self, train_x: List, train_y: List, test_x: List, test_y: List):
        classifier = SGDClassifier(random_state=self.seed, loss="log_loss",
                                   alpha=self.alpha, verbose=0,
                                   penalty="l2", max_iter=10000, class_weight="balanced")
        
        le = LabelEncoder()

        train_y = le.fit_transform(train_y)
        test_y = le.transform(test_y)

        train_y = np.array(train_y)
        test_y = np.array(test_y)

        classifier.fit(train_x, train_y)
        test_pred = classifier.predict(test_x)
        train_pred = classifier.predict(train_x)

        test_metrics = eval_metrics(test_y, test_pred, average_method="macro")
        train_metrics = eval_metrics(train_y, train_pred, average_method="macro")
        test_metrics["split"] = "test"
        train_metrics["split"] = "train"

        logging.info(f"LinearProber Done")

        return classifier, (test_metrics, train_metrics)