Pridanie_Kodov

2026-06-11 21:42:51 +02:00 · 2026-06-11 21:42:51 +02:00 · ae919106c1
commit ae919106c1
parent 0ef6cf229c
5 changed files with 1042 additions and 0 deletions
--- a/kody/evaluate_mistral_lora_metrics.py
+++ b/kody/evaluate_mistral_lora_metrics.py
@ -0,0 +1,317 @@
+import os
+import json
+import math
+from pathlib import Path
+
+os.environ["CUDA_VISIBLE_DEVICES"] = "0"
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+
+import torch
+from tqdm import tqdm
+from datasets import load_dataset
+from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
+from peft import PeftModel
+from rouge_score import rouge_scorer
+import sacrebleu
+
+
+MODEL_NAME = "slovak-nlp/mistral-sk-7b"
+DATASET_NAME = "saillab/alpaca-slovak-cleaned"
+
+# Tvoj Unsloth + TRL + QLoRA adaptér
+ADAPTER_DIR = "/home/schwarc/diplomovka/mistral_sk_alpaca/mistral-sk-7b-alpaca-slovak-unsloth-lora-full"
+
+PROJECT_DIR = Path.home() / "diplomovka" / "evaluation_results"
+PROJECT_DIR.mkdir(parents=True, exist_ok=True)
+
+METRICS_FILE = PROJECT_DIR / "unsloth_lora_metrics.json"
+
+NUM_EVAL_SAMPLES = 1000
+MAX_LENGTH = 1024
+MAX_NEW_TOKENS = 300
+
+# Pri hodnotení je lepšie deterministické generovanie
+DO_SAMPLE = False
+
+
+def is_empty(value):
+    if value is None:
+        return True
+
+    value = str(value).strip()
+
+    return value == "" or value.lower() == "nan"
+
+
+def make_prompt(example):
+    instruction = str(example["instruction"]).strip()
+    input_text = example.get("input")
+
+    if is_empty(input_text):
+        return (
+            "### Inštrukcia:\n"
+            f"{instruction}\n\n"
+            "### Odpoveď:\n"
+        )
+
+    return (
+        "### Inštrukcia:\n"
+        f"{instruction}\n\n"
+        "### Vstup:\n"
+        f"{str(input_text).strip()}\n\n"
+        "### Odpoveď:\n"
+    )
+
+
+def make_full_text(example, tokenizer):
+    prompt = make_prompt(example)
+    reference = str(example["output"]).strip()
+
+    return prompt + reference + tokenizer.eos_token
+
+
+def load_model():
+    print("CUDA available:", torch.cuda.is_available())
+
+    if torch.cuda.is_available():
+        print("GPU:", torch.cuda.get_device_name(0))
+
+    print("Načítavam tokenizer...")
+    tokenizer = AutoTokenizer.from_pretrained(ADAPTER_DIR, use_fast=False)
+
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = tokenizer.eos_token
+
+    print("Načítavam základný model v 4-bit režime...")
+
+    bnb_config = BitsAndBytesConfig(
+        load_in_4bit=True,
+        bnb_4bit_quant_type="nf4",
+        bnb_4bit_use_double_quant=True,
+        bnb_4bit_compute_dtype=torch.float16,
+    )
+
+    base_model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,
+        quantization_config=bnb_config,
+        device_map={"": 0},
+        dtype=torch.float16,
+    )
+
+    print("Pripájam LoRA adaptér...")
+    model = PeftModel.from_pretrained(base_model, ADAPTER_DIR)
+    model.eval()
+
+    print("Model pripravený.")
+    print("-" * 80)
+
+    return model, tokenizer
+
+
+def load_eval_dataset():
+    raw_dataset = load_dataset(DATASET_NAME)
+
+    eval_dataset = raw_dataset["test"].shuffle(seed=42)
+
+    if NUM_EVAL_SAMPLES is not None:
+        eval_dataset = eval_dataset.select(
+            range(min(NUM_EVAL_SAMPLES, len(eval_dataset)))
+        )
+
+    print("Eval vzoriek:", len(eval_dataset))
+
+    return eval_dataset
+
+
+def generate_predictions(model, tokenizer, eval_dataset):
+    predictions = []
+    references = []
+
+    for example in tqdm(eval_dataset, desc="Generujem odpovede"):
+        prompt = make_prompt(example)
+        reference = str(example["output"]).strip()
+
+        inputs = tokenizer(
+            prompt,
+            return_tensors="pt",
+            truncation=True,
+            max_length=MAX_LENGTH,
+        ).to(model.device)
+
+        input_length = inputs["input_ids"].shape[-1]
+
+        with torch.no_grad():
+            if DO_SAMPLE:
+                output_ids = model.generate(
+                    **inputs,
+                    max_new_tokens=MAX_NEW_TOKENS,
+                    do_sample=True,
+                    temperature=0.7,
+                    top_p=0.9,
+                    repetition_penalty=1.1,
+                    eos_token_id=tokenizer.eos_token_id,
+                    pad_token_id=tokenizer.pad_token_id,
+                )
+            else:
+                output_ids = model.generate(
+                    **inputs,
+                    max_new_tokens=MAX_NEW_TOKENS,
+                    do_sample=False,
+                    repetition_penalty=1.1,
+                    eos_token_id=tokenizer.eos_token_id,
+                    pad_token_id=tokenizer.pad_token_id,
+                )
+
+        prediction = tokenizer.decode(
+            output_ids[0][input_length:],
+            skip_special_tokens=True,
+        ).strip()
+
+        predictions.append(prediction)
+        references.append(reference)
+
+    return predictions, references
+
+
+def compute_rouge(predictions, references):
+    scorer = rouge_scorer.RougeScorer(
+        ["rouge1", "rouge2", "rougeL"],
+        use_stemmer=False,
+    )
+
+    rouge1_scores = []
+    rouge2_scores = []
+    rougeL_scores = []
+
+    for prediction, reference in zip(predictions, references):
+        scores = scorer.score(reference, prediction)
+
+        rouge1_scores.append(scores["rouge1"].fmeasure)
+        rouge2_scores.append(scores["rouge2"].fmeasure)
+        rougeL_scores.append(scores["rougeL"].fmeasure)
+
+    return {
+        "rouge1": sum(rouge1_scores) / len(rouge1_scores),
+        "rouge2": sum(rouge2_scores) / len(rouge2_scores),
+        "rougeL": sum(rougeL_scores) / len(rougeL_scores),
+    }
+
+
+def compute_bleu(predictions, references):
+    bleu = sacrebleu.corpus_bleu(
+        predictions,
+        [references],
+    )
+
+    return bleu.score
+
+
+def compute_perplexity(model, tokenizer, eval_dataset):
+    total_loss = 0.0
+    total_tokens = 0
+
+    for example in tqdm(eval_dataset, desc="Počítam perplexitu"):
+        prompt = make_prompt(example)
+        full_text = make_full_text(example, tokenizer)
+
+        prompt_ids = tokenizer(
+            prompt,
+            add_special_tokens=False,
+            truncation=True,
+            max_length=MAX_LENGTH,
+        )["input_ids"]
+
+        encoded = tokenizer(
+            full_text,
+            add_special_tokens=False,
+            truncation=True,
+            max_length=MAX_LENGTH,
+            padding="max_length",
+            return_tensors="pt",
+        )
+
+        input_ids = encoded["input_ids"].to(model.device)
+        attention_mask = encoded["attention_mask"].to(model.device)
+
+        labels = input_ids.clone()
+
+        prompt_len = min(len(prompt_ids), MAX_LENGTH)
+
+        labels[:, :prompt_len] = -100
+        labels[attention_mask == 0] = -100
+
+        valid_tokens = (labels != -100).sum().item()
+
+        if valid_tokens == 0:
+            continue
+
+        with torch.no_grad():
+            outputs = model(
+                input_ids=input_ids,
+                attention_mask=attention_mask,
+                labels=labels,
+            )
+
+        loss = outputs.loss.item()
+
+        total_loss += loss * valid_tokens
+        total_tokens += valid_tokens
+
+    avg_loss = total_loss / total_tokens
+    perplexity = math.exp(avg_loss)
+
+    return avg_loss, perplexity
+
+
+def save_metrics(metrics):
+    with open(METRICS_FILE, "w", encoding="utf-8") as file:
+        json.dump(metrics, file, ensure_ascii=False, indent=2)
+
+    print("Výsledné metriky uložené do:")
+    print(METRICS_FILE)
+
+
+def main():
+    model, tokenizer = load_model()
+    eval_dataset = load_eval_dataset()
+
+    predictions, references = generate_predictions(model, tokenizer, eval_dataset)
+
+    print("Počítam ROUGE...")
+    rouge_scores = compute_rouge(predictions, references)
+
+    print("Počítam BLEU...")
+    bleu_score = compute_bleu(predictions, references)
+
+    print("Počítam perplexitu...")
+    eval_loss, perplexity = compute_perplexity(model, tokenizer, eval_dataset)
+
+    metrics = {
+        "num_eval_samples": len(eval_dataset),
+        "rouge1": rouge_scores["rouge1"],
+        "rouge2": rouge_scores["rouge2"],
+        "rougeL": rouge_scores["rougeL"],
+        "bleu": bleu_score,
+        "eval_loss": eval_loss,
+        "perplexity": perplexity,
+        "adapter_dir": ADAPTER_DIR,
+        "model_name": MODEL_NAME,
+        "dataset_name": DATASET_NAME,
+    }
+
+    print("=" * 80)
+    print("FINÁLNE METRIKY")
+    print("=" * 80)
+    print(f"ROUGE-1:    {metrics['rouge1']:.4f}")
+    print(f"ROUGE-2:    {metrics['rouge2']:.4f}")
+    print(f"ROUGE-L:    {metrics['rougeL']:.4f}")
+    print(f"BLEU:       {metrics['bleu']:.4f}")
+    print(f"Eval loss:  {metrics['eval_loss']:.4f}")
+    print(f"Perplexity: {metrics['perplexity']:.4f}")
+    print("=" * 80)
+
+    save_metrics(metrics)
+
+
+if __name__ == "__main__":
+    main()
--- a/kody/mistral_sk_llamafactory_train.yaml
+++ b/kody/mistral_sk_llamafactory_train.yaml
@ -0,0 +1,89 @@
+top.booster: unsloth
+top.checkpoint_path: []
+top.finetuning_type: lora
+top.model_name: Custom
+top.quantization_bit: '4'
+top.quantization_method: bnb
+top.rope_scaling: none
+top.template: alpaca
+train.additional_target: ''
+train.apollo_rank: 16
+train.apollo_scale: 32
+train.apollo_target: all
+train.apollo_update_interval: 200
+train.badam_mode: layer
+train.badam_switch_interval: 50
+train.badam_switch_mode: ascending
+train.badam_update_ratio: 0.05
+train.batch_size: 1
+train.compute_type: fp16
+train.create_new_adapter: false
+train.cutoff_len: 1024
+train.dataset:
+- alpaca_slovak_cleaned
+train.dataset_dir: data
+train.ds_offload: false
+train.ds_stage: none
+train.enable_thinking: false
+train.extra_args: '{"optim": "adamw_8bit", "eval_steps": 1000, "eval_strategy": "steps",
+  "save_total_limit": 2}'
+train.freeze_extra_modules: ''
+train.freeze_language_model: false
+train.freeze_multi_modal_projector: true
+train.freeze_trainable_layers: 2
+train.freeze_trainable_modules: all
+train.freeze_vision_tower: true
+train.galore_rank: 16
+train.galore_scale: 2
+train.galore_target: all
+train.galore_update_interval: 200
+train.gradient_accumulation_steps: 8
+train.hub_private_repo: false
+train.image_max_pixels: 768*768
+train.image_min_pixels: 32*32
+train.learning_rate: 2e-4
+train.logging_steps: 5
+train.lora_alpha: 32
+train.lora_dropout: 0.05
+train.lora_rank: 16
+train.lora_target: q_proj,k_proj,v_proj,o_proj,gate_proj,up_proj,down_proj
+train.loraplus_lr_ratio: 0
+train.lr_scheduler_type: cosine
+train.mask_history: false
+train.max_grad_norm: '1.0'
+train.max_samples: '50000'
+train.neat_packing: false
+train.neftune_alpha: 0
+train.num_train_epochs: '1.0'
+train.packing: false
+train.ppo_score_norm: false
+train.ppo_whiten_rewards: false
+train.pref_beta: 0.1
+train.pref_ftx: 0
+train.pref_loss: sigmoid
+train.project: huggingface
+train.report_to: none
+train.resize_vocab: false
+train.reward_model: []
+train.save_steps: 1000
+train.swanlab_api_key: ''
+train.swanlab_link: null
+train.swanlab_mode: cloud
+train.swanlab_project: llamafactory
+train.swanlab_run_name: ''
+train.swanlab_workspace: ''
+train.trackio_space_id: trackio
+train.train_on_prompt: false
+train.training_stage: Supervised Fine-Tuning
+train.use_apollo: false
+train.use_badam: false
+train.use_dora: false
+train.use_galore: false
+train.use_llama_pro: false
+train.use_pissa: false
+train.use_rslora: false
+train.use_swanlab: false
+train.val_size: 0.025
+train.video_max_pixels: 256*256
+train.video_min_pixels: 16*16
+train.warmup_steps: 150
--- a/kody/test_mistral_lora.py
+++ b/kody/test_mistral_lora.py
@ -0,0 +1,141 @@
+import os
+from pathlib import Path
+
+os.environ["CUDA_VISIBLE_DEVICES"] = "0"
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+
+import torch
+from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
+from peft import PeftModel
+
+
+MODEL_NAME = "slovak-nlp/mistral-sk-7b"
+
+ADAPTER_DIR = "/home/schwarc/diplomovka/mistral_sk_alpaca/mistral-sk-7b-alpaca-slovak-unsloth-lora-full"
+
+MAX_NEW_TOKENS = 300
+
+
+def make_prompt(instruction, input_text=""):
+    instruction = instruction.strip()
+    input_text = input_text.strip()
+
+    if input_text:
+        return (
+            "### Inštrukcia:\n"
+            f"{instruction}\n\n"
+            "### Vstup:\n"
+            f"{input_text}\n\n"
+            "### Odpoveď:\n"
+        )
+
+    return (
+        "### Inštrukcia:\n"
+        f"{instruction}\n\n"
+        "### Odpoveď:\n"
+    )
+
+
+def load_model():
+    adapter_path = Path(ADAPTER_DIR)
+
+    if not adapter_path.exists():
+        raise FileNotFoundError(f"Adaptér neexistuje: {ADAPTER_DIR}")
+
+    print("CUDA available:", torch.cuda.is_available())
+
+    if torch.cuda.is_available():
+        print("GPU:", torch.cuda.get_device_name(0))
+
+    print("Načítavam tokenizer...")
+    tokenizer = AutoTokenizer.from_pretrained(ADAPTER_DIR, use_fast=False)
+
+    if tokenizer.pad_token is None:
+        tokenizer.pad_token = tokenizer.eos_token
+
+    print("Načítavam základný model v 4-bit režime...")
+
+    bnb_config = BitsAndBytesConfig(
+        load_in_4bit=True,
+        bnb_4bit_quant_type="nf4",
+        bnb_4bit_use_double_quant=True,
+        bnb_4bit_compute_dtype=torch.float16,
+    )
+
+    base_model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,
+        quantization_config=bnb_config,
+        device_map={"": 0},
+        dtype=torch.float16,
+    )
+
+    print("Pripájam LoRA adaptér...")
+    model = PeftModel.from_pretrained(base_model, ADAPTER_DIR)
+    model.eval()
+
+    print("Model je pripravený.")
+    print("-" * 80)
+
+    return model, tokenizer
+
+
+def generate_answer(model, tokenizer, instruction):
+    prompt = make_prompt(instruction)
+
+    inputs = tokenizer(
+        prompt,
+        return_tensors="pt",
+        truncation=True,
+        max_length=1024,
+    ).to(model.device)
+
+    input_length = inputs["input_ids"].shape[-1]
+
+    with torch.no_grad():
+        output_ids = model.generate(
+            **inputs,
+            max_new_tokens=MAX_NEW_TOKENS,
+
+            do_sample=True,
+            temperature=0.7,
+            top_p=0.9,
+
+            repetition_penalty=1.1,
+            eos_token_id=tokenizer.eos_token_id,
+            pad_token_id=tokenizer.pad_token_id,
+        )
+
+    answer = tokenizer.decode(
+        output_ids[0][input_length:],
+        skip_special_tokens=True,
+    )
+
+    return answer.strip()
+
+
+def main():
+    model, tokenizer = load_model()
+
+    print("Napíš inštrukciu.")
+    print("Ukončenie: exit, quit alebo koniec")
+    print("-" * 80)
+
+    while True:
+        instruction = input("\nInštrukcia: ").strip()
+
+        if instruction.lower() in ["exit", "quit", "koniec"]:
+            print("Koniec.")
+            break
+
+        if not instruction:
+            continue
+
+        answer = generate_answer(model, tokenizer, instruction)
+
+        print("\nOdpoveď:")
+        print(answer)
+        print("-" * 80)
+
+
+if __name__ == "__main__":
+    main()
--- a/kody/train_mistral_full.py
+++ b/kody/train_mistral_full.py
@ -0,0 +1,247 @@
+import os
+from pathlib import Path
+
+os.environ["CUDA_VISIBLE_DEVICES"] = "0"
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+os.environ["WANDB_DISABLED"] = "true"
+
+import torch
+from datasets import load_dataset
+from transformers import (
+    AutoTokenizer,
+    AutoModelForCausalLM,
+    BitsAndBytesConfig,
+    Trainer,
+    TrainingArguments,
+    default_data_collator,
+)
+from transformers.trainer_utils import get_last_checkpoint
+from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
+
+
+MODEL_NAME = "slovak-nlp/mistral-sk-7b"
+DATASET_NAME = "saillab/alpaca-slovak-cleaned"
+
+PROJECT_DIR = Path.home() / "diplomovka" / "mistral_sk_alpaca"
+OUTPUT_DIR = PROJECT_DIR / "outputs-full"
+ADAPTER_DIR = PROJECT_DIR / "mistral-sk-7b-alpaca-slovak-lora-full"
+
+PROJECT_DIR.mkdir(parents=True, exist_ok=True)
+OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
+
+MAX_TRAIN_SAMPLES = None
+MAX_EVAL_SAMPLES = 1000
+
+MAX_LENGTH = 1024
+BATCH_SIZE = 1
+GRAD_ACCUM = 8
+LEARNING_RATE = 2e-4
+NUM_EPOCHS = 1
+
+SAVE_STEPS = 1000
+EVAL_STEPS = 1000
+WARMUP_STEPS = 150
+MAX_STEPS = -1
+
+
+print("CUDA available:", torch.cuda.is_available())
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+    print("VRAM GB:", round(torch.cuda.get_device_properties(0).total_memory / 1024**3, 2))
+
+print("Project dir:", PROJECT_DIR)
+print("Output dir:", OUTPUT_DIR)
+print("Adapter dir:", ADAPTER_DIR)
+
+
+tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=False)
+
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token
+
+
+raw_dataset = load_dataset(DATASET_NAME)
+
+print(raw_dataset)
+
+
+def is_empty(value):
+    if value is None:
+        return True
+    value = str(value).strip()
+    return value == "" or value.lower() == "nan"
+
+
+def build_prompt(example):
+    instruction = str(example["instruction"]).strip()
+    input_text = example.get("input")
+
+    if is_empty(input_text):
+        prompt = f"### Inštrukcia:\n{instruction}\n\n### Odpoveď:\n"
+    else:
+        prompt = f"### Inštrukcia:\n{instruction}\n\n### Vstup:\n{str(input_text).strip()}\n\n### Odpoveď:\n"
+
+    completion = str(example["output"]).strip() + tokenizer.eos_token
+
+    return {
+        "prompt": prompt,
+        "completion": completion,
+        "text": prompt + completion,
+    }
+
+
+dataset = raw_dataset.map(
+    build_prompt,
+    remove_columns=raw_dataset["train"].column_names,
+)
+
+if MAX_TRAIN_SAMPLES is not None:
+    dataset["train"] = dataset["train"].select(range(min(MAX_TRAIN_SAMPLES, len(dataset["train"]))))
+
+if MAX_EVAL_SAMPLES is not None:
+    dataset["test"] = dataset["test"].select(range(min(MAX_EVAL_SAMPLES, len(dataset["test"]))))
+
+print(dataset)
+
+
+def tokenize_example(example):
+    prompt_ids = tokenizer(
+        example["prompt"],
+        add_special_tokens=False,
+        truncation=True,
+        max_length=MAX_LENGTH,
+    )["input_ids"]
+
+    full = tokenizer(
+        example["text"],
+        add_special_tokens=False,
+        truncation=True,
+        max_length=MAX_LENGTH,
+        padding="max_length",
+    )
+
+    input_ids = full["input_ids"]
+    attention_mask = full["attention_mask"]
+    labels = input_ids.copy()
+
+    prompt_len = min(len(prompt_ids), MAX_LENGTH)
+
+    labels[:prompt_len] = [-100] * prompt_len
+    labels = [
+        label if mask == 1 else -100
+        for label, mask in zip(labels, attention_mask)
+    ]
+
+    return {
+        "input_ids": input_ids,
+        "attention_mask": attention_mask,
+        "labels": labels,
+    }
+
+
+tokenized_dataset = dataset.map(
+    tokenize_example,
+    remove_columns=dataset["train"].column_names,
+    num_proc=1,
+)
+
+print(tokenized_dataset)
+print("Tokenizácia hotová.")
+
+
+bnb_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_quant_type="nf4",
+    bnb_4bit_use_double_quant=True,
+    bnb_4bit_compute_dtype=torch.float16,
+)
+
+model = AutoModelForCausalLM.from_pretrained(
+    MODEL_NAME,
+    quantization_config=bnb_config,
+    device_map={"": 0},
+    dtype=torch.float16,
+)
+
+model.config.use_cache = False
+model.gradient_checkpointing_enable()
+model = prepare_model_for_kbit_training(model)
+
+lora_config = LoraConfig(
+    r=16,
+    lora_alpha=32,
+    lora_dropout=0.05,
+    bias="none",
+    task_type="CAUSAL_LM",
+    target_modules=[
+        "q_proj", "k_proj", "v_proj", "o_proj",
+        "gate_proj", "up_proj", "down_proj",
+    ],
+)
+
+model = get_peft_model(model, lora_config)
+model.print_trainable_parameters()
+
+
+training_args = TrainingArguments(
+    output_dir=str(OUTPUT_DIR),
+
+    per_device_train_batch_size=BATCH_SIZE,
+    per_device_eval_batch_size=BATCH_SIZE,
+    gradient_accumulation_steps=GRAD_ACCUM,
+
+    learning_rate=LEARNING_RATE,
+    num_train_epochs=NUM_EPOCHS,
+    max_steps=MAX_STEPS,
+
+    fp16=True,
+    bf16=False,
+
+    logging_steps=10,
+    save_steps=SAVE_STEPS,
+    save_total_limit=2,
+
+    eval_strategy="steps",
+    eval_steps=EVAL_STEPS,
+
+    optim="paged_adamw_8bit",
+    warmup_steps=WARMUP_STEPS,
+    lr_scheduler_type="cosine",
+    max_grad_norm=0.3,
+
+    gradient_checkpointing=True,
+    report_to="none",
+    remove_unused_columns=False,
+)
+
+
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=tokenized_dataset["train"],
+    eval_dataset=tokenized_dataset["test"],
+    data_collator=default_data_collator,
+)
+
+
+last_checkpoint = None
+if OUTPUT_DIR.exists():
+    last_checkpoint = get_last_checkpoint(str(OUTPUT_DIR))
+
+if last_checkpoint is not None:
+    print("Pokračujem z checkpointu:", last_checkpoint)
+else:
+    print("Začínam nový tréning.")
+
+
+trainer.train(resume_from_checkpoint=last_checkpoint)
+
+metrics = trainer.evaluate()
+print(metrics)
+
+trainer.save_model(str(ADAPTER_DIR))
+tokenizer.save_pretrained(str(ADAPTER_DIR))
+
+print("Hotovo.")
+print("LoRA adaptér uložený do:")
+print(ADAPTER_DIR)
--- a/kody/train_mistral_unsloth_trl.py
+++ b/kody/train_mistral_unsloth_trl.py
@ -0,0 +1,248 @@
+import os
+from pathlib import Path
+
+# Použijeme GPU 0
+os.environ["CUDA_VISIBLE_DEVICES"] = "0"
+os.environ["TOKENIZERS_PARALLELISM"] = "false"
+os.environ["WANDB_DISABLED"] = "true"
+
+import torch
+from datasets import load_dataset
+from unsloth import FastLanguageModel
+from trl import SFTTrainer, SFTConfig
+from transformers.trainer_utils import get_last_checkpoint
+
+
+MODEL_NAME = "slovak-nlp/mistral-sk-7b"
+DATASET_NAME = "saillab/alpaca-slovak-cleaned"
+
+PROJECT_DIR = Path.home() / "diplomovka" / "mistral_sk_alpaca"
+
+# Výstupy pre FULL Unsloth experiment
+OUTPUT_DIR = PROJECT_DIR / "outputs-unsloth-full"
+ADAPTER_DIR = PROJECT_DIR / "mistral-sk-7b-alpaca-slovak-unsloth-lora-full"
+
+PROJECT_DIR.mkdir(parents=True, exist_ok=True)
+OUTPUT_DIR.mkdir(parents=True, exist_ok=True)
+
+# Nastavenia tréningu
+MAX_SEQ_LENGTH = 1024
+
+MAX_TRAIN_SAMPLES = None     # None = celý train dataset
+MAX_EVAL_SAMPLES = 1000      # validácia na 1000 príkladoch
+
+NUM_EPOCHS = 1
+MAX_STEPS = -1               # -1 = pôjde podľa epoch
+
+BATCH_SIZE = 1
+GRAD_ACCUM = 8
+LEARNING_RATE = 2e-4
+
+SAVE_STEPS = 1000
+EVAL_STEPS = 1000
+WARMUP_STEPS = 150
+
+
+print("=" * 80)
+print("Experiment: Unsloth + TRL SFTTrainer + QLoRA")
+print("=" * 80)
+
+print("CUDA available:", torch.cuda.is_available())
+
+if torch.cuda.is_available():
+    print("GPU:", torch.cuda.get_device_name(0))
+    print("VRAM GB:", round(torch.cuda.get_device_properties(0).total_memory / 1024**3, 2))
+
+print("Torch:", torch.__version__)
+print("Model:", MODEL_NAME)
+print("Dataset:", DATASET_NAME)
+print("Output dir:", OUTPUT_DIR)
+print("Adapter dir:", ADAPTER_DIR)
+print("=" * 80)
+
+
+# 1. Načítanie modelu cez Unsloth v 4-bit režime
+model, tokenizer = FastLanguageModel.from_pretrained(
+    model_name=MODEL_NAME,
+    max_seq_length=MAX_SEQ_LENGTH,
+    dtype=torch.float16,
+    load_in_4bit=True,
+)
+
+if tokenizer.pad_token is None:
+    tokenizer.pad_token = tokenizer.eos_token
+
+
+# 2. Pridanie LoRA adaptéra
+model = FastLanguageModel.get_peft_model(
+    model,
+    r=16,
+    target_modules=[
+        "q_proj",
+        "k_proj",
+        "v_proj",
+        "o_proj",
+        "gate_proj",
+        "up_proj",
+        "down_proj",
+    ],
+    lora_alpha=32,
+    lora_dropout=0.05,
+    bias="none",
+    use_gradient_checkpointing="unsloth",
+    random_state=42,
+)
+
+print("LoRA adaptér pridaný.")
+
+
+# 3. Načítanie datasetu
+raw_dataset = load_dataset(DATASET_NAME)
+
+print("Pôvodný dataset:")
+print(raw_dataset)
+
+
+# 4. Formátovanie do Alpaca štýlu
+def is_empty(value):
+    if value is None:
+        return True
+
+    value = str(value).strip()
+
+    return value == "" or value.lower() == "nan"
+
+
+def format_example(example):
+    instruction = str(example["instruction"]).strip()
+    input_text = example.get("input")
+    output = str(example["output"]).strip()
+
+    if is_empty(input_text):
+        text = (
+            f"### Inštrukcia:\n"
+            f"{instruction}\n\n"
+            f"### Odpoveď:\n"
+            f"{output}"
+        )
+    else:
+        text = (
+            f"### Inštrukcia:\n"
+            f"{instruction}\n\n"
+            f"### Vstup:\n"
+            f"{str(input_text).strip()}\n\n"
+            f"### Odpoveď:\n"
+            f"{output}"
+        )
+
+    return {
+        "text": text + tokenizer.eos_token
+    }
+
+
+dataset = raw_dataset.map(
+    format_example,
+    remove_columns=raw_dataset["train"].column_names,
+)
+
+# Premiešanie kvôli lepšej reprezentatívnosti
+dataset["train"] = dataset["train"].shuffle(seed=42)
+dataset["test"] = dataset["test"].shuffle(seed=42)
+
+if MAX_TRAIN_SAMPLES is not None:
+    dataset["train"] = dataset["train"].select(
+        range(min(MAX_TRAIN_SAMPLES, len(dataset["train"])))
+    )
+
+if MAX_EVAL_SAMPLES is not None:
+    dataset["test"] = dataset["test"].select(
+        range(min(MAX_EVAL_SAMPLES, len(dataset["test"])))
+    )
+
+print("Použitý dataset:")
+print(dataset)
+
+print("Ukážka tréningového textu:")
+print(dataset["train"][0]["text"][:1200])
+print("=" * 80)
+
+
+# 5. TRL SFTTrainer
+training_args = SFTConfig(
+    output_dir=str(OUTPUT_DIR),
+
+    per_device_train_batch_size=BATCH_SIZE,
+    per_device_eval_batch_size=BATCH_SIZE,
+    gradient_accumulation_steps=GRAD_ACCUM,
+
+    learning_rate=LEARNING_RATE,
+    num_train_epochs=NUM_EPOCHS,
+    max_steps=MAX_STEPS,
+
+    logging_steps=10,
+
+    eval_strategy="steps",
+    eval_steps=EVAL_STEPS,
+
+    save_strategy="steps",
+    save_steps=SAVE_STEPS,
+    save_total_limit=2,
+
+    warmup_steps=WARMUP_STEPS,
+    optim="adamw_8bit",
+    fp16=True,
+    bf16=False,
+
+    lr_scheduler_type="cosine",
+    report_to="none",
+
+    max_length=MAX_SEQ_LENGTH,
+    packing=False,
+    dataset_text_field="text",
+)
+
+
+trainer = SFTTrainer(
+    model=model,
+    tokenizer=tokenizer,
+    train_dataset=dataset["train"],
+    eval_dataset=dataset["test"],
+    args=training_args,
+)
+
+
+# 6. Pokračovanie z checkpointu, ak existuje
+last_checkpoint = None
+
+if OUTPUT_DIR.exists():
+    last_checkpoint = get_last_checkpoint(str(OUTPUT_DIR))
+
+if last_checkpoint is not None:
+    print("Pokračujem z checkpointu:", last_checkpoint)
+else:
+    print("Začínam nový Unsloth full tréning.")
+
+
+# 7. Tréning
+train_result = trainer.train(resume_from_checkpoint=last_checkpoint)
+
+print("Výsledok tréningu:")
+print(train_result)
+
+
+# 8. Finálne vyhodnotenie
+metrics = trainer.evaluate()
+
+print("Finálne metriky:")
+print(metrics)
+
+
+# 9. Uloženie LoRA adaptéra
+model.save_pretrained(str(ADAPTER_DIR))
+tokenizer.save_pretrained(str(ADAPTER_DIR))
+
+print("=" * 80)
+print("Hotovo.")
+print("Unsloth LoRA adaptér uložený do:")
+print(ADAPTER_DIR)
+print("=" * 80)