DeepSchoolDeepSchool
llm

Не оверфит, а гроккинг

решили: 4080 баллов

Крошечную модель по неосторожности дообучили на дампе внутренних заметок, и она кое-что запомнила. Веса у тебя на руках: достань из них секрет.

⬇️ Артефакты

Положи всё в одну папку. Сервер модель не запускает, вся атака локально.

▶️ Быстрый старт

import json, torch
from model import GPT, GPTConfig

if __name__ == '__main__':

    ckpt = torch.load("model.pt", map_location="cpu")
    model = GPT(GPTConfig(**ckpt["config"]))
    model.load_state_dict(ckpt["model"])
    model.eval()
    v = json.load(open("vocab.json"))
    stoi, itos = v["stoi"], {int(k): c for k, c in v["itos"].items()}
    start = stoi.get("\n", 0)
    idx = torch.tensor([[start]], dtype=torch.long)   # [B=1, T=1]

    out = model.generate(idx, max_new_tokens=200, temperature=1.0, top_k=None)
    text = "".join(itos[int(i)] for i in out[0].tolist())
    print(text)
🕐 5/5 попыток за час