Anatomia LLM

Jak sterować kreatywnością modelu?

W drugim artykule z serii Anatomia LLM sprawdzimy, jak zapanować nad kreatywnością dużego modelu językowego. Najpierw musimy zrozumieć, co dokładnie zwraca LLM i jaki sposób można zmodyfikować wynik jego działania. Co zwraca model? Jak wiemy, każdy tekst z perspektywy dużego modelu językowego jest sekwencją najmniejszych, niepodzielnych jednostek, zwanych tokenami. Unikatowy …

Anatomia LLM

Trenowanie dużych modeli językowych

Rozpoczynamy cykl artykułów pod tytułem Anatomia LLM. Przyjrzymy się w nim dokładniej robiącym furorę sieciom neuronowym, znanym powszechnie jako duże modele językowe, czyli Large Language Models. Na początku naszkicujemy sobie, jak ogólnie przebiega trening modelu tej klasy oraz jakie dane są w nim wykorzystywane. Etapy trenowania LLM Szkolenie dużego modelu …