Tym razem zajmiemy się polskimi LLMami. Pojawiły się!
Wraz z prof. dr hab. Tomaszem Góreckim i UAM WMiI, organizacją studencką GHOST, Poznańskiem Horyzontem Danych oraz Kanałem Studenckim zapraszamy na spotkanie, gdzie będziemy przedstawiać projekty związane z polskimi LLMami.
Spotkanie będzie zarówno fizycznie jak i zdalnie. Link do spotkania pojawi się na kilka dni przed spotkaniem. Postaramy się, żeby forma zdalna pozwalała na zadawanie pytań i uczestnictwo w dyskusji.
Agenda:
- 18:00 – 18:05 Przywitanie i wstęp – Adam Karolewski (AIrrival, Smartstock) – Obejrzyj
- 18:05 – 18:15 Kanał Studencki – przedstawienie
- 18:15 – 19:15 Bielik – polski model od kuchni – Paweł Kiszczak i Maciej Krystian Szymański (SpeakLeash aka Spichlerz) – Obejrzyj
- 19:15 – 19:30 LLMy w AI Lab – Marek Kozłowski (AI Lab, Ośrodek Przetwarzania Informacji, Polski Instytut Badawczy) – Obejrzyj
- 19:30 – 19:45 przerwa
- 19:45 – 20:45 Po co nam polskie LLMy? – Marek Kozłowski (AI Lab), Paweł Ekk-Cierniakowski (SoftwareOne), Paweł Kiszczak i Maciej Krystian Szymański (SpeakLeash aka Spichlerz), prowadzący Adam Karolewski – dyskusja z panelistami i uczestnikami spotkania – Obejrzyj
Koledzy ze Spichlerza omówią następujące tematy:
- czym jest SpeakLeash aka Spichlerz i jak powstał, cele
- organizacja pracy
- pozyskiwanie danych
- społeczność na Discordzie
- możliwości uczestnictwa w projekcie
- Arena
- potencjał biznesowy
Prelegenci
Krótkie przedstawienie naszych prelegentów:
Paweł Kiszczak
Absolwent Politechniki Wrocławskiej na kierunku Mechatronika. Przez długi czas związany z biznesem, jednakże od 2 lat także zapragnął się rozwijać w szeroko rozumianej gałęzi sztucznej inteligencji, często enigmatycznie określanej jako AI/ML/DS. Jest samoukiem, w czym wymiernie pomógł projekt Spichlerz, którego jest członkiem od prawie 1,5 roku. Odpowiada tam głównie za nurty powiązane ze zbieraniem danych, instrukcjami czy jakością danych. Od niedawna zaangażowany w rozwój aplikacji webowych oraz aktywnie udzielający się w dziale odpowiedzialnym za badania i rozwój. Na co dzień zawodowo związany z Deviniti, gdzie pracuje w dziale R&D jako Data Scientist łącząc umiejętności biznesowe razem z techniczną wiedzą.
Maciej Szymański
Maciej przez ponad dekadę rozwijał swoje umiejętności w zakresie doradztwa, konsultingu i sprzedaży na polskim i międzynarodowym rynku. Jego kariera obejmuje pracę w różnorodnych sektorach, w tym w IT, e-commerce, designie przemysłowym, elektronice oraz przemyśle ciężkim, gdzie z sukcesem wdrażał strategie sprzedażowe i prowadził zaawansowane projekty z zakresu automatyzacji i aplikacji mobilnych, szczególnie w obszarze AI for Business.
Marek Kozłowski
AI Lab od 2020 mocno rozwija dziedzinie polskich neuronowych modeli językowych opartych na architekturze Transformer, zaczynaliśmy od Polskich Modeli RoBERTa (1 miejsce w KLEJ benchmark), potem wydaliśmy BARTY, GPT2, text enkodery (st-polish-paraphrase, mmlw; mmlw ma 1 miejsce w polskim MTEB benchmark), dense retrievery i rerankery dla j. polskiego (1 miejsce w PIRB benchmark), zbudowaliśmy polskie fundamentalne Llamy 2 zwane Qrami, teraz działamy w PLLuMie nad szerokim spectrum prac od budowania różnych zbiorów danych, przez pretrain, sft, po RAGi dla administracji, w ciągu 20 min postaram się przedstawić nasz portfel produktowy;), chociaż to tylko będzie wierzchołek góry lodowej 🙂
Piotr Jabłoński
Z UAM związany od 2013 roku, obecnie doktorant w Szkole Doktorskiej Nauk Ścisłych oraz specjalista ds. transferu technologii w Centrum Sztucznej Inteligencji UAM. W ramach realizowanego doktoratu prowadzi badania nad opracowaniem metod nieprecyzyjnej klasyfikacji zawartości przekazów medialnych (internetowych i telewizyjnych). Na co dzień zdobytą wiedzę naukową obejmującą m.in. zastosowanie modeli językowych z powodzeniem wykorzystuje w opracowywaniu i wdrażaniu nowych rozwiązań biznesowych. Od 2016 roku jest wykładowcą akademickim, który wprowadza studentów Wydziału Nauk Politycznych i Dziennikarstwa w świat nowoczesnych technologii w ramach zajęć z Programowania, Technik Nowych Mediów, Webmasteringu i Produkcji Audiowizualnej.