.@poetiq_ai to nowy startup, który niedawno osiągnął znaczący skok w benchmarku ARC-AGI, nakładając system samodoskonalenia na istniejące modele. W tym odcinku @LightconePod, założyciel i dyrektor generalny Poetiq, @itfische, dołączył do nas, aby omówić, jak małe zespoły mogą budować „harnesy rozumowania”, które przewyższają modele bazowe, co to oznacza dla startupów i dlaczego automatyzacja inżynierii promptów może być jednym z najpotężniejszych dźwigni w AI dzisiaj. 00:00 – Wprowadzenie 00:40 – Czym jest Poetiq? 01:07 – Wyjaśnienie samodoskonalenia rekurencyjnego 02:07 – Pułapka fine-tuningu 02:59 – „Stilts” dla LLM-ów 03:14 – Samodoskonalenie rekurencyjne vs. fine-tuning 05:05 – Zajmowanie pierwszego miejsca w ARC-AGI 06:37 – Pokonanie Claude'a na ostatnim egzaminie ludzkości 08:40 – Jak działa system meta 10:26 – Poza RL: Nowa krzywa S 11:32 – Automatyzacja inżynierii promptów 13:37 – Od 5% do 95% wydajności 14:50 – Wczesny dostęp i umieszczanie swojego agenta na stilts 16:17 – Od założyciela YC do badacza DeepMind 18:29 – Porady dla inżynierów w erze AI