🚨 Apple julkaisi juuri FastVLM:n Hugging Facessa - 0.5, 1.5 ja 7B reaaliaikaiset VLM:t WebGPU-tuella 🤯
> 85 kertaa nopeampi ja 3,4 kertaa pienempi kuin vastaavan kokoiset VLM:t
> 7,9 kertaa nopeampi TTFT suuremmille malleille
> suunniteltu tuottamaan vähemmän tulostustunnuksia ja lyhentämään korkearesoluutioisten kuvien koodausaikaa
Bonus: toimii REAALIAJASSA suoraan selaimessasi, joka toimii transformers.js:n ja WebGPU:n 🔥 avulla
Kokeile sitä alla olevassa 👇 demossa
🚨 Apple julkaisi juuri FastVLM:n Hugging Facessa - 0.5, 1.5 ja 7B reaaliaikaiset VLM:t WebGPU-tuella 🤯
> 85 kertaa nopeampi ja 3,4 kertaa pienempi kuin vastaavan kokoiset VLM:t
> 7,9 kertaa nopeampi TTFT suuremmille malleille
> suunniteltu tuottamaan vähemmän tulostustunnuksia ja lyhentämään korkearesoluutioisten kuvien koodausaikaa
Bonus: toimii REAALIAJASSA suoraan selaimessasi, joka toimii transformers.js:n ja WebGPU:n 🔥 avulla
Kokeile sitä alla olevassa 👇 demossa
UUTUUS: Apple julkaisee FastVLM:n ja MobileCLIP2:n Hugging Facessa! 🤗
Mallit ovat jopa 85 kertaa nopeampia ja 3,4 kertaa pienempiä kuin aiemmat työt, mikä mahdollistaa reaaliaikaiset VLM-sovellukset! 🤯
Se voi jopa tehdä live-videotekstityksen 100 % paikallisesti selaimessasi (nolla asennusta). Valtava saavutettavuus!