-
Új kisméretű modell a Mistraltól
A francia startup bemutatta a Mistral Small 3-at, egy 24 milliárd paraméteres, nyílt forráskódú AI-modellt, amely Apache 2.0 licenc alatt érhető el, így szabadon felhasználható akár kereskedelmi célra is. A modell kiemelkedően gyors (150 token/másodperc), teljesítményben pedig felveszi a versenyt jóval nagyobb méretű modellekkel is, például a Llama 3.3 70B-vel. A fejlesztők szerint az új…
-
Nyílt forráskódú, o1-szintű AI modell 450 dollárból?
A UC Berkeley Sky Computing Lab kutatói bemutatták a Sky-T1-32B-Preview-t, egy olyan „érvelő” típusú AI modellt, amely számos fontos teszten versenyképes az OpenAI o1-preview modelljével, mint például a MATH500 matematikai kihívásai és LiveCodeBench kódolási problémák. A modell különlegessége, hogy elképesztően alacsony áron fejlesztették ki: a betanítása nagyjából 450 dollárba került, és csupán egy napig tartott.…