Tegnap volt az OpenAI DevDay első felvonása, ahol bemutatták a fejlesztők számára elérhető új funkciókat:

  • Model distillation: lehetővé teszi, hogy a kisebb modelleket nagyobb, fejlettebb modellek segítségével finomhangoljuk, a hatékonyabb és olcsóbb AI megoldásokhoz.
  • Prompt caching: a gyakran használt parancsokat újra felhasználva 50%-os költségcsökkenést érhetnek el a fejlesztők.
  • Vision fine-tuning: a szöveges adatok mellett már képekkel is lehet finomhangolni a GPT-4o modellt, hogy egy adott feladatra testreszabjuk.
  • Realtime API: az eddigieknél gyorsabb, multimodális API, ez hajtja a továbbfejlesztett beszédmódot is, és nagy lehetőségeket rejt, mert egyszerre képes hangot és szöveget kiadni, miközben funkciókat is tud futtatni. A bemutatott demóban az AI ügynök telefonon felhívott egy megadott üzletet, hogy epret rendeljen.

Emellett mostantól a nem fizető felhasználók is kipróbálhatják a továbbfejlesztett beszédmódot (kivéve az EU-ban).