A Microsoft Bing csapata nyílt forrású embedding modellt adott ki Harrier néven. A modell több mint 100 nyelvet támogat, 32 000 tokenes kontextusablakot kínál, és több mint kétmilliárd példán, valamint a GPT-5 szintetikus adatain tanították. A csapat szerint a Harrier az első helyen áll a többnyelvű MTEB v2 benchmarkon, felülmúlva az OpenAI és az Amazon zárt modelljeit.

A teljes 27 milliárd paraméteres modell mellett két kisebb változat is elérhető – 0,6 milliárd és 270 milliárd paraméteres –, amelyek gyengébb hardveren is futtathatók. Mindhárom modell MIT licensz alatt szabadon letölthető a Hugging Face-ről. A Microsoft a jövőben a Bingbe és az AI-ügynökök új „grounding” szolgáltatásaiba is integrálni tervezi a technológiát.

Az embedding modellek az AI rendszerek információkereséséért, visszakereséséért és szervezéséért felelnek – a Microsoft szerint egyre fontosabb szerepet játszanak, ahogy az AI-ügynökök önállóan, többlépcsős feladatokat is végrehajtanak.