Кинескиот DeepSeek објави нова верзија на својот модел V3, која, според компанијата, носи значителни подобрувања во перформансите и флексибилноста.

Се вели дека моделот V3.1 обработува информации побрзо од претходната верзија R1-0528, а функциите на паметниот асистент базиран на вештачка интелигенција се исто така подобрени.

Прозорецот со контекстуални токени, кој покажува колку зборови моделот може да запомни од вашите претходни интеракции за подобро да го формулира следниот одговор, е 128.000, што е еквивалентно на книга од околу 300 страници.

Весникот SCMP забележа дека компанијата ги отстранила референците за моделот R1 од функцијата „длабоко размислување“ во својот разговор, предизвикувајќи шпекулации дека долгоочекуваниот модел R2 повторно ќе биде одложен.

Фајненшл тајмс минатата недела, повикувајќи се на три анонимни извори запознаени со прашањето, објави дека одложувањето на лансирањето на R2 се должи на технички проблеми со чиповите Ascend на Huawei.

Според изворите, DeepSeek бил принуден да го промени својот пристап – користи чипови од американската компанија Nvidia за обука, додека чиповите на Huawei се наменети за фазата на инференција (извлекување заклучоци), што бара помала процесорска моќност од самата обука.

Првично планираното лансирање на моделот R2 во мај сега е одложено, а нов официјален датум сè уште не е објавен.