Wikipedia е основана со цел знаењата да станат достапни низ целиот свет, но факт е дека во моментов најмногу содржини се достапни на англиски јазик. Aнглиската верзија на Wikipedia е најбогата, и има 5,5 милиони статии, а квалитетот на содржините значително варира бидејќи често нема витални информации.
Проблемот со Wikipedia стана поле погодно за тестирање и развој на машинско учење, па Google во јануари се приклучи на Wikipedia фондацијата, по што Google Translate се приклучил на алатките за преведување во рамките на Wikipedia. Сепак, се покажало дека креаторите на содржините кои не пишувааат на англиски јазик, Google алатката повеќе е ноќен кошмар од решение, па повторно се поставува прашањето дали Wikipedia воопшто треба да се потпре на системот на машинско учење.
Преводот на содржината со помош на алатката за машинско учење генерира текст врз основа на автоматски превод, и ако се користи правилно на креаторите може да заштеди многу време. Меѓутоа, ако нешто тргне наопаку, резултатите често се фатални и поради тоа некои зборови или групи на зборови се преведени сосема погрешно, што често го менува значењето и точноста на текстот.
Експертите истакнуваат дека Google Translate не е наменет како замена за вистинско познавање на јазикот. Од Wikipedia креаторите се очекува да поседуваат потребни знаења, бидејќи машинските преводи бараат следење, така што оние што контролираат мораат да го познаваат и јазикот од која содржина се преведува и јазикот на кој се преведува. Тука настанува проблем за јазиците за кои нема доволно волонтери, така што помалите проекти обично имаат многу лош квалитет од англиската Wikipedia.
Извор: PC Press.rs
Поврзани артикли