Google има технологија за прецизно синтетизирање човечки глас

Google го заврши развојот на технологијата „Tacotron“ која преставува втора генерација од напредната технологија која овозможува да го конвертирате текстот во говор. Гигантот веќе неколку години работи на подобрување на јазикот на машините за своите услуги како Google Assistant и други. Google инженерите успеале да постигнат таков резултат, што сега синтетичкиот говор е тешко да се разликува од човечкиот говор.

Новата технологија ги зема предвид интерпункциите, правилно ги поставува зборовите кои почнуваат со голема буква, распознава имиња на градови и места, како и глаголски дејства. За да се постигне овој резултат користат се две мрежи. Првата го претвора обичниот текст во спектрограм – визуелна претстава на аудио фреквенции, по што добиениот резултатот е испратен до втората мрежа наречена WaveNet, развиена од британската компанија DeepMind, која се занимава со проучување на вештачката интелигенција. Таа, пак, ги врши останатите операции.

WaveNet е веќе во употреба на англиски и јапонски верзии на Google Asistent, а наскоро ќе биде применет и во други јазици.

Напишете коментар

Вашата адреса за е-пошта нема да биде објавена. Задолжителните полиња се означени со *

9 + twenty =