Вештачката интелегенција на Гугл тренира препознавање гласови (ВИДЕО)

Визијата на компанијата Гугл на полето на процесирањето се подобрува со текот на годините, за што говори и фактот дека нивната апликацијата Photos препознава лица, објекти и предмети. Сега Гугл сака истото да го направи и со гласот. Или поточно, со аудио-визуелно одвојување на говорот.

Добивај вести на вибер

Доколку се наоѓате во група на луѓе и некој ваш познаник довикне по вас, вие и покрај тоа нешто не го гледате, благодарение на неговиот глас знаете дека тој е тука. Гласот има посебен образец кој може да биде распознаен, без оглед на галамата околу вас. Разликувањето на гласови за луѓето е лесно, а машините досега имаат мака со тоа.

Меѓутоа, истражувачкиот тим на Гугл разви систем на длабоко учење кој може да ги разликува гласоите гледајќи ги лицата на луѓето кои говорат и потоа може да се фокусира на тие гласови. Тимот успеа да го постигне ова преку обочување на системот прво да ги разбира и препознава поединечните гласови на луѓето кога зборуваат сами.

Потоа се симулирани и внесени индивидуални гласови, за вештачката интелегенција да може да научи да ги изолира гласовите во различни сегменти.

Според наводите од Гугл, техниката подразбира комбинирање на аудио и визуелни сигнали за видео влез, за да може разговорот да се издвои. Комбинацијата на визуелниот елемент, заедно со звукот, помага во раздвојувањето и прочистувањето на говорот поврзан со одреден видлив говорник во видеото.

Ова може да биде корисно за време на комуникација преку видео-чет. Гугл во моментов ја истражува можноста за тестирање на овие функции во своите производи како што се Hangouts и Duo.

Од компанијата исто така веруваат дека оваа технологија може да помогне во автоматските затворени системи за снимање, каде што повеќе говорници меѓусебно се преклопуваат. Може да се користи и како пред-процес за препознавање на говор. Алатката, исто така, може да биде и злоупотребена и да се користи во прислушувањето.

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Напис

Најнови

Сателитите ја преплавуваат орбитата: Hubble и другите телескопи сè потешко ја снимаат вселената

Руски астронаут отстранет од мисијата на SpaceX поради сомнение за шпионажа

(ВИДЕО) Утре ја имаме последната Супермесечина за оваа година: ќе биде поголема и посветла од вообичаеното

ВИДЕО: Првиот тројно преклоплив телефон на Samsung е вистински ѕвер

Facebook

Категории

Напис

Вештачката интелегенција на Гугл тренира препознавање гласови (ВИДЕО)

Поврзани артикли

Сингапур е најпаметниот град во светот

Дел од капсулата на SpaceX пронајден во Австралија

Вештачкото сонце ќе биде готово до крајот на оваа година?

Најголемиот авион со прв комерцијален лет во 2020. година

Ново истражување: На Јупитер има живот?

Елон Маск продаде акции на Tesla за уште една милијарда долари