Googleов AI тренира препознавање гласова у гомили

Агенција
Googleов AI тренира препознавање гласова у гомили

Визија компаније Google на пољу процесирања се побољшавала током година, што поткрепљује чињеница да њихова Photos апликација препознаје лица, објекте и још много тога. Сада Google жели исто да уради и са гласом. Прецизније, са аудио-визуелним раздвајањем говора.

Рецимо да се налазите у гомили људи и позове вас позната особа. Иако можда не знате гдjе се ваш пријатељ/-ица налази у тој гомили, његов/њен глас има одређени образац који можете одмах да препознате, без обзира на бучне људе око вас. Машина можда неће моћи да то чини ефикасно, бар у тренутно популарним сервисима.

Међутим, истраживачи Googleа су развили систем дубоког учења који може да раздвоји гласове гледајући лица особа када оне говоре и потом се може фокусирати на те гласове. Тим је успио ово да постигне обучавањем "neural networkа" да прво разумије и препознаје појединачне гласове људи када су они причали сами.

Затим је симулирао виртуелне стране и убацио индивиудуалне гласове у ово, како би истренирао АИ да научи да изолује више гласова у одвојене сегменте.

Према наводима из Googleа, техника подразумијева комбиновање аудио и визуелних сигнала за видео улаз, како би се говор раздвојио. Комбинација визуелног елемента, заједно са звуком, за разлику од пуког раздвајања звука, помаже у одвајању и прочишћавању говора повезаног са одређеним видљивим говорником у видеу.

Ово може бити корисно током комуникације преко видео чета. Google тренутно истражује могућности тестирања ове функције у својим производима као што су Habgouts и Duo, преноси Benchmark.

Google такође вjерује да би ова технологија могла да помогне код аутоматских затворених система за снимање, гдjе се више говорника међусобно преклапа. Може да се користи и као пред процес за препознавање говора. Алатка, такође, може и буде злоупотребљена и да се користи у јавном прислушкивању.

Пратите нас на нашој Фејсбук и Инстаграм страници и Твитер налогу.

Пао ChatGPT
Пао ChatGPT
© АД "Глас Српске" Бања Лука, 2018., ISSN 2303-7385, Сва права придржана