Сотрудники Университетского колледжа Лондона (UCL) выяснили, что люди не могут отличить до 25-27% звуковых дипфейков, созданных нейросетями, от настоящих голосов, сообщает «МИР 24» со ссылкой на издание PLoS ONE.
В эксперименте участвовали две группы людей из разных стран, которые не смогли точно отличить созданные нейросетью VITS аудиодипфейки от реальных записей голосов. Лишь в четверти случаев добровольцам удалось отличить звуковой оригинал от подделки.
Ученые считают, что причиной тому – высокая скорость развития медиаконтента, создаваемого с помощью искусственного интеллекта, которая уже в ближайшем будущем может привести человечество к столкновению с новыми рисками. В этой связи они рекомендуют разрабатывать стратегии и инструменты для борьбы с неправомерным использованием таких технологий без ограничения их законного применения.