Группа исследователей из Университета Техаса в Остине разработала уникальную систему ИИ, способную преобразовывать звуковые записи в точные изображения улиц. Это открытие может изменить подход к пониманию визуальной информации и её связи с аудиовосприятием.
Существующая система использует генеративный ИИ для успешного преобразования звуковых клипов в образы улиц, откуда эти звуки исходят. Результаты экспериментов показывают, что машины способны воспроизводить человеческое восприятие взаимосвязи между звуками и визуальными элементами окружающей среды.
Исследователи стремились определить, достаточно ли аудиозаписей для понимания визуальных характеристик окружающей среды ИИ, и, как оказалось, это возможно. Созданные изображения отображают уличные сцены с высокой точностью, подчеркивая невероятные возможности современных технологий.