Журнал РАДИОЛОЦМАН, ноябрь 2015
Ken Kingery
Duke University
Разработанный в Дюкском университете новый датчик поможет компьютерам разделять накладывающиеся звуки
Возможно, что благодаря демонстрации новой технологии, люди диктующие Siri1) команды, в скором времени перестанут выглядеть так, словно собираются съесть свои смартфоны, и проблема «Коктейльной вечеринки2)» будет решена.
В многолюдном помещении, где голоса приходят со всех направлений, слуховая система человека невероятно хорошо справляется с выделением единственного голоса, отфильтровывая все остальные как бессодержательный фон.
Компьютеры так не умеют.
Однако новый подход инженеров Дюкского университета вскоре может радикально улучшить характеристики акустического оборудования. В их датчике используются метаматериалы, представляющие собой комбинацию обычных материалов с повторяющейся структурой, придающей им необычные свойства, и стохастические методы обработки информации, позволяющие определить направление прихода звука и выделить его из окружающих фоновых шумов.
Прототип датчика испытывается в звукопоглощающей комнате, чтобы исключить эхо и нежелательные фоновые шумы. |
После миниатюризации устройство сможет найти применение в управляемой голосом электронике, медицинских приборах, использующих акустические волны, таких, например, как устройства ультразвуковой диагностики, а также в слуховых аппаратах и кохлеарных имплантатах.Доклад о результатах исследований был опубликован в официальном органе Национальной академии наук США Proceedings of the National Academy of Sciences в августе 2015 г.
«Мы изобрели чувствительную систему, способную эффективно, надежно и с небольшими затратами решить интересную проблему, с которой ежедневно сталкивается современная технология, – сказал Абель Се (Abel Xie), аспирант электротехники и вычислительной техники Дюкского университета и ведущий автор исследования. – Мы рассчитываем, что это сможет улучшить характеристики устройств, активируемых голосом, таких как смартфоны и игровые консоли, и одновременно упростить конструкцию системы».
Устройство, доказывающее правильность концепции, немного напоминает толстые пластиковые пчелиные соты, подобно торту разделенные на множество ломтиков. В то время как сверху все отверстия сот выглядят одинаково, их глубина меняется от одного отверстия к другому. Это придает каждому ломтику индивидуальный характер.
«Полости ведут себя как бутылки с содовой, когда вы дуете в их горлышки, – сказал Стив Каммер (Steve Cummer), профессор электро- и вычислительной техники Дюкского университета. – Количество содовой, оставшейся в бутылке, или, в нашем случае, глубина полостей в незначительной, но обнаруживаемой степени влияет на тон производимого ими звука».
Когда звуковая волна достигает устройства, она слегка искажается этими полостями. Искажение имеет специфическую сигнатуру, зависящую от того, через какой ломтик торта она прошла. Воспринятый микрофоном на противоположной стороне торта звук передается в компьютер, который может отделить фоновые шумы, используя уникальность искажений, вносимых каждым элементом.
Этот опытный образец датчика может разделять звуки, приходящие одновременно с разных направлений, основываясь на уникальных искажениях, вносимых тем кусочком «торта», через который прошел звук. |
Свое изобретение исследователи проверили множеством экспериментов, одновременно посылая три одинаковых звука с трех различных направлений. Устройство смогло различать звуки с достоверностью 96.7%.
Несмотря на то, что размеры прототипа составляют 150 мм, ученые уверены, что сумеют воспроизвести его в меньших размерах и встроить в любой предмет нашего обихода. А поскольку датчик изготовлен из пластика и не имеет подвижных частей, он будет очень дешев и надежен.
«Эта концепция может найти применение и за пределами мира потребительской электроники, – сказал Се. – Я думаю, что она может быть внедрена в любое медицинское устройство визуализации, где используются звуковые волны, чтобы не только улучшить существующие датчики, но и создать принципиально новые».
«Владение дополнительной информацией дает возможность повысить качество звука и расширить функциональность таких устройств, как слуховые аппараты и кохлеарные имплантаты. Одной из очевидных задач, требующей решения, является сокращение физических размеров системы. Это очень сложно, но не невозможно, и мы работаем над этим».
- Speech Interpretation and Recognition Interface – разработанный для iOS программный интерфейс, обрабатывающий речь при голосовом вводе.
- Феномен, позволяющий сосредоточить слуховое внимание на одном конкретном раздражителе, отфильтровывая все остальные.