Муфты электромонтажные от производителя Fucon
РадиоЛоцман - Все об электронике

Siri услышит вас даже на коктейльной вечеринке

Журнал РАДИОЛОЦМАН, ноябрь 2015

Ken Kingery

Duke University

Выбираем схему BMS для заряда литий-железофосфатных (LiFePO4) аккумуляторов

Разработанный в Дюкском университете новый датчик поможет компьютерам разделять накладывающиеся звуки

Возможно, что благодаря демонстрации новой технологии, люди диктующие Siri1) команды, в скором времени перестанут выглядеть так, словно собираются съесть свои смартфоны, и проблема «Коктейльной вечеринки2)» будет решена.

В многолюдном помещении, где голоса приходят со всех направлений, слуховая система человека невероятно хорошо справляется с выделением единственного голоса, отфильтровывая все остальные как бессодержательный фон.

Компьютеры так не умеют.

Однако новый подход инженеров Дюкского университета вскоре может радикально улучшить характеристики акустического оборудования. В их датчике используются метаматериалы, представляющие собой комбинацию обычных материалов с повторяющейся структурой, придающей им необычные свойства, и стохастические методы обработки информации, позволяющие определить направление прихода звука и выделить его из окружающих фоновых шумов.

Siri услышит вас даже на коктейльной вечеринке
Прототип датчика испытывается в звукопоглощающей комнате,
чтобы исключить эхо и нежелательные фоновые шумы.

После миниатюризации устройство сможет найти применение в управляемой голосом электронике, медицинских приборах, использующих акустические волны, таких, например, как устройства ультразвуковой диагностики, а также в слуховых аппаратах и кохлеарных имплантатах.Доклад о результатах исследований был опубликован в официальном органе Национальной академии наук США Proceedings of the National Academy of Sciences в августе 2015 г.

«Мы изобрели чувствительную систему, способную эффективно, надежно и с небольшими затратами решить интересную проблему, с которой ежедневно сталкивается современная технология, – сказал Абель Се (Abel Xie), аспирант электротехники и вычислительной техники Дюкского университета и ведущий автор исследования. – Мы рассчитываем, что это сможет улучшить характеристики устройств, активируемых голосом, таких как смартфоны и игровые консоли, и одновременно упростить конструкцию системы».

Устройство, доказывающее правильность концепции, немного напоминает толстые пластиковые пчелиные соты, подобно торту разделенные на множество ломтиков. В то время как сверху все отверстия сот выглядят одинаково, их глубина меняется от одного отверстия к другому. Это придает каждому ломтику индивидуальный характер.

«Полости ведут себя как бутылки с содовой, когда вы дуете в их горлышки, – сказал Стив Каммер (Steve Cummer), профессор электро- и вычислительной техники Дюкского университета. – Количество содовой, оставшейся в бутылке, или, в нашем случае, глубина полостей в незначительной, но обнаруживаемой степени влияет на тон производимого ими звука».

Когда звуковая волна достигает устройства, она слегка искажается этими полостями. Искажение имеет специфическую сигнатуру, зависящую от того, через какой ломтик торта она прошла. Воспринятый микрофоном на противоположной стороне торта звук передается в компьютер, который может отделить фоновые шумы, используя уникальность искажений, вносимых каждым элементом.

Siri услышит вас даже на коктейльной вечеринке
Этот опытный образец датчика может разделять звуки,
приходящие одновременно с разных направлений, основываясь
на уникальных искажениях, вносимых тем кусочком
«торта», через который прошел звук.

Свое изобретение исследователи проверили множеством экспериментов, одновременно посылая три одинаковых звука с трех различных направлений. Устройство смогло различать звуки с достоверностью 96.7%.

Несмотря на то, что размеры прототипа составляют 150 мм, ученые уверены, что сумеют воспроизвести его в меньших размерах и встроить в любой предмет нашего обихода. А поскольку датчик изготовлен из пластика и не имеет подвижных частей, он будет очень дешев и надежен.

«Эта концепция может найти применение и за пределами мира потребительской электроники, – сказал Се. – Я думаю, что она может быть внедрена в любое медицинское устройство визуализации, где используются звуковые волны, чтобы не только улучшить существующие датчики, но и создать принципиально новые».

«Владение дополнительной информацией дает возможность повысить качество звука и расширить функциональность таких устройств, как слуховые аппараты и кохлеарные имплантаты. Одной из очевидных задач, требующей решения, является сокращение физических размеров системы. Это очень сложно, но не невозможно, и мы работаем над этим».


  1. Speech Interpretation and Recognition Interface – разработанный для iOS программный интерфейс, обрабатывающий речь при голосовом вводе.
     
  2. Феномен, позволяющий сосредоточить слуховое внимание на одном конкретном раздражителе, отфильтровывая все остальные.

Перевод: AlexAAN по заказу РадиоЛоцман

На английском языке: Helping Siri Hear Through a Cocktail Party

Электронные компоненты. Бесплатная доставка по России
Для комментирования материалов с сайта и получения полного доступа к нашему форуму Вам необходимо зарегистрироваться.
Имя
Фрагменты обсуждения:Полный вариант обсуждения »
  • Чёта я не понял как эта штука устроена. Но тема очень интересна! Если кто-то точно понимает как устроен этот фильтр звуков, поясните другими словами, подробней, чтобы и до меня дошло. Может получится повторить эту конструкцию и протестировать её.
  • Это можно сделать, если использовать два или более микрофонов, вычитающих звук фона из полезного сигнала. Такая технология давно применялась в автомобилях. В телефоне тоже это сделать несложно. Что касается использования специальных микрофонов, то это только готовые. Вряд ли такой можно сделать самому. Если же вас интересуют компактные направленные микрофоны (пушки), то такие тоже уже существуют. Основаны на сканировании зеркальной мембраны лазером и сложных вычислений. Размер такого микрофона может быть не намного больше обычного электретного. Особенность этих микрофонов в том, что диаграммой направленности можно оперативно управлять.
  • может я чего путаю, но по-моему вы про другое. там что-то близкое к наушникам с шумоподавлением - второй микрофон "слушает" шум, который вычитается из основного сигнала. проблема в том, чтобы "навестись" на основной сигнал. в авто это не сложно, т.к. водитель более-менее фиксирован... в статье я понял только про микрофон - он определяет откуда какой звук пришел. но как они далее шум отсекают не очень понято. там должна быть какая-то бодрая математика... над логикой можно гадать, но не думаю, что там простые алгоритмы.
  • ...Несмотря на то, что размеры прототипа составляют 150 мм, ученые уверены, что сумеют воспроизвести его в меньших размерах и встроить в любой предмет нашего обихода... Думаю что они "неожиданно" натолкнутся на такое явление как увеличение частоты настройки таких фильтров с уменьшением их габаритов. В результате будут фильтровать ультразвук. Иначе придется не соты делать, а улиток - сворачивать канал как на некоторых музыкальных инструментах
  • Законно, не? [IMG]http://s008.radikal.ru/i304/1607/2b/cf252050882d.jpg[/IMG]
  • Я понял так. Это не фильтр. Само устройство полностью пассивное, состоит из множества каналов-рупоров. В каждый канал попадает звук преимущественно с одного направления. Все звуки принимаются на один микрофон. Чтобы различать с какого канала пришел звук, каждый канал вносит своё характерное искажение. По моему мнению, по своей своей способности различать направления устройство полностью аналогично рупору. Основная суть изобретения - удешевление конструкции. Вместо десятка микрофонов (по микрофону на каждое направление) используется только один. Вычислительные затраты почти ничего не стоят. Если авторам удастся довести свое изобретение до коммерческого образца, то оно может выглядеть например как блин, в который вставляется iPhone с установленным приложением. Т.е. кроме куска пластмассы никаких затрат. Повторить вряд ли получится: сложная геометрия каналов + ПО. Да и смысла нет. Проще и интереснее, но дороже использовать микрофонную матрицу. Либо совсем дешево, но неинтересно одиночный рупор - куда направил оттуда и слушаешь.
  • Пояснять лучше не выдумывая, а цитатами из оригинала ...В то время как сверху все отверстия сот выглядят одинаково, их глубина меняется от одного отверстия к другому... так что явно не один рупор, а именно акустический фильтр из резонансных трубок
  • Если ссылаться на текст статьи, то наиболее верно можно понять принцип действия устройства по другой цитате: ... Когда звуковая волна достигает устройства, она слегка искажается этими полостями. Искажение имеет специфическую сигнатуру, зависящую от того, через какой ломтик торта она прошла. Воспринятый микрофоном на противоположной стороне торта звук передается в компьютер, который может отделить фоновые шумы, используя уникальность искажений, вносимых каждым элементом... Фраза "на противоположной стороне торта" - неточность перевода. Имеется ввиду "на противоположной стороне ломтика". Т.е. микрофон расположен в центре круглого торта. Из цитаты понятно, что основная функция отверстий не фильтрация, а внесение искажений. А из рисунка видно, что полости широкие по краям и сужаются к центру, т.е. имеют форму рупора. В статье ломтики называются еще как waveguide - волноводы. Т.е. устройство состоит из множества направленных в разные стороны волноводов, если слово рупор не нравится.
  • Кому интересны подробности нашел полный вариант статьи в pdf. [url]https://www.semanticscholar.org/paper/Single-sensor-Multispeaker-Listening-with-Acoustic-Xie-Tsai/197faf0dd2f3921a7fd518cc84f6d9fc68531d5b/pdf[/url] [url]http://www.pnas.org/content/suppl/2015/08/05/1502276112.DCSupplemental/pnas.201502276SI.pdf#nameddest=STXT[/url]
  • Классическое выделение направления с использованием множества микрофонов (микрофонная матрица). [url]http://itakura.kes.tul.cz/zbynek/dwnld/BSI/Gannot1.pdf[/url] [url]http://www.twirpx.com/file/1284006/[/url]
  • Странные выводы - ведь фильтрация и есть внесение частотных искажений
  • Да нравится-нравится Просто "рупор с пространственно-распределённым частотным фильтром" Так пойдёт?
  • Когда-то под фильтром понималось только устройство для выделения желательных (полезных) компонент сигнала и подавления нежелательных. В такой формулировке не пойдет. Выделение полезного компонента выполняет сам рупор, фильтр вносит частотные искажения в принимаемый рупором сигнал. Искажения нужны, чтобы после суммирования сигналов со всех рупоров на одном микрофоне, была возможность снова их разделить. Потом с легкой руки создателей звуковых и графических редакторов понятие фильтра было расширено и под ним стали понимать устройство или часть программы выполняющую обработку сигнала или данных. Например декодеры из сжатых форматов в WAVE в звуковых редакторах часто называют фильтрами. Эффекты в Photoshop тоже называют фильтрами. В такой формулировке пойдет без возражений. Если хочется кратко назвать, ваше определение пойдет.
  • Было бы круто, если бы она еще по-русски научилась общаться на достойном уровне. Но фишка забавная.
Полный вариант обсуждения »