Интересно ИИ из света: более энергоэффективный и производительный ИИ при помощи оптики

Sepultura_North

Support Gourmet inc
Seller
Ровный
Мес†ный
Регистрация
17 Окт 2015
Сообщения
11.619
Репутация
4.232
Реакции
15.383
BMWRC-news.gif

ИИ из света: более энергоэффективный и производительный ИИ при помощи оптики

26 января, 2024

Исследование показало, как нелинейная оптика может улучшить классификацию изображений.
image

Современные модели искусственного интеллекта (ИИ), использующие миллиарды обучаемых параметров, сталкиваются с проблемой огромных затрат на обучение и развертывание. Модели требуют значительного объема памяти и вычислительных мощностей, доступных только в огромных дата-центрах, потребляющих электроэнергию, сравнимую с потребностями целых городов.
Исследовательское сообщество активно ищет способы оптимизации как вычислительного оборудования, так и алгоритмов машинного обучения для поддержания темпов развития ИИ. Одним из перспективных направлений является оптическая реализация архитектур нейронных сетей, что позволяет существенно снизить потребление энергии.
В новом исследовании, опубликованном в журнале Advanced Photonics, демонстрируется использование распространения света в многомодовых волокнах (multimode fiber, Многомодовое волокно (multimode fiber, MMF)- это тип оптического волокна, используемый для передачи световых сигналов на средние и короткие дистанции. Основное отличие многомодового волокна от одномодового заключается в большем диаметре его сердцевины, который обычно составляет от 50 до 62.5 мкм. Это позволяет передавать свет по нескольким путям или модам, отсюда и название - многомодовое волокно.

Благодаря более широкой сердцевине многомодовые волокна легче соединять и они обеспечивают высокую пропускную способность на относительно коротких дистанциях, что делает их идеальными для использования в локальных сетях, таких как кампусы, здания или группы близко расположенных зданий.
MMF с небольшим числом программируемых параметров для достижения такой же эффективности в задачах классификации изображений, как у полностью цифровых систем в более чем 100 раз большим числом параметров. Такой подход сокращает требования к памяти и уменьшает необходимость в энергоемких вычислительных процессах, сохраняя при этом высокую точность в различных задачах машинного обучения.


Схема эксперимента по программированию оптического распространения для вычислительной задачи.
Пространственный модулятор света (spatial light modulator, SLM) модулирует лазерные импульсы с помощью образца данных, наложенного на фиксированный шаблон программирования. Пучок соединен с многомодовым волокном. Узор после распространения фиксируется камерой. Обучаемый уровень классификации выходных данных вычисляет точность задачи, которая передается обратно в суррогатный алгоритм оптимизации. Алгоритм повышает производительность задачи, исследуя различные параметры программирования и уточняя потенциальные решения.
Основой работы является точный контроль сверхкоротких импульсов в многомодовых волокнах с помощью техники формирования волнового фронта. Такой метод позволяет осуществлять нелинейные оптические вычисления с использованием микроватт средней оптической мощности, что является важным шагом в реализации потенциала оптических нейронных сетей.
Ученые обнаружили, что с помощью небольшой группы параметров можно выбрать определенный набор весов модели из 'банка весов' (Банк весов (Weight Bank) - в оптике это компонент оптических нейросетей и фотонных систем, используемый для манипуляции световыми сигналами при выполнении вычислений и обработке данных. В оптических нейросетях банк весов включает различные способы управления светом, такие как изменение фазы и амплитуды световых волн. Каждое из этих состояний или параметров можно рассматривать как "вес", аналогично весам в традиционных искусственных нейронных сетях, которые определяют важность или вклад каждого входного сигнала в выходной параметр.

В более широких оптических системах банк весов используется для хранения и переключения между разными коэффициентами, определяющими обработку сигналов. Это позволяет оптимизировать системы для разных приложений, от обработки изображений до фотонных вычислений, объединяя принципы машинного обучения с оптическими технологиями для эффективной обработки данных.
Weight Bank), который предоставляет оптика, и использовать его для решения вычислительных задач. Таким образом, мы используем естественные явления в качестве вычислительного оборудования, избегая затрат на производство и эксплуатацию специализированных устройств.

Результаты исследования представляют собой значительный шаг в решении проблем, связанных с растущим спросом на более крупные модели машинного обучения. Ученые открыли путь к созданию энергоэффективных и высокопроизводительных аппаратных решений в сфере ИИ, используя вычислительные возможности распространения света в многомодовых волокнах.
Как показано в эксперименте с нелинейной оптикой, данный вычислительный подход также может быть использован для эффективного программирования различных многомерных нелинейных явлений для выполнения задач машинного обучения, а также для преобразования ресурсоемкой природы существующих моделей искусственного интеллекта
 
Назад
Сверху Снизу