Microsoft представила модель ИИ, работающую на обычных процессорах

Первую открытую 1-битную ИИ-модель можно запустить и на GPU — и все равно она будет экономнее.
Connect world/Shutterstock/FOTODOM

Microsoft Research представила новую ИИ-модель, способную работать на обычных процессорах без необходимости в дорогостоящих видеоускорителях.

В последние годы стали невероятно востребованными большие языковые модели (LLM) — такие как ChatGPT. Однако большинству из них нужны мощные графические процессоры (GPU) для обучения и работы из-за огромных потребностей в вычислительных ресурсах. Это приводит к высоким расходам электроэнергии дата-центрами, что порождает растущую озабоченность на предмет экологичности.

Инженеры Microsoft с коллегой из Университета Китайской академии наук нашли, по их словам, более рациональный способ обработки данных и создали модель, чтобы это доказать.

Огромная часть расхода энергии ИИ обусловлена использованием и хранением весов — обычно в виде 8- или 16-битных чисел с плавающей запятой. Такой подход требует большого объема памяти и процессорных ресурсов, что влечет за собой высокое энергопотребление.

Инновационный подход подразумевает замену чисел с плавающей запятой так называемой 1-битной архитектурой. Все веса LLM принимают значения −1, 0 и 1, что позволяет обойтись простыми операциями сложения и вычитания при обработке — вычислениями, которые легко выполняются на компьютерах с CPU.

Отчет об экспериментах с новой моделью выложен на сервере препринтов arXiv.

  • Эффективность. Модель показала сопоставимую, а в некоторых случаях и лучшую производительность по сравнению с GPU-аналогами аналогичного размера.
  • Энергопотребление. Значительно ниже благодаря упрощенным вычислениям.
  • Память. Требует в разы меньше оперативной памяти.

Для работы модели разработана специальная среда bitnet.cpp, оптимизированная под 1-битную архитектуру. Это открывает возможность запуска ИИ даже на слабых устройствах, таких как ноутбуки или смартфоны.

Если технология подтвердит свою эффективность, это может стать переломным моментом:

  • энергосбережение — снижение нагрузки на дата-центры,
  • конфиденциальность — локальная обработка данных без отправки в облако,
  • доступность — запуск чат-ботов без интернета и дорогих GPU.