Просмотр новости

Найдите то, что Вас интересует

Как я свертки ускорял

Дата публикации: 28-06-2026 04:45:32

После написания статьи про NormIs-1 я решил углубиться в тему оптимизации модели. Архитектура была неплохой и показала адекватные результаты на метриках интеллекта, но скорость сильно проседала. Проблема была в Depthwise Conv, а именно - множестве обращений к памяти. Между блоком внимания и FFN стоял небольшой блок сверток и тормозил все вычисления. Именно его я и решил ускорить. Делать целую языковую модель с полноценным вниманием возможности нет. Проблемы нестабильного обучения, взрывающийся лосс или сломавшийся DataLoader - это все не сегодня. Нет, все будет 'проще' - мелкая CNN + кастомное MLX-ядро для инференса + бенчмарки скорости Читать далее

Схожие новости

#Наименование новостиТональностьИнформативностьДата публикации
1Как желание быстрее читать чужой код превратилось в войну с недетерминизмом LLM0528-06-2026
2Как заставить LLM выбирать осмысленные фрагменты из часовой расшифровки: почему «найди интересные моменты» не работает0528-06-2026
3Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front0727-06-2026
4[Перевод] Структуры данных на практике. Глава 16: Фильтры Блума и вероятностные структуры данных0728-06-2026
5Почему Google не индексирует страницы, хотя технически всё в порядке0528-06-2026
6ContentCombine: как я сделал мультинишевый контент-комбайн и запустил ежедневный SEO-дайджест5728-06-2026
7ИИ раздали — пользоваться не научили. Почему он не окупается-2722-06-2026
8[Перевод] Раньше ПО работало шустро, потому что иначе было никак0728-06-2026
9В МГУ предложили метод распознавания 3D–объектов с меньшими затратами памяти5724-06-2026

Классификация: . Схожих патентов: 0. Схожих новостей: 9. Тональность: 0. Информативность: 7. Источник: habr.com.