Как я свертки ускорял

Дата публикации: 28-06-2026 04:45:32

После написания статьи про NormIs-1 я решил углубиться в тему оптимизации модели. Архитектура была неплохой и показала адекватные результаты на метриках интеллекта, но скорость сильно проседала. Проблема была в Depthwise Conv, а именно - множестве обращений к памяти. Между блоком внимания и FFN стоял небольшой блок сверток и тормозил все вычисления. Именно его я и решил ускорить. Делать целую языковую модель с полноценным вниманием возможности нет. Проблемы нестабильного обучения, взрывающийся лосс или сломавшийся DataLoader - это все не сегодня. Нет, все будет 'проще' - мелкая CNN + кастомное MLX-ядро для инференса + бенчмарки скорости Читать далее

Схожие новости

#	Наименование новости	Тональность	Информативность	Дата публикации
1	Как желание быстрее читать чужой код превратилось в войну с недетерминизмом LLM	0	5	28-06-2026
2	Как заставить LLM выбирать осмысленные фрагменты из часовой расшифровки: почему «найди интересные моменты» не работает	0	5	28-06-2026
3	Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front	0	7	27-06-2026
4	[Перевод] Структуры данных на практике. Глава 16: Фильтры Блума и вероятностные структуры данных	0	7	28-06-2026
5	Почему Google не индексирует страницы, хотя технически всё в порядке	0	5	28-06-2026
6	ContentCombine: как я сделал мультинишевый контент-комбайн и запустил ежедневный SEO-дайджест	5	7	28-06-2026
7	ИИ раздали — пользоваться не научили. Почему он не окупается	-2	7	22-06-2026
8	[Перевод] Раньше ПО работало шустро, потому что иначе было никак	0	7	28-06-2026
9	В МГУ предложили метод распознавания 3D–объектов с меньшими затратами памяти	5	7	24-06-2026

Классификация: . Схожих патентов: 0. Схожих новостей: 9. Тональность: 0. Информативность: 7. Источник: habr.com.

Просмотр новости

Найдите то, что Вас интересует

Как я свертки ускорял

Дата публикации: 28-06-2026 04:45:32

Схожие новости