ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.

Aravana·2026-05-25·1 мин

🔴 ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

Раньше для генерации изображений брали одну модель, для видео — другую, для редактирования — третью. Китайская лаборатория собрала всё в одну, выложила под открытой лицензией и поставила топ-1 в публичных бенчмарках.

На прошлой неделе ByteDance выложила Lance — мультимодальную модель на 3 миллиарда активных параметров, лицензия Apache 2.0, веса на Hugging Face. Lance умеет описывать и рассуждать про картинки и видео, генерирует их по тексту, редактирует одним промптом. На публичных бенчмарках — лучший балл среди унифицированных моделей: GenEval 0,90, VBench 85,11, GEdit-Bench 7,30.

Запустить можно локально — нужна одна графическая карта с 40 ГБ видеопамяти. Для российских команд это означает сдвиг порога входа в мультимодальный AI: не подписка на закрытый API в долларах, а железо, которое уже стоит в офисе. Когда китайские лаборатории отдают бесплатно то, что у западных — закрытый платный продукт, конкуренция переходит из плоскости «у кого больше денег» в плоскость «у кого быстрее руки».

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #мультимодальность #Китай #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:Telegram X LinkedIn

Как вам материал?

Теги:нейросети LLM модели мультимодальность Китай ИИ технологии AravanaAI

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Anthropic запустил Sonnet 5: модель почти как Opus, но за $2 за миллион токенов

Anthropic выпустил Claude Sonnet 5 — модель для агентов, которая по бенчмаркам приближается к топовому Opus 4.8, но стоит заметно дешевле. Цена со старта: $2 за миллион входящих токенов и $10 за миллион исходящих до 31 августа. Anthropic делает ставку на массовое внедрение агентов.

2026-07-01·1 мин

AI/ML·Срочное

Google запустил Nano Banana 2 Lite: картинка за 4 секунды и $0,034

Google представил Nano Banana 2 Lite — самую быструю и самую дешёвую версию своего генератора картинок: $0,034 за изображение в 1K и 4 секунды на генерацию. Параллельно вышел Gemini Omni Flash для видео — $0,10 за секунду 10-секундного клипа.

2026-07-01·1 мин

AI/ML·Срочное

60% американцев читают AI-сводку вместо того, чтобы кликать по ссылкам

Pew Research: 60% американцев читают AI-сводки в поисковой выдаче, половина пользуется AI-чатами, ChatGPT — у 44% взрослых.

2026-06-19·1 мин