ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

ByteDance выложила Lance — мультимодальную модель на 3 миллиарда параметров под Apache 2.0. Понимает и генерирует картинки и видео, редактирует одним промптом, работает локально на одной карте с 40 ГБ видеопамяти. Лучшие баллы среди унифицированных моделей по GenEval, VBench и GEdit-Bench.

Aravana··1 мин

🔴 ByteDance открыла исходники Lance — одна модель делает картинки, видео и редактирует их

Раньше для генерации изображений брали одну модель, для видео — другую, для редактирования — третью. Китайская лаборатория собрала всё в одну, выложила под открытой лицензией и поставила топ-1 в публичных бенчмарках.

На прошлой неделе ByteDance выложила Lance — мультимодальную модель на 3 миллиарда активных параметров, лицензия Apache 2.0, веса на Hugging Face. Lance умеет описывать и рассуждать про картинки и видео, генерирует их по тексту, редактирует одним промптом. На публичных бенчмарках — лучший балл среди унифицированных моделей: GenEval 0,90, VBench 85,11, GEdit-Bench 7,30.

Запустить можно локально — нужна одна графическая карта с 40 ГБ видеопамяти. Для российских команд это означает сдвиг порога входа в мультимодальный AI: не подписка на закрытый API в долларах, а железо, которое уже стоит в офисе. Когда китайские лаборатории отдают бесплатно то, что у западных — закрытый платный продукт, конкуренция переходит из плоскости «у кого больше денег» в плоскость «у кого быстрее руки».

Этот материал подготовлен командой AI-агентов AravanaAI и проверен главным редактором.

#нейросети #LLM #модели #мультимодальность #Китай #ИИ #технологии #AravanaAI

Тип материала: Пост из Telegram

Поделиться:TelegramXLinkedIn
Как вам материал?

Хотите получать подобные материалы раньше?

Aravana Intelligence — авторская аналитика и закрытый круг для тех, кто думает на шаг вперёд.

Узнать про Intelligence

Не пропускайте важное

Еженедельный дайджест Aravana — ключевые события в AI, робототехнике и longevity.

Похожие материалы

Следующая модель OpenAI уже готова — её держат в «безопасной комнате»

OpenAI завершила предобучение следующей frontier-модели (кодовое имя Spud) ещё 24 марта — сейчас она проходит проверку безопасности. Polymarket даёт 78% шанс на выход до конца апреля.

·1 мин

ByteDance открыл API видеогенератора Seedance 2.0 — звук и картинка вместе с первого кадра

ByteDance открыл публичный API Seedance 2.0 — видеогенератор с нативным звуком, синхронизацией губ и физикой реального мира. До 15 сек на клип, уже работает в Douyin у 600 млн пользователей.

·1 мин

Meta сделала ставку на собственные AI-чипы — 1 гигаватт без NVIDIA

Meta продлила соглашение с Broadcom на производство собственных AI-чипов MTIA до 2029 года и обязалась развернуть 1 гигаватт мощности на техпроцессе 2нм.

·1 мин