M
MercyNews
Home
Back
Qwen от Alibaba обеспечивает работу нового локального браузерного агента
Технологии

Qwen от Alibaba обеспечивает работу нового локального браузерного агента

Hacker News5h ago
3 мин чтения
📋

Ключевые факты

  • Демонстрируется новый локальный браузерный агент, работающий полностью на устройстве в рамках расширения Chrome, на базе технологии Web GPU.
  • Во время демонстрации агент успешно открыл подкаст All in Podcast на YouTube, продемонстрировав практические возможности навигации по веб-интерфейсу.
  • Основу интеллекта агента составляют модели Qwen от Alibaba, объединенные с технологией Liquid LFM для эффективной обработки.
  • Исходный код проекта открыт и доступен на GitHub, что позволяет разработчикам изучить реализацию и внести свой вклад.
  • Уже реализована поддержка мобильных SDK, что расширяет применение технологии за пределы браузерных приложений.
  • Планируется добавить поддержку Web SDK в будущем, что еще больше расширит применимость агента на различных платформах.

Краткое изложение

Появился новый локальный браузерный агент, демонстрирующий растущие возможности прямого запуска сложных ИИ-моделей на устройстве пользователя. Этот шаг представляет собой значительный прогресс в направлении локальной интеллектуальной обработки, не зависящей от облачных серверов.

Агент, работающий в виде расширения Chrome, успешно открыл подкаст All in Podcast на YouTube во время демонстрации. Этот практический пример показывает, как локальный ИИ может взаимодействовать с повседневными веб-приложениями, сохраняя конфиденциальность пользователя и сокращая задержки.

Техническая архитектура

Браузерный агент использует технологию Web GPU для задействования вычислительной мощности графического процессора пользователя непосредственно в среде браузера. Этот подход позволяет выполнять сложные ИИ-операции, которые обычно требуют обработки на стороне сервера, прямо на личном оборудовании.

В основе агента лежат модели Qwen от Alibaba в сочетании с технологией Liquid LFM (Liquid Foundation Models). Это сочетание представляет собой сложный подход к локальной ИИ-обработке, балансируя между требованиями к производительности и ограничениями работы в рамках браузерного расширения.

Архитектура демонстрирует несколько ключевых преимуществ:

  • Полностью локальное выполнение без зависимости от облака
  • Прямая интеграция с браузером через расширение Chrome
  • Ускорение с помощью Web GPU для повышения производительности
  • Сохранение конфиденциальности за счет локальной обработки данных

Демонстрация и возможности

Первая демонстрация была сосредоточена на практическом, реальном приложении: открытии подкаста All in Podcast на YouTube. Эта, на первый взгляд, простая задача на самом деле демонстрирует способность агента понимать намерения пользователя, навигировать по веб-интерфейсам и выполнять команды в среде браузера.

Хотя демонстрация кажется прямолинейной, она представляет собой сложную оркестровку возможностей:

  • Понимание естественного языка запросов пользователя
  • Навигация по браузеру и управление вкладками
  • Интеграция с конкретными веб-сервисами (YouTube)
  • Выполнение в реальном времени в рамках расширения Chrome

Выбор YouTube в качестве платформы для демонстрации особенно уместен, так как это популярное и сложное веб-приложение, требующее специфических паттернов навигации и взаимодействия с интерфейсом.

Разработка и доступность

Проект открыт и доступен через GitHub, где опубликован исходный код локального браузерного агента. Этот открытый подход позволяет разработчикам изучить реализацию, внести улучшения и адаптировать технологию под различные сценарии использования.

Команда разработчиков также расширила область применения проекта за пределы браузерных приложений. Они реализовали поддержку мобильных SDK, что позволяет применять технологию на мобильных устройствах. Этот кросс-платформенный подход демонстрирует приверженность делу доступности локальных ИИ-возможностей в различных вычислительных средах.

В будущем команда планирует добавить поддержку Web SDK. Это предстоящее усовершенствование еще больше расширит применимость агента, потенциально позволяя интегрировать его с более широким спектром веб-приложений и сред разработки.

Широкие последствия

Это развитие отражает растущую тенденцию к децентрализованной ИИ-обработке. По мере повышения эффективности моделей и улучшения аппаратного ускорения возможность запуска сложного ИИ локально становится все более практичной. Этот сдвиг имеет значительные последствия для конфиденциальности пользователя, так как чувствительные данные могут обрабатываться без покидания устройства.

Интеграция моделей Qwen от Alibaba в локальный браузерный агент также подчеркивает глобальный характер ИИ-разработки. В то время как многие локальные ИИ-проекты фокусируются на западных моделях, эта реализация демонстрирует, как различные регионы и компании вносят вклад в экосистему локальной интеллектуальной обработки.

С технической точки зрения успешное использование Web GPU для ИИ-обработки в рамках браузерного расширения представляет собой важную веху. Это показывает, что веб-платформа созревает для поддержки все более сложных приложений, которые ранее были ограничены нативным ПО для настольных компьютеров или облачными сервисами.

Перспективы

Появление этого локального браузерного агента сигнализирует о созревании локальных ИИ-приложений. По мере развития технологии мы можем ожидать появления более сложных агентов, способных справляться с комплексными задачами, сохраняя преимущества конфиденциальности и производительности локальной обработки.

Планы по расширению до поддержки Web SDK вероятно ускорят внедрение, позволяя разработчикам интегрировать эти возможности в свои собственные приложения. Это может привести к появлению нового поколения веб-инструментов с поддержкой ИИ, работающих полностью в браузере пользователя и предлагающих мощный функционал без ущерба для безопасности данных.

Часто задаваемые вопросы

Что такое новый локальный браузерный агент?

Это расширение Chrome, которое запускает ИИ-модели прямо на устройстве пользователя без зависимости от облака. Агент использует технологию Web GPU и модели Qwen от Alibaba для выполнения задач, таких как открытие веб-контента и навигация по браузерным интерфейсам.

Почему это развитие значимо?

Оно демонстрирует практическую локальную ИИ-обработку, которая повышает конфиденциальность пользователя, сохраняя данные на устройстве. Технология также показывает, как сложный ИИ может эффективно работать в стандартных средах браузера с использованием аппаратного ускорения.

Каковы текущие возможности и планы на будущее?

Агент в настоящее время может открывать веб-контент, например видео на YouTube, по командам на естественном языке. Планы на будущее включают добавление поддержки Web SDK, в то время как поддержка мобильных SDK уже доступна, что расширяет применение технологии на различных платформах.

Как разработчики могут получить доступ к этой технологии?

Проект является открытым исходным кодом и доступен на GitHub, что позволяет разработчикам изучить реализацию и внести свой вклад. Команда также выпустила мобильные SDK для более широких возможностей интеграции.

Continue scrolling for more

ИИ преобразует математические исследования и доказательства
Technology

ИИ преобразует математические исследования и доказательства

Искусственный интеллект перешел из статуса непостоянного обещания в реальность, преобразуя математические исследования. Модели машинного обучения теперь генерируют оригинальные теоремы.

Just now
4 min
314
Read Article
GameStop ликвидирует «бесконечный денежный баг» в программе обмена
Economics

GameStop ликвидирует «бесконечный денежный баг» в программе обмена

GameStop ликвидирует «бесконечный денежный баг» в программе обмена, который позволил геймерам получать необычайно высокие значения обмена для определенных игр благодаря ошибке в ценообразовании.

3h
5 min
6
Read Article
BTS Announces Massive 2026-2027 World Tour
Entertainment

BTS Announces Massive 2026-2027 World Tour

After nearly four years away from full-group performances, BTS is returning with a massive 2026-2027 world tour. The tour spans five continents with over 70 shows, beginning in April 2026 in Goyang, South Korea.

3h
5 min
2
Read Article
Доходы Netflix от рекламы достигли $1,5 млрд, ставя цель в $3 млрд
Economics

Доходы Netflix от рекламы достигли $1,5 млрд, ставя цель в $3 млрд

Рекламные доходы Netflix выросли до $1,5 млрд в 2025 году, а компания планирует достичь $3 млрд в 2026 году благодаря популярности плана с поддержкой рекламы.

3h
5 min
6
Read Article
Мэтт Дэймон об оскаровской кампании и «Одиссее» Нолана
Entertainment

Мэтт Дэймон об оскаровской кампании и «Одиссее» Нолана

Мэтт Дэймон поделился мыслями об оскаровской кампании, назвав ее «неправильной», и назвал «Одиссею» Нолана последним большим фильмом на пленке в своей карьере.

3h
5 min
6
Read Article
Международная ассоциация адвокатов обязуется защищать судей Гонконга от санкций США
Politics

Международная ассоциация адвокатов обязуется защищать судей Гонконга от санкций США

Международная ассоциация адвокатов обязуется защищать судей Гонконга от необоснованных санкций США, заявив о своей позиции во время церемониального начала правового года.

3h
5 min
7
Read Article
Администрация Трампа признала, что сотрудники DOGE получили доступ к ограниченным данным SSA
Politics

Администрация Трампа признала, что сотрудники DOGE получили доступ к ограниченным данным SSA

Администрация Трампа признала, что сотрудники Департамента эффективности правительства получили доступ к конфиденциальным данным Администрации социального обеспечения сверх уполномоченных пределов, нарушив протоколы и связавшись с группой, расследующей выборное мошенничество.

3h
5 min
12
Read Article
FTC обжалует решение по делу против Meta, возобновляя исторический антимонопольный процесс
Politics

FTC обжалует решение по делу против Meta, возобновляя исторический антимонопольный процесс

Федеральная торговая комиссия обжалует решение суда 2025 года, отклонившее её антимонопольный иск против Meta, стремясь возобновить исторический вызов приобретениям WhatsApp и Instagram.

3h
5 min
14
Read Article
Netflix анонсирует крупное обновление мобильного интерфейса на 2026 год
Technology

Netflix анонсирует крупное обновление мобильного интерфейса на 2026 год

Netflix готовится запустить полностью переработанный мобильный интерфейс в 2026 году. Это обновление станет основой для долгосрочной стратегии роста компании.

3h
5 min
17
Read Article
Режим «оффлайн» Steam раскрывает точные временные метки входа
Technology

Режим «оффлайн» Steam раскрывает точные временные метки входа

Уязвимость показывает, что режим «оффлайн» Steam скрывает статус только от друзей, но не от серверов, которые сохраняют точные временные метки входа.

3h
5 min
6
Read Article
🎉

You're all caught up!

Check back later for more stories

На главную