M
MercyNews
Home
Back
Wikipedia заключает сделки по обучению ИИ с технологическими гигантами
Технологии

Wikipedia заключает сделки по обучению ИИ с технологическими гигантами

Ars Technica3h ago
3 мин чтения
📋

Ключевые факты

  • Фонд Wikimedia объявил о лицензионных соглашениях с Microsoft, Meta, Amazon, Perplexity и Mistral AI для обучения моделей ИИ.
  • Эти сделки позволяют технологическим компаниям использовать 65 миллионов статей Википедии для обучения моделей ИИ, таких как Microsoft Copilot и ChatGPT.
  • Соглашения являются частью Wikimedia Enterprise — коммерческой дочерней компании, которая продает доступ к API с высокой скоростью крупным компаниям.
  • Доходы от этих партнерств помогают покрыть инфраструктурные расходы некоммерческой организации.
  • Google ранее подписал сделку с Wikimedia Enterprise в 2022 году, заложив основу для этих коммерческих соглашений.
  • Фонд не раскрыл финансовые условия сделок с Microsoft, Meta и Amazon.

Новая эра для Википедии

Фонд Wikimedia вступил в трансформационную фазу своей цифровой стратегии, объявив о знаковых лицензионных соглашениях с некоторыми из самых мощных технологических компаний мира. В четверг некоммерческая организация раскрыла сделки с Microsoft, Meta и Amazon, среди других, для формального лицензирования контента Википедии для обучения искусственного интеллекта.

Это развитие представляет собой значительный отход от прошлого, когда эти же компании регулярно скрапили обширную базу знаний Википедии без явного разрешения или компенсации. Соглашения сигнализируют о созревании отношений между репозиториями открытых знаний и коммерческой индустрией ИИ.

Детали партнерства

Недавно объявленные сделки охватывают пять крупных технологических компаний: Microsoft, Meta, Amazon, Perplexity и Mistral AI. Эти организации присоединились к программе Wikimedia Enterprise — коммерческой дочерней компании, созданной специально для управления лицензионными соглашениями с крупными коммерческими пользователями.

Wikimedia Enterprise предлагает премиальный сервис, который предоставляет доступ к API к 65 миллионам статей Википедии со значительно более высокими скоростями и объемами, чем бесплатные публичные API, доступные общим пользователям. Этот премиальный доступ необходим для компаний, обучающих большие языковые модели, которые требуют огромных, последовательных потоков данных.

Финансовые условия этих соглашений остаются конфиденциальными, поскольку фонд решил не раскрывать конкретные денежные суммы. Однако генерируемый доход представляет собой критически важный новый источник дохода для организации.

Эти новые партнеры присоединяются к существующему списку, который включает:

  • Google — подписал сделку в 2022 году
  • Ecosia — компания поисковой системы меньшего масштаба
  • Nomic — исследовательская организация ИИ
  • Pleias — компания по разработке ИИ
  • ProRata — технологическая фирма
  • Reef Media — цифровая медиакомпания

Почему это важно

Этот переход от несанкционированного скрапинга к формальному лицензированию представляет собой смену парадигмы в том, как компании ИИ получают доступ к обучающим данным. Ранее крупные технологические фирмы извлекали контент Википедии без компенсации, рассматривая его как свободно доступный ресурс. Новые соглашения устанавливают коммерческую структуру, которая признает ценность курированных знаний.

Для Фонда Wikimedia эти сделки обеспечивают важную финансовую поддержку для поддержания и масштабирования инфраструктуры Википедии. Некоммерческая организация исторически полагалась на небольшие публичные пожертвования для покрытия операционных расходов, которые включают обслуживание серверов, разработку программного обеспечения и поддержку сообщества.

Доходы помогают покрыть инфраструктурные расходы некоммерческой организации, которая в противном случае полагается на небольшие публичные пожертвования, наблюдая, как ее контент становится основой для обучающих данных моделей ИИ.

Соглашения также подтверждают роль Википедии как основного набора данных для современных систем ИИ. Модели, такие как Microsoft Copilot и OpenAI ChatGPT, зависят от разнообразных, точных источников информации, а структурированный, многоязычный контент Википедии обеспечивает идеальный ресурс для обучения.

Программа Enterprise

Wikimedia Enterprise представляет собой стратегический ответ фонда на растущий коммерческий спрос на его контент. В отличие от бесплатного API Википедии, предназначенного для индивидуальных разработчиков и небольших проектов, Enterprise предлагает функции уровня предприятия, включая более высокие лимиты скорости, выделенную поддержку и гарантированное время работы.

Программа была специально разработана для удовлетворения уникальных требований крупномасштабного обучения ИИ, где компаниям необходимо обрабатывать миллионы статей повторно и быстро. Эта техническая возможность делает контент Википедии более доступным для коммерческих приложений, сохраняя при этом приверженность некоммерческой организации свободе знаний.

Модель дочерней компании позволяет фонду преследовать коммерческие возможности без ущерба для его основной миссии. Доходы, генерируемые через Enterprise, напрямую поддерживают бесплатную, публичную Википедию, которую ежедневно посещают миллионы пользователей.

Ключевые особенности программы Enterprise включают:

  • Доступ к API с высокой скоростью для крупномасштабной обработки данных
  • Ценообразование на основе объема для клиентов предприятия
  • Выделенная техническая поддержка и гарантии обслуживания
  • Соблюдение требований к использованию данных и лицензированию

Отраслевой контекст

Сроки этих соглашений отражают быструю эволюцию индустрии ИИ и ее растущую потребность в высококачественных обучающих данных. По мере того как компании разрабатывают все более сложные языковые модели, спрос на надежные, комплексные наборы данных усилился.

Ранее отношения между разработчиками ИИ и поставщиками контента были в основном нерегулируемыми, при этом компании извлекали данные из различных источников без формальных соглашений. Подход Фонда Wikimedia устанавливает прецедент для того, как проекты открытых знаний могут взаимодействовать с коммерческой разработкой ИИ.

Это развитие также подчеркивает экономическую ценность курированных знаний. Хотя контент Википедии свободно доступен для личного использования, его коммерческое применение для обучения ИИ представляет собой значительную экономическую возможность, которая может помочь поддерживать работу платформы.

Соглашения с Microsoft, Meta и Amazon особенно примечательны с учетом их масштаба и влияния в секторе ИИ. Эти компании управляют некоторыми из самых широко используемых в мире ассистентов ИИ и языковых моделей.

Взгляд в будущее

Успешные переговоры Фонда Wikimedia о лицензионных сделках с крупными технологическими компаниями отмечают значительную веху в отношениях между открытыми знаниями и коммерческой разработкой ИИ. Эта модель партнерства обеспечивает устойчивый путь вперед для обеих сторон.

По мере расширения индустрии ИИ спрос на высококачественные обучающие данные, вероятно, будет расти. Программа Wikimedia Enterprise позиционирует фонд для удовлетворения этого спроса, сохраняя при этом свою приверженность свободе знаний.

Эти соглашения также устанавливают важный прецедент для того, как другие поставщики контента могут подходить к лицензированию с компаниями ИИ. Успех Key Facts: 1. Фонд Wikimedia объявил о лицензионных соглашениях с Microsoft, Meta, Amazon, Perplexity и Mistral AI для обучения моделей ИИ. 2. Эти сделки позволяют технологическим компаниям использовать 65 миллионов статей Википедии для обучения моделей ИИ, таких как Microsoft Copilot и ChatGPT. 3. Соглашения являются частью Wikimedia Enterprise — коммерческой дочерней компании, которая продает доступ к API с высокой скоростью крупным компаниям. 4. Доходы от этих партнерств помогают покрыть инфраструктурные расходы некоммерческой организации. 5. Google ранее подписал сделку с Wikimedia Enterprise в 2022 году, заложив основу для этих коммерческих соглашений. 6. Фонд не раскрыл финансовые условия сделок с Microsoft, Meta и Amazon. FAQ: Q1: Что является главным событием? A1: Фонд Wikimedia подписал лицензионные сделки с Microsoft, Meta, Amazon, Perplexity и Mistral AI. Эти соглашения позволяют этим технологическим компаниям использовать контент Википедии для обучения своих моделей ИИ через программу Wikimedia Enterprise. Q2: Почему это значимо? A2: Это означает переход от предыдущих практик, когда компании скрапили Википедию без разрешения. Сделки обеспечивают новый источник дохода для некоммерческой организации для покрытия инфраструктурных расходов, одновременно устанавливая формальную структуру для компаний ИИ для доступа к высококачественным обучающим данным. Q3: Что произойдет дальше? A3: Программа Wikimedia Enterprise продолжит предоставлять премиальный доступ к API этим компаниям и, возможно, другим. Генерируемый доход будет поддерживать инфраструктуру Википедии и бесплатные публичные услуги, устанавливая при этом прецедент для того, как проекты открытых знаний могут взаимодействовать с коммерческой разработкой ИИ.

#AI#Biz & IT#AI infrastructure#AI training data#Amazon#generative ai#google#jimmy wales#large language models#machine learning#meta#microsoft#Mistral AI#non-profit#Perplexity#Wikimedia Enterprise#Wikimedia Foundation#wikipedia

Continue scrolling for more

ИИ преобразует математические исследования и доказательства
Technology

ИИ преобразует математические исследования и доказательства

Искусственный интеллект перешел из статуса непостоянного обещания в реальность, преобразуя математические исследования. Модели машинного обучения теперь генерируют оригинальные теоремы.

Just now
4 min
207
Read Article
My favorite dietitian-approved spritz is just 4 ingredients — and it can be made with or without alcohol
Lifestyle

My favorite dietitian-approved spritz is just 4 ingredients — and it can be made with or without alcohol

Place cinnamon sticks inside the spritz for a festive touch. Rachel Hosie I make a four-ingredient, Aperol-based drink when I host, and it's a true crowd-pleaser. It's a lighter alternative to heavier cocktails, and you can easily make it nonalcoholic. It's also easy to upgrade with festive garnishes, such as rosemary sprigs and cinnamon sticks. For many, the Aperol spritz is reserved for daylight-saving time, falling into the same bucket as loose linen shirts and beach days. Once the clock falls back, the quintessential, three-ingredient summer cocktail — made with Aperol, Prosecco, and sparkling water — seems to go into hibernation. I, however, don't fall into that camp. The bright-orange, refreshing spritz is one of my year-round orders. I've found that with a couple of easy tweaks, an Aperol-based drink can actually be very versatile. My version of the classic recipe has become one of my favorite drinks in the fall and winter months, regardless of whether I'm on the sun-drenched Côte d'Azur or in my native drizzly England. Making the spritz is really easy — and it doesn't even need to contain alcohol I only need four ingredients to make this beverage. Rachel Hosie I've seen various versions of this cocktail online with slightly different ratios and ingredients. In my experience, you don't need to be too strict about it. You can alter the quantities based on your tastes and preferences, but for one simple spritz, I use the following: 2 ounces of Aperol or a nonalcoholic alternative 3 ounces of prosecco or nonalcoholic sparkling wine 2 ounces of apple or cranberry juice 1 ounce of soda water Pour the above ingredients into a glass with plenty of ice, and you're done. There's no shaking required. Although the above measurements yield one cocktail, I've scaled the recipe and served it in a large punch bowl or pitcher when hosting friends at my home. You can make it stronger by adding a splash of alcoholic spiced apple cider or go for a heavier Aperol pour. Just keep in mind that Aperol is a distilled spirit with 11% alcohol content, so even when it's diluted, it's worth being mindful of how many units you're having. To garnish the drink, you can use a sprig of rosemary, cinnamon sticks, dehydrated orange slices, or cranberries. One of my favorite touches is making big ice cubes with an apple slice or a star anise inside. And if you really love a sweet cocktail, coat the rim of your glass with a bit of cinnamon sugar. When enjoyed mindfully, this 'lighter' drink beats out heavier cocktails Whenever I host people at my home, I have the spritz cocktails ready to serve. Rachel Hosie I ran my recipe by dietitian Nichola Ludlam-Raine, who said that my festive spritz is a "lighter, more hydrating option" than many other popular holiday cocktails. As your glass empties, top up your drink with soda water, which Ludlam-Raine explains counteracts alcohol's diuretic effect and helps keep you from getting dehydrated. If you're not drinking at all, swap the Aperol for Crodini or Wilfred's aperitif and the prosecco for a nonalcoholic sparkling wine to create a tasty mocktail. "I would totally drink this myself and recommend it to my patients," Ludlam-Raine told me. "It's a great way of having a tasty drink without feeling like you're missing out if you're not having alcohol." Although Ludlam-Raine said that fruit juice adds flavor and antioxidants, you should be mindful of how much you use to keep your sugar intake in check. This is especially true if you're having multiple … which I always am because this drink is that delicious. Read the original article on Business Insider

1h
3 min
0
Read Article
Amazon is turning Fallout’s post-apocalypse into a reality show
Entertainment

Amazon is turning Fallout’s post-apocalypse into a reality show

Move over Squid Game: another bleak fictional world is being turned into competitive reality television. In the midst of season 2 of Fallout, Amazon has announced a new series called Fallout Shelter. According to a casting call, the show will put competitors inside of Fallout's iconic vaults and then test their survival skills in a recreation of the post-apocalyptic world. Presumably there will be no Deathclaws. Here's the official logline: Set inside Vault-Tec's bomb-proof vaults, Fallout Shelter drops a diverse group of contestants into an immersive, high-stakes world inspired by the games' signature dark humor, retro-futurism, and post … Read the full story at The Verge.

1h
3 min
0
Read Article
This case makes your iPhone feel caseless [Hands-on]
Technology

This case makes your iPhone feel caseless [Hands-on]

Over the years, I have tried 100s of iPhone cases, from rugged cases to leather cases, clear cases, and multifunctional wallet cases. And while these cases have their time and place, I always come back to the same type of case as my favorite: thin iPhone cases. There is just something about keeping the iPhone feeling like an iPhone that makes it enjoyable to use long-term. So when I saw Moft was releasing their new Movas Frame case, I had to give it a try. It was designed to be slim, light, and minimal while still adding protection. I’ve been using it for a few weeks, and here is what you should know. more…

1h
3 min
0
Read Article
Jeep pulls the plug on its $25,000 EV for the US
Automotive

Jeep pulls the plug on its $25,000 EV for the US

A $25,000 electric Jeep won’t happen after all. At least those in the US will likely never get to see it. more…

1h
3 min
0
Read Article
How to claim Verizon's $20 credit for Wednesday's service outage
Technology

How to claim Verizon's $20 credit for Wednesday's service outage

Verizon is offering a very small mea culpa after Wednesday's massive outage, which drew more than 1.5 million reports on Downdetector and lasted hours. The carrier posted on X that it will offer a $20 credit, but customers must redeem it in the myVerizon app. "This credit isn’t meant to make up for what happened. No credit really can," the company wrote. "But it’s a way of acknowledging your time and showing that this matters to us." Incensed customers have largely replied with incredulity, both at the miniscule amount, and that it isn't being applied automatically. Engadget has reached out to Verizon seeking clarity on whether this credit can be claimed by contacting the carrier or only through the app. We will update this piece if we hear back. This article originally appeared on Engadget at https://www.engadget.com/mobile/how-to-claim-verizons-20-credit-for-wednesdays-service-outage-171909695.html?src=rss

1h
3 min
0
Read Article
Placements : les quatre valeurs sûres pour faire fructifier votre portefeuille en 2026
Economics

Placements : les quatre valeurs sûres pour faire fructifier votre portefeuille en 2026

NOS CONSEILS - Le début d’année est le moment idéal pour passer en revue ses placements. Voici des pistes pour réajuster vos allocations et profiter au mieux des secteurs qui feront prospérer votre épargne dans les prochains mois.

1h
3 min
0
Read Article
Улица Сезам находит новый дом на YouTube
Entertainment

Улица Сезам находит новый дом на YouTube

Улица Сезам запустила официальный канал на YouTube и YouTube Kids с более чем 100 классическими эпизодами. Это расширяет цифровую доступность культовой детской программы для семей по всему миру.

2h
5 min
7
Read Article
США вводят 25% пошлину на чипы Nvidia H200 для ИИ
Politics

США вводят 25% пошлину на чипы Nvidia H200 для ИИ

Администрация Трампа официально ввела 25% пошлину на чипы Nvidia H200 для ИИ, предназначенные для Китая, что представляет собой значительную эскалацию торговых ограничений, затрагивающих отрасль полупроводников.

2h
5 min
6
Read Article
Technology

Fitbit's Evolution: Best Trackers in Google's Era

Fitbit remains a leader in fitness tracking despite Google's acquisition. This guide reviews the best devices, including the Pixel Watch 4 and Inspire 3, and discusses the ongoing transition to Google accounts.

2h
7 min
2
Read Article
🎉

You're all caught up!

Check back later for more stories

На главную