M
MercyNews
Home
Back
Wikipedia fecha acordos de treinamento de IA com gigantes da tecnologia
Tecnologia

Wikipedia fecha acordos de treinamento de IA com gigantes da tecnologia

Ars Technica3h ago
3 min de leitura
📋

Fatos Principais

  • A Wikimedia Foundation anunciou acordos de licenciamento com Microsoft, Meta, Amazon, Perplexity e Mistral AI para treinamento de modelos de IA.
  • Esses acordos permitem que empresas de tecnologia usem os 65 milhões de artigos da Wikipédia para treinar modelos de IA como Microsoft Copilot e ChatGPT.
  • Os acordos fazem parte da Wikimedia Enterprise, uma subsidiária comercial que vende acesso de alta velocidade a API para grandes empresas.
  • As receitas dessas parcerias ajudam a compensar os custos de infraestrutura para a organização sem fins lucrativos.
  • A Google havia assinado um acordo com a Wikimedia Enterprise em 2022, estabelecendo o quadro inicial para esses acordos comerciais.
  • A fundação não divulgou os termos financeiros dos acordos com Microsoft, Meta e Amazon.

Uma Nova Era para a Wikipédia

A Wikimedia Foundation entrou em uma fase transformadora de sua estratégia digital, anunciando acordos de licenciamento históricos com algumas das empresas de tecnologia mais poderosas do mundo. Na quinta-feira, a organização sem fins lucrativos revelou acordos com Microsoft, Meta e Amazon, entre outras, para licenciar formalmente o conteúdo da Wikipédia para treinamento de inteligência artificial.

Este desenvolvimento representa uma mudança significativa em relação ao passado, onde essas mesmas empresas raspavam rotineiramente o vasto banco de conhecimento da Wikipédia sem permissão explícita ou compensação. Os acordos sinalizam um relacionamento maduro entre repositórios de conhecimento aberto e a indústria comercial de IA.

Detalhes da Parceria

Os acordos recém-anunciados abrangem cinco grandes empresas de tecnologia: Microsoft, Meta, Amazon, Perplexity e Mistral AI. Essas organizações ingressaram no programa Wikimedia Enterprise, uma subsidiária comercial criada especificamente para gerenciar acordos de licenciamento com usuários comerciais em grande escala.

A Wikimedia Enterprise oferece um serviço premium que fornece acesso à API da Wikipédia com 65 milhões de artigos em velocidades e volumes significativamente maiores do que as APIs públicas gratuitas disponíveis para usuários gerais. Esse acesso premium é essencial para empresas que treinam grandes modelos de linguagem que exigem fluxos de dados massivos e consistentes.

Os termos financeiros desses acordos permanecem confidenciais, pois a fundação optou por não divulgar valores monetários específicos. No entanto, a receita gerada representa uma nova fonte de renda crucial para a organização.

Esses novos parceiros se juntam a uma lista existente que inclui:

  • Google - Assinou um acordo em 2022
  • Ecosia - Empresa de mecanismo de busca menor
  • Nomic - Organização de pesquisa em IA
  • Pleias - Empresa de desenvolvimento de IA
  • ProRata - Empresa de tecnologia
  • Reef Media - Empresa de mídia digital

Por Que Isso Importa

Essa mudança da raspagem não autorizada para o licenciamento formal representa uma mudança de paradigma em como as empresas de IA acessam dados de treinamento. Anteriormente, grandes empresas de tecnologia extraíam o conteúdo da Wikipédia sem compensação, tratando-o como um recurso livremente disponível. Os novos acordos estabelecem uma estrutura comercial que reconhece o valor do conhecimento curado.

Para a Wikimedia Foundation, esses acordos fornecem suporte financeiro essencial para manter e escalar a infraestrutura da Wikipédia. A organização sem fins lucrativos historicamente dependia de pequenas doações públicas para cobrir seus custos operacionais, que incluem manutenção de servidores, desenvolvimento de software e suporte à comunidade.

A receita ajuda a compensar os custos de infraestrutura para a organização sem fins lucrativos, que de outra forma depende de pequenas doações públicas enquanto observa seu conteúdo se tornar um elemento básico de dados de treinamento para modelos de IA.

Os acordos também validam o papel da Wikipédia como um conjunto de dados fundamental para os sistemas de IA modernos. Modelos como Microsoft Copilot e ChatGPT da OpenAI dependem de fontes de informação diversas e precisas, e o conteúdo estruturado e multilíngue da Wikipédia fornece um recurso de treinamento ideal.

O Programa Enterprise

Wikimedia Enterprise representa a resposta estratégica da fundação à crescente demanda comercial por seu conteúdo. Diferente da API gratuita da Wikipédia projetada para desenvolvedores individuais e pequenos projetos, a Enterprise oferece recursos de nível empresarial incluindo limites de taxa mais altos, suporte dedicado e tempo de atividade garantido.

O programa foi projetado especificamente para atender aos requisitos únicos do treinamento de IA em grande escala, onde as empresas precisam processar milhões de artigos repetidamente e rapidamente. Essa capacidade técnica torna o conteúdo da Wikipédia mais acessível para aplicações comerciais, mantendo o compromisso da organização sem fins lucrativos com o conhecimento livre.

O modelo de subsidiária permite que a fundação busque oportunidades comerciais sem comprometer sua missão principal. A receita gerada através da Enterprise apoia diretamente a Wikipédia gratuita e pública que milhões de usuários acessam diariamente.

Principais recursos do programa Enterprise incluem:

  • Acesso de alta velocidade a API para processamento de dados em grande escala
  • Preços baseados em volume para clientes empresariais
  • Suporte técnico dedicado e garantias de serviço
  • Cumprimento de requisitos de uso de dados e licenciamento

Contexto da Indústria

O momento desses acordos reflete a rápida evolução da indústria de IA e sua crescente necessidade de dados de treinamento de alta qualidade. À medida que as empresas desenvolvem modelos de linguagem cada vez mais sofisticados, a demanda por conjuntos de dados confiáveis e abrangentes se intensificou.

Anteriormente, o relacionamento entre desenvolvedores de IA e provedores de conteúdo era em grande parte não regulado, com empresas extraídos dados de várias fontes sem acordos formais. A abordagem da Wikimedia Foundation estabelece um precedente para como projetos de conhecimento aberto podem se engajar com o desenvolvimento comercial de IA.

Este desenvolvimento também destaca o valor econômico do conhecimento curado. Embora o conteúdo da Wikipédia esteja disponível gratuitamente para uso pessoal, sua aplicação comercial para treinamento de IA representa uma oportunidade econômica significativa que pode ajudar a sustentar as operações da plataforma.

Os acordos com Microsoft, Meta e Amazon são particularmente notáveis dada sua escala e influência no setor de IA. Essas empresas operam alguns dos assistentes de IA e modelos de linguagem mais amplamente utilizados do mundo.

Olhando para o Futuro

A negociação bem-sucedida da Wikimedia Foundation de acordos de licenciamento com grandes empresas de tecnologia marca um marco significativo no relacionamento entre conhecimento aberto e desenvolvimento comercial de IA. Este modelo de parceria fornece um caminho sustentável para ambas as partes.

À medida que a indústria de IA continua a se expandir, a demanda por dados de treinamento de alta qualidade provavelmente aumentará. O programa Wikimedia Enterprise posiciona a fundação para atender a essa demanda, mantendo seu compromisso com o conhecimento livre.

Esses acordos também estabelecem um precedente importante para como outros provedores de conteúdo podem abordar o licenciamento com empresas de IA. O sucesso...

#AI#Biz & IT#AI infrastructure#AI training data#Amazon#generative ai#google#jimmy wales#large language models#machine learning#meta#microsoft#Mistral AI#non-profit#Perplexity#Wikimedia Enterprise#Wikimedia Foundation#wikipedia

Continue scrolling for more

IA transforma a pesquisa e as provas matemáticas
Technology

IA transforma a pesquisa e as provas matemáticas

A inteligência artificial está se tornando uma realidade na matemática. Modelos de aprendizado de máquina agora geram teoremas originais, forçando uma reavaliação da pesquisa e do ensino.

Just now
4 min
207
Read Article
My favorite dietitian-approved spritz is just 4 ingredients — and it can be made with or without alcohol
Lifestyle

My favorite dietitian-approved spritz is just 4 ingredients — and it can be made with or without alcohol

Place cinnamon sticks inside the spritz for a festive touch. Rachel Hosie I make a four-ingredient, Aperol-based drink when I host, and it's a true crowd-pleaser. It's a lighter alternative to heavier cocktails, and you can easily make it nonalcoholic. It's also easy to upgrade with festive garnishes, such as rosemary sprigs and cinnamon sticks. For many, the Aperol spritz is reserved for daylight-saving time, falling into the same bucket as loose linen shirts and beach days. Once the clock falls back, the quintessential, three-ingredient summer cocktail — made with Aperol, Prosecco, and sparkling water — seems to go into hibernation. I, however, don't fall into that camp. The bright-orange, refreshing spritz is one of my year-round orders. I've found that with a couple of easy tweaks, an Aperol-based drink can actually be very versatile. My version of the classic recipe has become one of my favorite drinks in the fall and winter months, regardless of whether I'm on the sun-drenched Côte d'Azur or in my native drizzly England. Making the spritz is really easy — and it doesn't even need to contain alcohol I only need four ingredients to make this beverage. Rachel Hosie I've seen various versions of this cocktail online with slightly different ratios and ingredients. In my experience, you don't need to be too strict about it. You can alter the quantities based on your tastes and preferences, but for one simple spritz, I use the following: 2 ounces of Aperol or a nonalcoholic alternative 3 ounces of prosecco or nonalcoholic sparkling wine 2 ounces of apple or cranberry juice 1 ounce of soda water Pour the above ingredients into a glass with plenty of ice, and you're done. There's no shaking required. Although the above measurements yield one cocktail, I've scaled the recipe and served it in a large punch bowl or pitcher when hosting friends at my home. You can make it stronger by adding a splash of alcoholic spiced apple cider or go for a heavier Aperol pour. Just keep in mind that Aperol is a distilled spirit with 11% alcohol content, so even when it's diluted, it's worth being mindful of how many units you're having. To garnish the drink, you can use a sprig of rosemary, cinnamon sticks, dehydrated orange slices, or cranberries. One of my favorite touches is making big ice cubes with an apple slice or a star anise inside. And if you really love a sweet cocktail, coat the rim of your glass with a bit of cinnamon sugar. When enjoyed mindfully, this 'lighter' drink beats out heavier cocktails Whenever I host people at my home, I have the spritz cocktails ready to serve. Rachel Hosie I ran my recipe by dietitian Nichola Ludlam-Raine, who said that my festive spritz is a "lighter, more hydrating option" than many other popular holiday cocktails. As your glass empties, top up your drink with soda water, which Ludlam-Raine explains counteracts alcohol's diuretic effect and helps keep you from getting dehydrated. If you're not drinking at all, swap the Aperol for Crodini or Wilfred's aperitif and the prosecco for a nonalcoholic sparkling wine to create a tasty mocktail. "I would totally drink this myself and recommend it to my patients," Ludlam-Raine told me. "It's a great way of having a tasty drink without feeling like you're missing out if you're not having alcohol." Although Ludlam-Raine said that fruit juice adds flavor and antioxidants, you should be mindful of how much you use to keep your sugar intake in check. This is especially true if you're having multiple … which I always am because this drink is that delicious. Read the original article on Business Insider

1h
3 min
0
Read Article
Amazon is turning Fallout’s post-apocalypse into a reality show
Entertainment

Amazon is turning Fallout’s post-apocalypse into a reality show

Move over Squid Game: another bleak fictional world is being turned into competitive reality television. In the midst of season 2 of Fallout, Amazon has announced a new series called Fallout Shelter. According to a casting call, the show will put competitors inside of Fallout's iconic vaults and then test their survival skills in a recreation of the post-apocalyptic world. Presumably there will be no Deathclaws. Here's the official logline: Set inside Vault-Tec's bomb-proof vaults, Fallout Shelter drops a diverse group of contestants into an immersive, high-stakes world inspired by the games' signature dark humor, retro-futurism, and post … Read the full story at The Verge.

1h
3 min
0
Read Article
This case makes your iPhone feel caseless [Hands-on]
Technology

This case makes your iPhone feel caseless [Hands-on]

Over the years, I have tried 100s of iPhone cases, from rugged cases to leather cases, clear cases, and multifunctional wallet cases. And while these cases have their time and place, I always come back to the same type of case as my favorite: thin iPhone cases. There is just something about keeping the iPhone feeling like an iPhone that makes it enjoyable to use long-term. So when I saw Moft was releasing their new Movas Frame case, I had to give it a try. It was designed to be slim, light, and minimal while still adding protection. I’ve been using it for a few weeks, and here is what you should know. more…

1h
3 min
0
Read Article
Jeep pulls the plug on its $25,000 EV for the US
Automotive

Jeep pulls the plug on its $25,000 EV for the US

A $25,000 electric Jeep won’t happen after all. At least those in the US will likely never get to see it. more…

1h
3 min
0
Read Article
How to claim Verizon's $20 credit for Wednesday's service outage
Technology

How to claim Verizon's $20 credit for Wednesday's service outage

Verizon is offering a very small mea culpa after Wednesday's massive outage, which drew more than 1.5 million reports on Downdetector and lasted hours. The carrier posted on X that it will offer a $20 credit, but customers must redeem it in the myVerizon app. "This credit isn’t meant to make up for what happened. No credit really can," the company wrote. "But it’s a way of acknowledging your time and showing that this matters to us." Incensed customers have largely replied with incredulity, both at the miniscule amount, and that it isn't being applied automatically. Engadget has reached out to Verizon seeking clarity on whether this credit can be claimed by contacting the carrier or only through the app. We will update this piece if we hear back. This article originally appeared on Engadget at https://www.engadget.com/mobile/how-to-claim-verizons-20-credit-for-wednesdays-service-outage-171909695.html?src=rss

1h
3 min
0
Read Article
Placements : les quatre valeurs sûres pour faire fructifier votre portefeuille en 2026
Economics

Placements : les quatre valeurs sûres pour faire fructifier votre portefeuille en 2026

NOS CONSEILS - Le début d’année est le moment idéal pour passer en revue ses placements. Voici des pistes pour réajuster vos allocations et profiter au mieux des secteurs qui feront prospérer votre épargne dans les prochains mois.

1h
3 min
0
Read Article
Sesame Street Encontra Novo Lar no YouTube
Entertainment

Sesame Street Encontra Novo Lar no YouTube

O icônico programa infantil Sesame Street está expandindo sua presença digital com um novo canal oficial no YouTube e YouTube Kids, oferecendo acesso a mais de 100 episódios clássicos.

2h
5 min
7
Read Article
EUA impõem tarifa de 25% sobre chips de IA H200 da Nvidia
Politics

EUA impõem tarifa de 25% sobre chips de IA H200 da Nvidia

A administração Trump formalizou uma tarifa de 25% sobre os chips de IA H200 da Nvidia destinados à China, marcando uma escalada significativa nas restrições comerciais que afetam a indústria de semicondutores.

2h
5 min
6
Read Article
Technology

Fitbit's Evolution: Best Trackers in Google's Era

Fitbit remains a leader in fitness tracking despite Google's acquisition. This guide reviews the best devices, including the Pixel Watch 4 and Inspire 3, and discusses the ongoing transition to Google accounts.

2h
7 min
2
Read Article
🎉

You're all caught up!

Check back later for more stories

Voltar ao inicio