M
MercyNews
Home
Back
Anthropic apresenta a Nova Constituição de Claude com 57 Páginas
Tecnologia

Anthropic apresenta a Nova Constituição de Claude com 57 Páginas

The Verge14h ago
3 min de leitura
📋

Fatos Principais

  • Anthropic publicou uma nova constituição de 57 páginas para seu modelo de IA, Claude, intitulada 'Claude's Constitution'.
  • O documento foi projetado para ser lido pelo próprio modelo de IA, e não por leitores externos, para definir sua identidade central.
  • Esta nova constituição substitui um conjunto anterior de diretrizes publicado em maio de 2023.
  • O framework tem a intenção de ajudar o modelo de IA a entender o raciocínio por trás das regras éticas, e não apenas as regras em si.
  • A constituição aborda especificamente como o modelo deve equilibrar valores conflitantes em situações de alto risco.

Um Novo Blueprint Ético

A Anthropic está redefinindo fundamentalmente o framework ético para seu modelo de IA, Claude. A empresa introduziu um documento novo e abrangente, uma constituição de 57 páginas, projetada para servir como o guia fundamental do modelo.

Esta nova missiva, intitulada "Claude's Constitution," vai além de uma simples lista de regras. É um esforço detalhado para codificar o caráter ético e a identidade central da IA, com o objetivo de moldar como o modelo pensa e responde em cenários complexos.

O documento representa uma evolução significativa da abordagem anterior da empresa, sinalizando um compromisso mais profundo de alinhar o comportamento da IA com os valores humanos.

Das Regras ao Raciocínio

O cerne desta nova iniciativa é uma mudança de filosofia. Onde a constituição anterior, publicada em maio de 2023, era largamente uma lista de diretrizes, a nova versão enfatiza a importância do entendimento.

A Anthropic agora afirma que, para que os modelos de IA estejam verdadeiramente alinhados, eles devem compreender os princípios subjacentes de suas instruções. O objetivo é que o modelo "entenda por que queremos que eles se comportem de certas maneiras, em vez de apenas especificar o que fazer."

Esta abordagem é projetada para equipar a IA a navegar em situações de alto risco e equilibrar valores conflitantes de forma mais eficaz. A constituição não se destina a leitores externos, mas é direcionada diretamente ao próprio modelo.

É importante para os modelos de IA "entender por que queremos que eles se comportem de certas maneiras, em vez de apenas especificar o que fazer."

"É importante para os modelos de IA 'entender por que queremos que eles se comportem de certas maneiras, em vez de apenas especificar o que fazer.'"

— Anthropic

Definindo a Identidade Central da IA

O documento detalha explicitamente as intenções da Anthropic para os valores e o comportamento do modelo. Ele é estruturado para esclarecer o que a empresa considera ser a identidade essencial de Claude.

Ao focar no "caráter ético," a constituição fornece um framework para a tomada de decisões que vai além das regras binárias. Isso é crucial para uma IA que deve operar no mundo nuanceado e frequentemente contraditório da interação humana.

O próprio comprimento de 57 páginas indica a complexidade da tarefa. É uma tentativa de criar um guia robusto e principiado que possa informar as respostas da IA em um amplo espectro de consultas e contextos.

A Evolução do Guia da IA

Esta atualização marca um momento pivotal no desenvolvimento contínuo da segurança e do alinhamento da IA. A transição de uma lista de diretrizes para um framework constitucional abrangente reflete a crescente sofisticação do campo.

As primeiras medidas de segurança da IA frequentemente se concentravam em proibições explícitas. O novo modelo, entretanto, busca instilar um senso de princípio mais profundo, permitindo que a IA aplique seus valores centrais a situações novas para as quais não foi explicitamente programada.

Esta evolução é crítica à medida que os modelos de IA se tornam mais integrados na vida diária e são encarregados de responsabilidades mais complexas. A constituição é um passo proativo para garantir que essas ferramentas poderosas permaneçam úteis e honestas.

Olhando para o Futuro

A introdução da "Claude's Constitution" estabelece um novo padrão para como as empresas de IA abordam o alinhamento de modelos. Ela move a conversa do que uma IA não deve fazer para quem ela deve ser.

Este framework ético detalhado provavelmente influenciará como o modelo será treinado e avaliado no futuro. O foco no raciocínio principiado sobre o seguimento cego de regras pode se tornar um padrão na indústria.

À medida que as capacidades da IA continuam a avançar, os métodos para guiar seu comportamento permanecerão um tópico central de discussão. A nova constituição da Anthropic fornece um exemplo tangível da resposta de uma empresa para este desafio crítico.

Perguntas Frequentes

O que é a Constituição de Claude?

A Constituição de Claude é um novo documento de 57 páginas da Anthropic que descreve o framework ético e os valores centrais para seu modelo de IA, Claude. Ela é projetada para guiar o comportamento do modelo e seu processo de tomada de decisão, particularmente em situações complexas.

Como esta nova constituição é diferente da anterior?

A constituição anterior, lançada em maio de 2023, era principalmente uma lista de diretrizes. A nova constituição foca em explicar o raciocínio por trás dos princípios éticos, com o objetivo de ajudar o modelo de IA a entender 'por que' ele deve se comportar de certas maneiras.

Qual é o público-alvo deste documento?

A constituição é direcionada diretamente ao próprio modelo de IA. Seu propósito é definir o 'caráter ético' e a 'identidade central' de Claude para o processamento interno do modelo, em vez de servir como um documento de face pública.

Continue scrolling for more

IA transforma a pesquisa e as provas matemáticas
Technology

IA transforma a pesquisa e as provas matemáticas

A inteligência artificial está se tornando uma realidade na matemática. Modelos de aprendizado de máquina agora geram teoremas originais, forçando uma reavaliação da pesquisa e do ensino.

Just now
4 min
342
Read Article
Instituto de Política Bitcoin, Fedi e Cornell estudam perspectivas financeiras dos EUA
Cryptocurrency

Instituto de Política Bitcoin, Fedi e Cornell estudam perspectivas financeiras dos EUA

Uma colaboração entre o Instituto de Política Bitcoin, Fedi e Cornell University investigará como os americanos percebem a privacidade financeira em um momento de aumento da regulação.

1h
5 min
0
Read Article
Subsídios Congelados, Comunidades Pagam o Preço
Environment

Subsídios Congelados, Comunidades Pagam o Preço

Em Sauget, Illinois, uma comunidade construída para a poluição, um subsídio de US$ 500.000 para monitorar a qualidade do ar foi abruptamente encerrado. Agora, os residentes ficam com saúde precária e sem prova da fonte.

2h
6 min
6
Read Article
Aplicativo NonUSA lidera loja dinamarquesa em meio a tensões na Groenlândia
Politics

Aplicativo NonUSA lidera loja dinamarquesa em meio a tensões na Groenlândia

Um aplicativo chamado NonUSA alcançou o primeiro lugar na App Store dinamarquesa, impulsionado por declarações políticas sobre a Groenlândia. O app facilita o boicote a produtos americanos.

2h
5 min
6
Read Article
Quão permanente é o ataque de Trump à ação climática?
Politics

Quão permanente é o ataque de Trump à ação climática?

De retirar do Acordo de Paris a banir energia eólica offshore, o presidente Trump lançou um ataque abrangente à política climática. No entanto, muitas de suas ações são reversíveis.

2h
5 min
12
Read Article
Trump anuncia acordo sobre Groenlândia após disputa com a OTAN
Politics

Trump anuncia acordo sobre Groenlândia após disputa com a OTAN

Trump anuncia acordo-quadro sobre Groenlândia e abandona ameaças de invasão após disputa com aliados da OTAN sobre ativismo chinês e russo na região ártica.

2h
5 min
12
Read Article
Adobe apresenta edição de PDF com IA e narração por voz
Technology

Adobe apresenta edição de PDF com IA e narração por voz

Adobe apresenta novos recursos de IA para Acrobat Studio, incluindo edição avançada de PDF, narração por voz e criação automatizada de apresentações. Os recursos estão disponíveis apenas para assinantes pagantes.

2h
5 min
12
Read Article
APL: A Linguagem Que Mudou a Programação Para Sempre
Technology

APL: A Linguagem Que Mudou a Programação Para Sempre

Da sua origem em 1964 à sua encarnação moderna J Software, a APL permanece uma ferramenta poderosa para programação matemática e baseada em arrays. Descubra por que essa linguagem única continua a cativar desenvolvedores décadas após sua criação.

2h
7 min
6
Read Article
Merz declara nova era em Davos
Politics

Merz declara nova era em Davos

Falando a líderes mundiais em Davos, o chanceler alemão Friedrich Merz alertou que a antiga ordem mundial está se desfazendo a um ritmo vertiginoso e estabeleceu prioridades-chave para o futuro.

2h
5 min
12
Read Article
IA desvenda o mistério do momento da Doença de Huntington
Science

IA desvenda o mistério do momento da Doença de Huntington

Um estudo inovador da Universidade de Barcelona usa IA para resolver um mistério de longa data: por que os sintomas da Doença de Huntington aparecem com décadas de diferença em pacientes geneticamente idênticos?

2h
5 min
0
Read Article
🎉

You're all caught up!

Check back later for more stories

Voltar ao inicio