M
MercyNews
Home
Back
Anthropic Unveils Claude's New 57-Page Constitution
Технологии

Anthropic Unveils Claude's New 57-Page Constitution

Anthropic is overhauling Claude's foundational document. The new 57-page constitution aims to define the AI's ethical character and core identity, moving beyond simple rules to explain the 'why' behind its behavior.

The Verge10h ago
3 мин чтения
📋

Quick Summary

  • 1Anthropic has released a new 57-page document titled 'Claude's Constitution' to guide the AI model's behavior.
  • 2This new constitution replaces a previous set of guidelines from May 2023, focusing on explaining the reasoning behind ethical rules.
  • 3The document is designed to define Claude's 'ethical character' and 'core identity' for high-stakes situations.
  • 4The framework aims to help the AI model understand why it should behave in certain ways, rather than just listing prohibitions.

Contents

A New Ethical BlueprintFrom Rules to ReasoningDefining AI's Core IdentityThe Evolution of AI GuidanceLooking Ahead

A New Ethical Blueprint#

Anthropic is fundamentally redefining the ethical framework for its AI model, Claude. The company has introduced a comprehensive new document, a 57-page constitution, designed to serve as the model's foundational guide.

This new missive, titled "Claude's Constitution," moves beyond a simple list of rules. It is a detailed effort to codify the AI's ethical character and core identity, aiming to shape how the model thinks and responds in complex scenarios.

The document represents a significant evolution from the company's previous approach, signaling a deeper commitment to aligning AI behavior with human values.

From Rules to Reasoning#

The core of this new initiative is a shift in philosophy. Where the previous constitution, published in May 2023, was largely a list of guidelines, the new version emphasizes the importance of understanding.

Anthropic now asserts that for AI models to be truly aligned, they must grasp the underlying principles of their instructions. The goal is for the model to "understand why we want them to behave in certain ways rather than just specifying what to do."

This approach is designed to equip the AI to navigate high-stakes situations and balance conflicting values more effectively. The constitution is not intended for outside readers but is aimed directly at the model itself.

It is important for AI models to "understand why we want them to behave in certain ways rather than just specifying what to do."

"It is important for AI models to "understand why we want them to behave in certain ways rather than just specifying what to do.""
— Anthropic

Defining AI's Core Identity#

The document explicitly details Anthropic's intentions for the model's values and behavior. It is structured to spell out what the company considers to be Claude's essential identity.

By focusing on "ethical character," the constitution provides a framework for decision-making that goes beyond binary rules. This is crucial for an AI that must operate in the nuanced and often contradictory world of human interaction.

The 57-page length itself indicates the complexity of the task. It is an attempt to create a robust, principled guide that can inform the AI's responses across a wide spectrum of queries and contexts.

The Evolution of AI Guidance#

This update marks a pivotal moment in the ongoing development of AI safety and alignment. The transition from a list of guidelines to a comprehensive constitutional framework reflects the growing sophistication of the field.

Early AI safety measures often focused on explicit prohibitions. The new model, however, seeks to instill a deeper sense of principle, allowing the AI to apply its core values to novel situations it was not explicitly programmed for.

This evolution is critical as AI models become more integrated into daily life and are tasked with more complex responsibilities. The constitution is a proactive step toward ensuring these powerful tools remain helpful and honest.

Looking Ahead#

The introduction of "Claude's Constitution" sets a new benchmark for how AI companies approach model alignment. It moves the conversation from what an AI should not do, to who it should be.

This detailed ethical framework will likely influence how the model is trained and evaluated in the future. The focus on principled reasoning over rote rule-following could become a standard in the industry.

As AI capabilities continue to advance, the methods for guiding their behavior will remain a central topic of discussion. Anthropic's new constitution provides a tangible example of one company's answer to this critical challenge.

Frequently Asked Questions

Claude's Constitution is a new 57-page document from Anthropic that outlines the ethical framework and core values for its AI model, Claude. It is designed to guide the model's behavior and decision-making process, particularly in complex situations.

The previous constitution, released in May 2023, was primarily a list of guidelines. The new constitution focuses on explaining the reasoning behind ethical principles, aiming to help the AI model understand 'why' it should behave in certain ways.

The constitution is aimed directly at the AI model itself. Its purpose is to define Claude's 'ethical character' and 'core identity' for the model's internal processing, rather than serving as a public-facing document.

Continue scrolling for more

ИИ преобразует математические исследования и доказательства
Technology

ИИ преобразует математические исследования и доказательства

Искусственный интеллект перешел из статуса непостоянного обещания в реальность, преобразуя математические исследования. Модели машинного обучения теперь генерируют оригинальные теоремы.

Just now
4 min
338
Read Article
Тибо Брие: Импульсивное сердце французского гандбола
Sports

Тибо Брие: Импульсивное сердце французского гандбола

Тибо Брие превратился из многообещающего таланта в незаменимого игрока сборной Франции по гандболу. Его уникальная смесь интенсивности и мастерства делает его игроком, за которым стоит следить.

10m
5 min
6
Read Article
Wildberries расширяет функцию обобщения отзывов с помощью нейронной сети
Technology

Wildberries расширяет функцию обобщения отзывов с помощью нейронной сети

Wildberries расширила функцию обобщения отзывов с помощью нейронной сети для большинства пользователей приложения. ИИ-система автоматически извлекает ключевые характеристики товара из свежих отзывов, чтобы помочь покупателям быстрее принимать решения.

20m
5 min
5
Read Article
Европа рассматривает ответные меры на угрозы тарифов США
Politics

Европа рассматривает ответные меры на угрозы тарифов США

Европейские бизнес-группы призвали ЕС рассмотреть контрмеры в ответ на угрозы тарифов США, что сигнализирует о возможной эскалации трансатлантических торговых напряжений.

22m
5 min
6
Read Article
Джеффри Динг: Настоящая гонка ИИ — не об ИИ общего назначения
Technology

Джеффри Динг: Настоящая гонка ИИ — не об ИИ общего назначения

Ведущий эксперт утверждает, что реальная конкуренция в области ИИ заключается не в гонке за AGI, а в том, насколько быстро нации распространят существующие инструменты ИИ по своим экономикам.

23m
5 min
7
Read Article
Налог на высокие доходы во Франции недобирает €1 миллиард
Politics

Налог на высокие доходы во Франции недобирает €1 миллиард

Новый французский налог на высокие доходы, по прогнозам, принесет на €1 миллиард меньше, чем ожидалось, из-за того, что состоятельные налогоплательщики ускорили выплату дивидендов до крайнего срока.

31m
5 min
8
Read Article
Энергетический парадокс ИИ: почему возобновляемые источники могут победить
Environment

Энергетический парадокс ИИ: почему возобновляемые источники могут победить

МЭА снизило прогноз роста возобновляемой энергетики на 5% на 2025–2030 годы, отражая изменение настроений и политики. Ископаемое топливо служит временной «опорой», а ИИ может ускорить переход к чистой энергии.

37m
5 min
6
Read Article
H&R Block 2026: Save 20% & Get $4,000 Advance
Economics

H&R Block 2026: Save 20% & Get $4,000 Advance

Tax season brings significant opportunities for savings. H&R Block is offering up to 20% off tax preparation services and refund advance loans up to $4,000 for the 2026 filing period.

38m
5 min
2
Read Article
Таиланд планирует регулирование криптовалютных ETF на фоне роста институционального интереса
Cryptocurrency

Таиланд планирует регулирование криптовалютных ETF на фоне роста институционального интереса

Комиссия по ценным бумагам и биржам Таиланда разрабатывает комплексные правила для криптовалютных ETF и фьючерсной торговли, чтобы позиционировать страну как главный региональный центр для институциональных криптоинвестиций в Юго-Восточной Азии.

41m
5 min
6
Read Article
Будущее Ниццы: Дебаты о казармах Овар
Politics

Будущее Ниццы: Дебаты о казармах Овар

Политические дебаты в Ницце: 30 000 кв. м в центре города освобождаются. Кандидаты предлагают превратить бывшие казармы Овар в культурный центр, спортивный объект или олимпийскую деревню.

43m
5 min
6
Read Article
🎉

You're all caught up!

Check back later for more stories

На главную