M
MercyNews
Home
Back
AI Hallucinations Are Not a Bug, Says Math Professor
Технологии

AI Hallucinations Are Not a Bug, Says Math Professor

Habr4d ago
3 мин чтения
📋

Key Facts

  • ✓ Vladimir Krylov serves as a scientific consultant for Artezio and is considered a top expert on AI in software development.
  • ✓ Reasoning models, despite their advanced design, exhibit a hallucination rate that is double that of standard Large Language Models.
  • ✓ OpenAI has reportedly initiated a 'code red' status, indicating internal concerns over losing their lead to competitors like Google.
  • ✓ The future of programming is shifting toward 'vibe-coding,' a style that relies on directing AI rather than writing manual code.
  • ✓ The comparison to opera singer Pavarotti highlights the potential shift from technical skill to intuitive direction in the coding profession.

In This Article

  1. The Inevitable Glitch
  2. The Paradox of Reasoning
  3. The Corporate Race
  4. The Rise of Vibe-Coding
  5. Deep Dives

The Inevitable Glitch#

As artificial intelligence integrates deeper into professional workflows, a persistent issue remains: hallucinations. According to Vladimir Krylov, a professor of mathematics and scientific consultant at Artezio, these fabrications are not mere bugs to be patched, but fundamental features of how these models operate.

In a comprehensive year-end interview, Krylov, one of the most prominent Russian-speaking experts on AI in development, addressed the growing concerns regarding Large Language Models (LLPs). He argues that the industry must stop viewing hallucinations as errors and start understanding them as an unavoidable mathematical trade-off.

The discussion sheds light on the complex dynamics between major players like OpenAI and Google, while simultaneously predicting a radical shift in the nature of software engineering itself.

The Paradox of Reasoning#

One of the most startling insights from Krylov’s analysis concerns the so-called reasoning models. These advanced systems, designed to think through problems step-by-step, are actually more prone to generating false information than their predecessors.

Krylov notes that these specific models hallucinate in twice the frequency of standard LLMs. This counterintuitive behavior is not a flaw in the design, but a mathematical inevitability inherent to the architecture of these reasoning systems.

As these models attempt to construct complex logical chains, the probability of introducing factual errors increases, creating a paradox where the AI designed to be more accurate actually fabricates more often.

"Pavarotti did not know how to read sheet music, and this says something about the future of vibe-coding."

— Vladimir Krylov, Professor of Mathematics

The Corporate Race#

The competitive landscape of generative AI is shifting rapidly, with significant consequences for industry giants. Krylov highlights that OpenAI has reportedly declared an internal «code red», signaling a state of high alert regarding their competitive standing.

Despite their early dominance, the analysis suggests that OpenAI is currently lagging behind Google. This shift in momentum indicates that the race for AI supremacy is far from over, with Google potentially gaining a critical edge in the coming year.

The pressure to innovate is mounting, driving companies to push boundaries even as they grapple with the inherent limitations of current technology.

The Rise of Vibe-Coding#

The conversation then pivots to the future of the human workforce, specifically programmers. Krylov poses a provocative question: will developers who write code manually soon become an endangered species?

The answer seems to lie in a new paradigm dubbed «vibe-coding». This approach prioritizes the ability to direct and curate AI output over the ability to write syntax from scratch.

Pavarotti did not know how to read sheet music, and this says something about the future of vibe-coding.

Using the legendary opera singer as an analogy, Krylov suggests that technical proficiency (reading notes) may become less valuable than the intuitive ability to direct the performance (the vibe). The future may belong to those who can guide the AI, not just those who can write the code themselves.

Deep Dives#

For those looking to explore these topics further, Vladimir Krylov is a regular lecturer on the practical application of LLMs in development. He hosts a dedicated channel, Ai4dev, where he breaks down complex concepts for professionals.

His insights offer a roadmap for navigating the rapidly changing terrain of software development, emphasizing the need for adaptability and a deeper understanding of AI mechanics.

As the industry evolves, the distinction between human and machine capabilities continues to blur, necessitating a new definition of what it means to be a creator in the digital age.

#Artezio#ЛАНИТ#ИИ#нейросети#ai#openai#ai-агенты#llm#ии и машинное обучение#интерпретируемость ии

Continue scrolling for more

ИИ преобразует математические исследования и доказательства
Technology

ИИ преобразует математические исследования и доказательства

Искусственный интеллект перешел из статуса непостоянного обещания в реальность, преобразуя математические исследования. Модели машинного обучения теперь генерируют оригинальные теоремы.

Just now
4 min
366
Read Article
Стратегия Google в школах: формирование лояльности к бренду на всю жизнь
Technology

Стратегия Google в школах: формирование лояльности к бренду на всю жизнь

Внутренние документы Google из иска по защите прав детей раскрывают стратегию по вовлечению школьников в свою экосистему для формирования лояльности к бренду на всю жизнь.

8h
5 min
2
Read Article
Ноутбуки Nvidia на Arm бросают вызов Intel Inside
Technology

Ноутбуки Nvidia на Arm бросают вызов Intel Inside

Утечка информации показала, что Lenovo разработала шесть ноутбуков на базе будущих процессоров Nvidia N1 и N1X, что знаменует собой крупный сдвиг на рынке Windows-ноутбуков.

8h
5 min
2
Read Article
Открытый исходный код для автономного вождения расширяется до 325 моделей автомобилей
Technology

Открытый исходный код для автономного вождения расширяется до 325 моделей автомобилей

Платформа с открытым исходным кодом для автономного вождения расширила совместимость до 325 моделей автомобилей от 27 брендов, демократизируя доступ к передовым технологиям помощи водителю.

8h
5 min
2
Read Article
Ford выходит на рынок электрических полуприцепов с моделью F-Line E 2026 года
Automotive

Ford выходит на рынок электрических полуприцепов с моделью F-Line E 2026 года

Ford представит электрический полуприцеп F-Line E на рынке Западной Европы этим летом. Новая модель будет доступна в конфигурациях 4x2 и 6x2 с грузоподъемностью 26 тонн и крутящим моментом до 1820 фунт-футов.

9h
5 min
1
Read Article
ChargePoint расширяет зарядку электромобилей на парковках аренды автомобилей
Technology

ChargePoint расширяет зарядку электромобилей на парковках аренды автомобилей

ChargePoint устанавливает публичные зарядные станции для электромобилей на парковках аренды автомобилей в Висконсине, расширяя доступность зарядки в Эпплтоне и Мэдисоне.

9h
5 min
3
Read Article
Янн Лекун запускает AMI Labs: внутренняя история нового стартапа в области ИИ
Technology

Янн Лекун запускает AMI Labs: внутренняя история нового стартапа в области ИИ

Янн Лекун, пионер в области ИИ, покинул Meta для основания нового стартапа AMI Labs. Проект сосредоточен на разработке передовых мировых моделей для систем искусственного интеллекта.

9h
5 min
3
Read Article
Разработчики Ubisoft выражают глубокое разочарование из-за внутренних проблем
Technology

Разработчики Ubisoft выражают глубокое разочарование из-за внутренних проблем

Разработчики Ubisoft выражают глубокое разочарование и стыд из-за внутренней культуры и направления компании. Настроение, по-видимому, распространено, и сотрудники устали от повторяющихся проблем.

10h
5 min
2
Read Article
Десятилетний мод для The Sims 4 сохраняет поразительную популярность
Technology

Десятилетний мод для The Sims 4 сохраняет поразительную популярность

Десятилетний мод для The Sims 4 с откровенным контентом и полной наготой сохраняет огромную популярность в игровом сообществе, подчеркивая долговременное влияние пользовательских модификаций.

10h
5 min
2
Read Article
Новая модель доходов OpenAI: процент от исходов ИИ-ассистированных исследований и разработок
Technology

Новая модель доходов OpenAI: процент от исходов ИИ-ассистированных исследований и разработок

OpenAI переходит от подписок к разделению доходов: компания будет получать процент от выручки клиентов, созданной с помощью ИИ в R&D. Это меняет правила игры на рынке.

10h
5 min
2
Read Article
🎉

You're all caught up!

Check back later for more stories

На главную