M
MercyNews
Home
Back
Alucinações de IA Não São um Bug, Diz Professor de Matemática
Tecnologia

Alucinações de IA Não São um Bug, Diz Professor de Matemática

Habr4d ago
3 min de leitura
📋

Fatos Principais

  • Vladimir Krylov atua como consultor científico da Artezio e é considerado um dos principais especialistas em IA no desenvolvimento de software.
  • Modelos de raciocínio, apesar de seu design avançado, exibem uma taxa de alucinação que é o dobro da dos Grandes Modelos de Linguagem (LLM) padrão.
  • A OpenAI teria iniciado um status de "código vermelho" interno, indicando preocupações internas sobre perder sua liderança para concorrentes como a Google.
  • O futuro da programação está mudando para a "vibe-coding", um estilo que depende de direcionar a IA em vez de escrever código manualmente.
  • A comparação com o cantor de ópera Pavarotti destaca a possível mudança da habilidade técnica para a direção intuitiva na profissão de programador.

O Glitch Inevitável

À medida que a inteligência artificial se integra mais profundamente nos fluxos de trabalho profissionais, um problema persistente permanece: alucinações. De acordo com Vladimir Krylov, professor de matemática e consultor científico na Artezio, essas fabricações não são meros bugs a serem corrigidos, mas características fundamentais de como esses modelos operam.

Em uma entrevista abrangente de final de ano, Krylov, um dos mais proeminentes especialistas de língua russa sobre IA em desenvolvimento, abordou as crescentes preocupações regarding aos Grandes Modelos de Linguagem (LLMs). Ele argumenta que a indústria deve parar de ver as alucinações como erros e começar a entendê-las como uma troca matemática inevitável.

A discussão lança luz sobre as complexas dinâmicas entre grandes players como OpenAI e Google, prevendo simultaneamente uma mudança radical na natureza da própria engenharia de software.

O Paradoxo do Raciocínio

Uma das percepções mais surpreendentes da análise de Krylov diz respeito aos chamados modelos de raciocínio. Esses sistemas avançados, projetados para pensar em problemas passo a passo, estão na verdade mais propensos a gerar informações falsas do que seus predecessores.

Krylov observa que esses modelos específicos alucinam com o dobro da frequência dos LLMs padrão. Esse comportamento contraintuitivo não é uma falha no design, mas uma inevitabilidade matemática inerente à arquitetura desses sistemas de raciocínio.

À medida que esses modelos tentam construir cadeias lógicas complexas, a probabilidade de introduzir erros factuais aumenta, criando um paradoxo onde a IA projetada para ser mais precisa fabrica informações com mais frequência.

"Pavarotti não sabia ler partituras, e isso diz algo sobre o futuro da vibe-coding."

— Vladimir Krylov, Professor de Matemática

A Corrida Corporativa

O cenário competitivo da IA generativa está mudando rapidamente, com consequências significativas para os gigantes da indústria. Krylov destaca que a OpenAI teria declarado um «código vermelho» interno, sinalizando um estado de alerta máximo sobre sua posição competitiva.

Apesar de sua dominância inicial, a análise sugere que a OpenAI está atualmente ficando para trás da Google. Essa mudança de momentum indica que a corrida pela supremacia da IA está longe de acabar, com a Google potencialmente ganhando uma vantagem crítica no próximo ano.

A pressão para inovar está aumentando, impulsionando as empresas a ultrapassar limites enquanto lidam com as limitações inerentes da tecnologia atual.

O Surgimento da Vibe-Coding

A conversa então muda para o futuro da força de trabalho humana, especificamente os programadores. Krylov levanta uma questão provocativa: os desenvolvedores que escrevem código manualmente logo se tornarão uma espécie em extinção?

A resposta parece residir em um novo paradigma apelidado de «vibe-coding». Essa abordagem prioriza a capacidade de direcionar e curar a saída da IA sobre a capacidade de escrever sintaxe do zero.

Pavarotti não sabia ler partituras, e isso diz algo sobre o futuro da vibe-coding.

Usando o lendário cantor de ópera como analogia, Krylov sugere que a proficiência técnica (ler notas) pode se tornar menos valiosa do que a capacidade intuitiva de dirigir a performance (a vibe). O futuro pode pertencer àqueles que conseguem guiar a IA, não apenas àqueles que conseguem escrever o código por si mesmos.

Aprofundamentos

Para aqueles que desejam explorar esses tópicos mais a fundo, Vladimir Krylov é um palestrante regular sobre a aplicação prática de LLMs no desenvolvimento. Ele comanda um canal dedicado, Ai4dev, onde ele detalha conceitos complexos para profissionais.

Seus insights oferecem um roteiro para navegar no terreno que muda rapidamente do desenvolvimento de software, enfatizando a necessidade de adaptabilidade e uma compreensão mais profunda da mecânica da IA.

À medida que a indústria evolui, a distinção entre capacidades humanas e de máquina continua a se dissipar, necessitando uma nova definição do que significa ser um criador na era digital.

Perguntas Frequentes

Por que os modelos de raciocínio alucinam mais que os LLMs padrão?

De acordo com Vladimir Krylov, esta é uma inevitabilidade matemática. À medida que os modelos de raciocínio tentam construir cadeias lógicas complexas para resolver problemas, a complexidade inerente aumenta a probabilidade de gerar informações falsas, resultando em uma taxa de alucinação duas vezes maior que a dos modelos padrão.

Qual é o status atual da corrida de IA entre OpenAI e Google?

O cenário competitivo está se intensificando. Relatórios sugerem que a OpenAI declarou um 'código vermelho' interno por estar ficando para trás da Google. Isso indica uma mudança significativa no momentum onde a Google está atualmente ganhando uma vantagem competitiva.

O que 'vibe-coding' significa para o futuro dos programadores?

'Vibe-coding' refere-se a um fluxo de trabalho onde o programador atua mais como um diretor do que como um escritor. Em vez de escrever manualmente cada linha de código, o desenvolvedor guia a IA para produzir o resultado desejado, priorizando a direção de alto nível sobre a sintaxe técnica.

Quem é Vladimir Krylov?

Vladimir Krylov é professor de matemática e consultor científico na Artezio. Ele é um dos principais especialistas de língua russa sobre a aplicação prática de IA no desenvolvimento de software e palestra regularmente sobre o assunto.

#Artezio#ЛАНИТ#ИИ#нейросети#ai#openai#ai-агенты#llm#ии и машинное обучение#интерпретируемость ии

Continue scrolling for more

IA transforma a pesquisa e as provas matemáticas
Technology

IA transforma a pesquisa e as provas matemáticas

A inteligência artificial está se tornando uma realidade na matemática. Modelos de aprendizado de máquina agora geram teoremas originais, forçando uma reavaliação da pesquisa e do ensino.

Just now
4 min
374
Read Article
AI Helped Me Send 800 Job Applications in a Month
Technology

AI Helped Me Send 800 Job Applications in a Month

Facing a brutal job market, a former CrowdStrike employee turned to artificial intelligence to handle the repetitive work of job hunting, ultimately securing his dream position.

59m
5 min
1
Read Article
LVMH Watch Week: Os Melhores Relógios e a Surpresa da Omega
Lifestyle

LVMH Watch Week: Os Melhores Relógios e a Surpresa da Omega

Da melhor TAG Heuer em anos a um deslumbrante retorno da Omega, a LVMH Watch Week apresentou relógios excepcionais. Veja os destaques do evento de luxo.

1h
3 min
1
Read Article
Ethernet Gigabit por Fios Telefônicos Britânicos: Um Feito Técnico
Technology

Ethernet Gigabit por Fios Telefônicos Britânicos: Um Feito Técnico

Um experimento técnico demonstrou que a fiação telefônica tradicional britânica pode transmitir Ethernet gigabit, desafiando a necessidade de fibra óptica em certos cenários.

1h
5 min
1
Read Article
Menor Robô Autônomo do Mundo Nada na Água
Technology

Menor Robô Autônomo do Mundo Nada na Água

Um novo robô aquático menor que um grão de sal está reescrevendo as regras da robótica. Medindo menos de 1 milímetro, ele nada autonomamente por meses usando apenas luz como fonte de energia.

1h
5 min
2
Read Article
JavaScript Vanilla impulsiona novo calculador de viagens espaciais
Technology

JavaScript Vanilla impulsiona novo calculador de viagens espaciais

Um novo aplicativo web construído com JavaScript Vanilla calcula distâncias e tempos de viagem espacial, demonstrando que linguagens de codificação fundamentais permanecem ferramentas poderosas.

1h
5 min
1
Read Article
Expansão Industrial da China: Vantagem e Desvantagem para a Alemanha
Economics

Expansão Industrial da China: Vantagem e Desvantagem para a Alemanha

Uma fábrica secreta de baterias chinesa na Alemanha mostra como as filosofias de manufatura 'Feito na China' e 'Feito na Alemanha' estão colidindo e se beneficiando mutuamente.

1h
7 min
8
Read Article
O Ascenso da Personalização por IA: Moldando as Conversas Digitais
Technology

O Ascenso da Personalização por IA: Moldando as Conversas Digitais

Um movimento cultural emergente está levando os indivíduos a personalizar suas interações com IA, indo além de respostas genéricas para criar experiências digitais mais personalizadas.

2h
5 min
7
Read Article
Chefe do DeepMind alerta que investimento em IA parece 'bolha'
Technology

Chefe do DeepMind alerta que investimento em IA parece 'bolha'

Chefe do DeepMind da Google, Demis Hassabis, alerta que o atual investimento em IA exibe características de bolha financeira, semelhante a manias passadas.

2h
5 min
7
Read Article
Modetc: Movendo Dotfiles do Espaço do Kernel
Technology

Modetc: Movendo Dotfiles do Espaço do Kernel

Um novo projeto, Modetc, propõe mover os dotfiles do Linux do espaço do kernel para o espaço do usuário, visando melhorar a segurança e a estabilidade do sistema.

3h
4 min
1
Read Article
🎉

You're all caught up!

Check back later for more stories

Voltar ao inicio