M
MercyNews
Home
Back
Sweep lance un modèle open-weights de 1,5B pour l'autocomplétion next-edit
Technologie

Sweep lance un modèle open-weights de 1,5B pour l'autocomplétion next-edit

Hacker News10h ago
3 min de lecture
📋

Points Clés

  • Sweep a publié un modèle open-weights de 1,5B de paramètres spécifiquement conçu pour l'autocomplétion next-edit, une fonctionnalité qui prédit la prochaine modification d'un développeur en se basant sur les changements récents.
  • Le modèle est conçu pour fonctionner localement sur la machine d'un développeur, offrant une alternative respectueuse de la vie privée aux assistants de codage basés sur le cloud tout en maintenant des performances élevées.
  • En test contre des modèles comme Mercury, Zeta et Instinct, le modèle de Sweep a démontré une vitesse et une précision supérieures sur cinq benchmarks différents, incluant des tâches de changements distants et de complétion de code standard.
  • Le processus d'entraînement a suivi une approche en deux étapes : un affinage supervisé sur 100 000 exemples provenant de dépôts sous licence permissive, suivi de 2 000 étapes d'apprentissage par renforcement pour corriger le code non analysable et la verbosité.
  • Une découverte clé durant le développement était qu'un format de bloc simple « original » et « mis à jour » était plus efficace pour le modèle que des diffs unifiés complexes, soulignant l'importance de la structure du prompt pour les petits modèles d'IA.

Une nouvelle ère pour la complétion de code

Le paysage des outils pour développeurs évolue avec l'introduction d'un nouveau modèle d'IA compact conçu pour prédire le prochain mouvement d'un programmeur. Sweep, une entreprise axée sur le développement assisté par IA, a publié un modèle de 1,5B de paramètres spécifiquement entraîné pour l'autocomplétion next-edit. Cette approche diffère considérablement de la complétion de code traditionnelle en analysant le contexte des modifications récentes pour prédire ce qu'un développeur tapera ensuite.

Ce qui distingue ce modèle, c'est sa combinaison d'une petite empreinte et de hautes performances. Il est conçu pour fonctionner localement sur la machine d'une développeur, offrant une alternative respectueuse de la vie privée aux solutions basées sur le cloud. Malgré sa taille, le modèle démontre des capacités qui surpassent des concurrents beaucoup plus grands, rendant l'autocomplétion avancée accessible sans nécessiter de matériel puissant.

Performance et benchmarks

La revendication principale du modèle est son efficacité exceptionnelle. Il est suffisamment petit pour fonctionner localement tout en surpassant des modèles quatre fois plus grands à la fois en vitesse et en précision. Pour valider ces affirmations, les développeurs ont mené des tests rigoureux contre plusieurs modèles établis, dont Mercury (Inception), Zeta (Zed) et Instinct (Continue).

L'évaluation était complète, couvrant cinq benchmarks distincts conçus pour mesurer différents aspects de l'édition de code :

  • Next-edit au-dessus et en dessous du curseur
  • Fonctionnalité Tab-to-jump pour les changements distants
  • Tâches standard de Fill-in-the-Middle (FIM)
  • Tolérance au bruit

À travers ce test, une clé d'insight a émergé : l'exact-match accuracy a été trouvée en corrélation avec la meilleure utilisabilité réelle. Cela est attribué à la nature précise du code, où l'espace des solutions est relativement petit et les erreurs sont coûteuses. La capacité du modèle à prédire l'édition exacte suivante, plutôt qu'une suggestion probabiliste, se traduit directement par une expérience développeur plus efficace.

« Le format verbeux est simplement plus facile à comprendre pour les petits modèles. »

— Équipe de développement de Sweep

L'architecture de la prédiction

L'efficacité du modèle n'est pas seulement le produit de ses données d'entraînement, mais aussi de son architecture sous-jacente. Une découverte surprenante durant le développement était l'importance critique du format du prompt. L'équipe a fait tourner un algorithme génétique sur plus de 30 formats de diff différents pour trouver la manière la plus efficace de présenter les changements de code au modèle.

Le format gagnant s'est avéré remarquablement simple. Au lieu de diffs unifiés complexes, le modèle répond le mieux à des blocs original et mis à jour simples et structurés. Ce format verbeux et structuré est plus facile à analyser et à comprendre pour le petit modèle, conduisant à de meilleures performances. La découverte souligne que pour les modèles d'IA, la clarté de l'entrée peut être aussi importante que le volume des données d'entraînement.

Le format verbeux est simplement plus facile à comprendre pour les petits modèles.

Entraînement et méthodologie

Le modèle a été entraîné en utilisant un processus en deux étapes pour garantir à la fois une connaissance large et une sortie de haute qualité. La phase initiale a impliqué un affinage supervisé (SFT) sur environ 100 000 exemples provenant de dépôts sous licence permissive. Cette étape était computationnellement efficace, nécessitant seulement quatre heures sur un cluster de huit GPU H100.

La deuxième phase, et sans doute la plus critique, a utilisé l'apprentissage par renforcement (RL) pendant 2 000 étapes. Cette étape était spécifiquement conçue pour traiter les cas limites que le SFT seul ne pouvait pas résoudre. Le processus RL a intégré deux mécanismes clés :

  • Vérification d'analyse Tree-sitter pour s'assurer que le code généré est syntaxiquement valide
  • Régularisation de taille pour prévenir les sorties excessivement verbeuses

Cette approche d'entraînement en deux étapes permet au modèle non seulement de prédire les motifs courants, mais aussi de générer du code à la fois analysable et concis, abordant les points de défaillance courants dans le codage assisté par IA.

Open Source et accessibilité

Dans une démarche pour favoriser l'innovation communautaire, les poids du modèle ont été rendus publics. La décision d'open-sourcer les poids est motivée par le désir de permettre le développement d'outils d'autocomplétion rapides et respectueux de la vie privée pour n'importe quel éditeur. Cette approche contraste avec les modèles propriétaires qui sont souvent verrouillés sur des plateformes spécifiques ou nécessitent une connexion internet.

Le modèle est immédiatement accessible via deux canaux principaux :

  • Téléchargement direct depuis Hugging Face pour intégration dans des projets personnalisés
  • Un plugin JetBrains prêt à l'emploi pour un test immédiat dans les IDE populaires

Les développeurs ont explicitement invité la communauté à s'appuyer sur leur travail, encourageant les contributions pour d'autres éditeurs comme VSCode et Neovim. Cette approche ouverte pourrait accélérer l'adoption d'assistants de codage locaux et alimentés par IA sur l'ensemble de l'écosystème des développeurs.

Perspectives

La publication de ce modèle de 1,5B de paramètres marque une étape importante vers la rendre les assistants de codage sophistiqués plus accessibles et efficaces. En prouvant qu'un modèle plus petit, fonctionnant localement, peut surpasser des alternatives basées sur le cloud et plus grandes, Sweep a ouvert la porte à une nouvelle classe d'outils pour développeurs qui privilégient la vitesse, la vie privée et le contrôle de l'utilisateur.

Les points clés sont clairs : l'avenir de la complétion de code ne réside peut-être pas dans des modèles toujours plus grands, mais dans des architectures et des méthodologies d'entraînement plus intelligentes et plus efficaces. À mesure que la communauté commence à expérimenter avec ces poids ouverts, nous pouvons nous attendre à voir une prolifération d'outils innovants qui intègrent la prédiction next-edit dans un large éventail d'environnements de développement, changeant fondamentalement la manière dont les développeurs interagissent avec leur code.

Questions Fréquemment Posées

Quelle est la principale innovation ?

Sweep a développé et open-sourcé un modèle d'IA de 1,5B de paramètres pour l'autocomplétion next-edit. Ce modèle utilise le contexte des modifications récentes d'un développeur pour prédire son prochain changement, visant à améliorer l'efficacité et la précision du codage.

Pourquoi est-ce important ?

Le modèle est important car il combine une petite taille, exécutable localement, avec des performances qui surpassent des modèles quatre fois plus grands. Cela rend l'assistance de codage avancée plus accessible et respectueuse de la vie privée, car elle n'exige pas d'envoyer le code vers un serveur cloud.

Comment les développeurs peuvent-ils utiliser ce modèle ?

Les développeurs peuvent télécharger les poids du modèle directement depuis Hugging Face pour les intégrer dans leurs propres projets. Alternativement, ils peuvent utiliser le modèle immédiatement via le plugin JetBrains disponible, avec le potentiel d'extensions construites par la communauté pour d'autres éditeurs comme VSCode et Neovim.

Continue scrolling for more

L'IA transforme la recherche et les preuves mathématiques
Technology

L'IA transforme la recherche et les preuves mathématiques

L'intelligence artificielle passe d'une promesse à une réalité en mathématiques. Les modèles d'apprentissage génèrent désormais des théorèmes originaux, forçant une réévaluation de la recherche et de l'enseignement.

Just now
4 min
342
Read Article
Football is the biggest thing in America. Chuck Klosterman says that's going to change.
Sports

Football is the biggest thing in America. Chuck Klosterman says that's going to change.

Big time football — like this month's college football championship — is the most dominant force in American culture. It won't always be that way, writer Chuck Klosterman argues in his new book. Set Number: X164821 TK1 Are you ready for some football? Trick question: America is always ready for more football. It's an appetite without end. But writer Chuck Klosterman, who just devoted a book to the sport, says football's dominance will ultimately be its undoing. The notion that football is the biggest force in American culture and entertainment is so ingrained and obvious that it almost seems like something not worth mentioning. Chuck Klosterman feels otherwise: The pop culture writer just devoted an entire book to the sport, and its meaning and importance. But Klosterman also argues that football won't always be the main thing — and that its overwhelming size and scale will be the thing that eventually undermines it. I talked to Klosterman about all of that, as well as topics like the impact of video games on the sport, and why he thinks paying college football players is good for now, and really damaging in the long run. You can hear our entire conversation on my Channels podcast. What follows are edited excerpts from our chat. Peter Kafka: What is the point of a book called "Football" in 2026? Chuck Klosterman: I have been obsessed with sports and football my entire life. And probably 20 years ago, I made an unspoken, abstract decision — at some point, I want to do a book that's just about sports. My initial idea was that it was going to be about basketball, but I realized that's crazy: If you're writing about something that's part of the culture, football is the sport. It's the only one. If someone said to you, "Explain the last half of the 20th century through some idea, some metaphor," football is the thing to pick. It might not be the case for the 21st century, but it is for the end of the 20th century. And it is for the world we live in right now. One of the big changes in sports — and definitely in football — recently is the legalization of sports betting. It's omnipresent. You seem ambivalent-to-positive about it, which is not where I thought you'd end up. CHUCK: Do I think that gambling in this legalized way is bad for society? I would say probably, for all of the predictable reasons — particularly because it's on your phone and you've put your [financial information] in, so the money does not seem real. Even if it was just a situation where you had to feed dollar bills into it, everything would change. You're taking something that's addictive for some people and marrying it to your phone, which is also addictive for some people. It seems like an obvious way to get in trouble. CHUCK: But for football, it is good. Because it adds a different context for conversation about it. When I have a conversation with other dads, we'll talk about sports a lot, and then there'll be this other conversation. About gambling. We're still technically talking about football, but this is a whole different thing. It has a different context, a different meaning. It says more about the person. Some could argue that it's a weird argument for gambling being good. But if we look at football as a form of entertainment, a distraction, something to consume, to occupy yourself — I think gambling does make it more interesting. This is the pitch from the entire sports gambling industry — it improves the game, it adds stakes, it makes it more interesting. You seem to agree. Certainly there are people who feel that way. I think a lot of people I know who do a lot of gambling, they have a sort of mixed feelings about it — I think it does bother them that suddenly the game seems meaningless if they're not gambling on it. But for me, as somebody who doesn't really put money into it, I find it a fascinating thing. Like: Indiana was an eight-and-a-half point favorite [in Monday's college football championship game]. They did not cover. But the meaning of eight-and-a-half points in a spread suggests that the gambling markets believe it will be a blowout. That's different than saying, "I think Indiana's gonna win easily." I find it to be much more intriguing than I would've thought. I was definitely against the idea of sports betting. Ideologically, I thought, "This is bad." And like I say, socially it probably is. But for each individual sport … You argue that football's grip on America will eventually collapse. How will that happen? Football is not just the most popular thing, or just too big to fail. It is too big to stop expanding. It has to constantly get bigger. The financial demands of it, the amount of revenue it has to make, can only go up. The NFL only operates from the position of "How can we stretch out further? Can we even swallow up all the other sports? Can we expand into Europe and all of these things?" And right now, that's a successful thing. The more they make, the more people consume, the more people spend on it —most importantly, the TV networks and streamers who need it. And the depth of caring is so deep. If football went away this fall for whatever reason, people will be like, "What am I gonna bet on? What is my life gonna be like? Who am I? What's my identity if I'm not a fan of this team?" You really saw this during COVID. "We're still playing college football. No one's in their classes, but we gotta play these games. We can't not play them." So it's really brittle, right? It's a system that has to keep going. But I think at some point there is going to be a change. Probably in advertising. It's not that advertising is going to disappear. It's just that what it costs to buy an ad during a football game … it's not going be worth the trade off. So let's say it gets to be a point when Fox or Amazon Prime, or whoever's carrying these games, renegotiates their NFL contract and for the first time, the number doesn't go up. Maybe even the number goes down. [That puts the] NFL's in this weird position — they have to take their best offer. Then the players will say, "There's no way we're going to take less money. There's no way we're going to start playing 22 games just because you're not making enough money from CBS. We're going to strike." Or the owners will be like, "We're going to lock the players out" [because they can't afford to pay them] — like what's happened with baseball. If that happened now, it would be this American calamity, where people would freak out. But as people have less and less of a personal relationship to the game when this happens in the future, they'll be like, "Well, that's an entertaining distraction. I can replace it with something else." Something has to be part of your life for it to be so important that you'll do whatever you can to keep it going. Why will fans have less of a relationship to football? The comparison I use is horse racing. In the 1920s, along with boxing and baseball, it was the biggest sport. And in the 1920s, the average person still had a real relationship to the culture of horses. They had a blue-collar job, and horses were still doing some of the labor. Or their dad had a horse farm. They definitely saw horses all the time. The horse was part of the world in which they lived. That is no longer the case. Now, horse racing is just for people who own horses and people who gamble on it. That's really all it is. My fear is that football's gonna put itself in a position where it's too big. Its tentacles reach too far. And people will say, "Well, I guess we'll choose something else." And when it collapses, something that size collapses hard. It kind of implodes on itself. I'm not one of these people [who complain about capitalism]. But I do think some of the problems of capitalism are easiest seen through sports leagues, which are smaller simulations of society. And what's happening with the way money operates in pro and college football, it seems precarious to me. The financial side's changing in an exponential way. And when society shifts, it's the big things that can't. They're not nimble. The small things can. Read the original article on Business Insider

11m
3 min
0
Read Article
We're siblings who built a 6-figure Turo business in under 2 years. We started with just our mom's car — here's how we scaled up.
Lifestyle

We're siblings who built a 6-figure Turo business in under 2 years. We started with just our mom's car — here's how we scaled up.

Mike and Darlene Person. Courtesy of JDM Whipz Siblings Michael Rumph and Darlene Person built JDM Whipz, a profitable Turo car rental fleet. JDM Whipz grew to 13 vehicles in Atlanta by reinvesting profits and focusing on customer service. Their experience highlights Turo business strategies, challenges, and the importance of planning. This as-told-to essay is based on conversations with Michael Rumph, 60, and Darlene Person, 61, siblings in metro Atlanta who run JDM Whipz, a 13-car Turo fleet. It has been edited for length and clarity. Darlene: For several years, my brother, Mike, and I talked about wanting to go into business together. We considered a few ideas but hadn't settled on one. In February 2022, we rented an Escalade from Turo for a family trip. Almost exactly a year later, we launched our own Turo business, JDM Whipz. By 2024, JDM Whipz was making six figures in profit. We were fascinated by how quickly and easily we'd rented a car from Turo Darlene: Mike dove into research, sending me videos and websites every week. We began meeting on Sundays to discuss launching a Turo business. By January 2023, we had registered the company, and in late February, we went live on Turo, securing our first booking on the same day. I'm a federal government employee, and I still work full-time. Most of my Turo work takes place in the evenings, when I prep cars after my day job. When we started, both of us were balancing full-time jobs. Mike: I'm an IT nerd with 37 years of experience in desktop support, server support, and project management. Now, I'm a full-time Turo project manager. Our first car was a 2016 Toyota Corolla Mike: The Corolla belonged to our mom, who died in June 2022. It's still on the platform; I just had the front end repainted and protective film added. From there, we purchased a 2017 Mazda, a 2017 Chevy Malibu, a 2017 Equinox, and a 2018 Equinox. By the end of our first year, we had 10 cars. We purchased eight with cash and used "creative financing" for the other two, purchasing them with 0% credit cards Today, we have 13 vehicles — we own 12 outright and have one payment on a 2019 Chrysler Pacifica. We've had five cars totaled in the past year, but because I hold a dealer's license and buy vehicles wholesale at auctions, we've been able to replace them and even come out ahead on insurance payouts. The price difference compared to traditional rental companies is huge Mike: Enterprise once quoted me $805 for an SUV from Friday to Sunday. Turo cost us $360 for four days and 600 miles when we rented that Escalade. Darlene: We listed mom's Corolla as a trial, but the first renter kept extending her trip week after week, and it ended up being 2.5 months total. The car was gone, and we had nothing to do, so we said, "Let's add another." From the start, we reinvested every dollar back into the business. That's how we grew to 10 cars in a year. We choose Turo's 60% protection plan: we keep 60%, Turo takes 40%, but our deductible is lower. Hosts can take up to 90% but risk a much higher deductible. Understanding that trade-off is important. Mike: Day-to-day, I'm checking cars in and out, cleaning, handling inspections, and keeping up with competition in the Atlanta market. I left my IT job last April after paying off all my debts. I was breathing and dreaming of Turo at work. Now it's my focus. Darlene: Atlanta is huge, so Mike covers the north side, and I handle the south. We've never had all 13 cars sitting at our homes at once, where we store them. Usually they're rented out, coming back for a day or two before heading out again. I've learned more about cars in these two and a half years than I ever imagined. Turo does national advertising, but we're also exploring our own marketing efforts Darlene: We're obsessed with customer service. Over the years, we've both complained about poor service elsewhere. When we started JDM Whipz, I told Mike, "I want people to feel valued." Our reviews consistently mention exceptional service, which is the most rewarding feedback we receive. Mike: I built JDMWhipz.com because Turo's search doesn't show business names. Our site lets visitors view our entire fleet in one place without having to search. When ready to book, they tap a link that takes them directly to Turo to complete the reservation process. The biggest challenge for new hosts is capital. Ideally, buy or own your first car outright. Read Turo's Terms of Service carefully to understand the responsibilities of both the host and the guest. Another challenge is time Darlene: Most people start Turo while working full-time. You need excellent planning and time management. We learned the hard way: clean a car as soon as it returns. Early on, we'd say, "I'll do it in the morning," and then get a 7 a.m. booking. At 5 a.m., with car washes closed, you're in the driveway scrubbing, photographing, and prepping the car. Now it's a habit: the car comes in, and it gets cleaned. Mike: Revenue now depends on the season and the vehicle. Our Corolla rents for $42 to $46 per day. Some cars earn $800 a month, while others earn $1,200 during peak season in Atlanta, which typically spans from March to September. We're still making six figures in profit a year. Our biggest advice: do your homework Darlene: Check Turo's website for rules, like no cars older than 12 years or with more than 130,000 miles when listed. Watch videos from Turo hosts on YouTube, but vet their advice. Don't be afraid to ask experienced hosts for guidance. Mike and I mentor people all the time; we love helping new hosts succeed. Our long-term goal is to become Atlanta's go-to personal car rental company. We're proud of what we've built — and even prouder to do it together as siblings. Read the original article on Business Insider

12m
3 min
0
Read Article
Politics

World Cup 2026: Could Europe drive a boycott?

Just as it did in Russia 2018 and Qatar 2022, politics is dominating the build up to World Cup 2026. Could discontent with Donald Trump in Europe see football heavyweights united behind such a cause?

13m
3 min
0
Read Article
Le maire de Bordeaux accepte la médiation dans le conflit sur la transparence budgétaire
Politics

Le maire de Bordeaux accepte la médiation dans le conflit sur la transparence budgétaire

Le maire de Bordeaux, Thomas Cazenave, a accepté une médiation proposée par le tribunal pour résoudre un conflit avec l'opposition sur la transparence budgétaire et la divulgation des tableaux de dépenses.

14m
5 min
0
Read Article
Institut de politique Bitcoin, Fedi et Cornell étudient les perspectives américaines sur la confidentialité financière
Cryptocurrency

Institut de politique Bitcoin, Fedi et Cornell étudient les perspectives américaines sur la confidentialité financière

Une collaboration entre l'Institut de politique Bitcoin, Fedi et Cornell étudie les perspectives américaines sur la confidentialité financière à un moment de surveillance réglementaire accrue.

32m
5 min
7
Read Article
Subventions gelées, les communautés en paient le prix
Environment

Subventions gelées, les communautés en paient le prix

Dans l'Illinois, une subvention de 500 000 $ pour surveiller la qualité de l'air a été résiliée, laissant les résidents sans preuves sur les risques sanitaires.

47m
6 min
12
Read Article
L'application NonUSA domine le store danois au cœur des tensions groenlandaises
Politics

L'application NonUSA domine le store danois au cœur des tensions groenlandaises

Une application de boycott américain, NonUSA, est devenue la plus téléchargée au Danemark suite aux déclarations de Donald Trump sur le Groenland, illustrant l'impact du numérique sur la politique.

57m
5 min
12
Read Article
À quel point l'assaut de Trump contre l'action climatique est-il permanent ?
Politics

À quel point l'assaut de Trump contre l'action climatique est-il permanent ?

De l'abandon de l'Accord de Paris à l'interdiction de l'éolien en mer, le président Trump a lancé un assaut complet sur la politique climatique. Pourtant, beaucoup de ses mesures sont réversibles.

1h
5 min
12
Read Article
Trump annonce un cadre pour le Groenland après un différend avec l'OTAN
Politics

Trump annonce un cadre pour le Groenland après un différend avec l'OTAN

Le président Trump annonce un cadre pour un accord sur le Groenland et abandonne les menaces d'invasion après un différend avec l'OTAN sur la réponse à l'activité croissante de la Chine et de la Russie en Arctique.

1h
5 min
12
Read Article
🎉

You're all caught up!

Check back later for more stories

Retour a l'accueil