banner

Blog

Aug 20, 2023

Stack Overflow : quelle est l'ampleur de la baisse du trafic et comment la « grève » du modérateur a été résolue ? DEVCLASS

Stack Overflow, le site Web vers lequel les développeurs se tournent fréquemment pour obtenir des conseils sur les problèmes de codage, a déclaré que la baisse de trafic, liée à la concurrence des assistants IA, a été exagérée, même si notre analyse suggère qu'elle reste significative. La société a cependant en grande partie résolu sa grève des modérateurs, déclenchée en raison de problèmes liés au contenu généré par l'IA.

Il y a eu divers rapports faisant état d'une baisse du trafic, y compris le nôtre, car les développeurs utilisent la commodité des assistants de codage intégrés à l'éditeur pour résoudre les problèmes. La société affirme désormais que les analyses les plus extrêmes, montrant des baisses de 35 à 50 pour cent, étaient incorrectes et causées par des modifications apportées à sa configuration Google Analytics.

« Cette année, dans l'ensemble, nous constatons en moyenne environ 5 % de trafic en moins par rapport à 2022 », a déclaré Des Darilek, directeur de la gestion des produits. Pourtant, elle a également reconnu qu'en avril, le trafic avait diminué de 14 %, attribué aux « développeurs essayant GPT-4 », le moteur OpenAI de la société qui alimente également GitHub Copilot. Il y a donc une baisse, même si certains rapports l'ont exagérée.

Une autre façon de voir les choses est de compter le nombre de questions posées. Ce rapport montre que les nouvelles questions ont diminué depuis l'année dernière ; et nous avons suivi avec notre propre requête SEDE (Stack Exchange Data Explorer) montrant qu'avril n'était pas ponctuel. Sur un an, avril est en baisse de 22,5%, mai de 25,6%, juin de 24,5% et juillet de 22,2%, selon les questions posées.

La solution espérée par Stack Overflow est un nouveau service en préparation appelé OverflowAI, ainsi que quelque chose de peut-être plus important, un complément Visual Studio Code qui pourrait rivaliser avec la commodité de Copilot – bien que son objectif soit différent car il n'insérera pas directement de code.

La bonne nouvelle pour l’entreprise est que la « grève » des modérateurs est en grande partie terminée et que les relations entre le personnel et les modérateurs bénévoles se sont améliorées. Le problème clé, décrit dans une lettre ouverte, était que les modérateurs n'étaient pas autorisés à supprimer les réponses aux questions techniques lorsque la raison de la suppression était qu'elles étaient générées par l'IA. Les modérateurs ont fait valoir que de telles réponses sont sujettes à « des informations incorrectes et au plagiat ».

La possibilité de réponses incorrectes est un problème inhérent à l'IA générative, utilisée par ChatGPT d'Open AI, Bard de Google et d'autres systèmes similaires. L’IA générative est forte dans le sens de sa capacité à créer des réponses fluides à la question posée, mais il n’y a aucune garantie d’exactitude. La FAQ de GitHub Copilot, par exemple, indique que « le code public peut contenir des modèles de codage non sécurisés, des bogues ou des références à des API ou des idiomes obsolètes. Lorsque GitHub Copilot synthétise des suggestions de code basées sur ces données, il peut également synthétiser du code contenant ces modèles indésirables.

Le résultat des négociations a été que Stack Exchange (la société derrière Stack Overflow) a accepté d'autoriser la suppression de contenu sur la base « d'un seul indicateur fort d'utilisation de GPT, ou de plusieurs indicateurs plus faibles ». La politique à ce sujet précédemment fixée par l'entreprise est devenue obsolète. En outre, la société s'est engagée à continuer à maintenir les sauvegardes de données sur le contenu des abonnés, l'accès aux API et l'explorateur de données Stack Exchange, mais avec l'avenant qu'elle peut « placer des garde-fous autour d'eux pour garantir que les entreprises qui construisent des modèles de langage, etc., soient facturées pour l'accès. » – une condition que certains membres de la communauté considèrent comme inappropriée étant donné que les sauvegardes de données sont sous licence Creative Commons, CC by-SA 4.0, qui permet l'adaptation à n'importe quelle fin sous réserve d'un crédit approprié. De plus, des changements ont été apportés à la façon dont Stack Exchange communique avec les modérateurs et à un processus lorsque Stack Exchange lui-même semble avoir violé son accord de modérateur.

Cette grève n'était pas comparable à une grève des salariés, car les modérateurs de Stack Overflow sont des bénévoles ; et dans le style typique de Stack Overflow, la question de savoir si la grève était terminée était elle-même un sujet de débat – même si dans la pratique, il semble que la modération soit revenue à la normale.

L’IA est le fil conducteur entre la grève, le trafic et les nouveaux services. Stack Overflow reste d’une importance capitale pour de nombreux développeurs, son avantage sur l’IA étant la modération et le consensus d’experts appliqués à ses questions – à condition qu’elles suscitent suffisamment d’intérêt. Cela dit, les sites ont des difficultés avec l’IA et ses implications semblent devoir se poursuivre.

PARTAGER