Noticias Programación

Copiar desde Stack Overflow: no es solo una broma

El 1 de abril, Stack Overflow hizo una broma que preocupó a algunos miembros de su comunidad: nos cobrarían por la copia del código. Pero como ocurre con todos los buenos chistes, hubo una recompensa. Stack Overflow pudo cuantificar no solo la extensión de la copia, sino también proporcionar detalles sobre lo que se está copiando.

Cuando informamos de The Key, el teclado personalizado de Stack Overflow para simplificar la función de copiar y pegar, estábamos al tanto de su estado de April Fool. Sin embargo, ese no fue el final de la historia. Para hacer la broma, se configuró un sistema para reaccionar cada vez que alguien emitía un comando de copia y esto permitió una recopilación de datos muy interesante que Stack Overflow ahora ha informado en su blog.

Uno de cada cuatro usuarios que visitan una pregunta de Stack Overflow copia algo dentro de los cinco minutos de haber llegado a la página. Esto suma 40,623,987 copias en 7,305,042 publicaciones y comentarios entre el 26 de marzo y el 9 de abril. Las personas copian las respuestas unas diez veces más que las preguntas y unas 35 veces más que los comentarios. Las personas copian de bloques de código más de diez veces más a menudo que el texto circundante y, sorprendentemente, vemos más copias de preguntas aceptadas sin respuesta que preguntas aceptadas.

Sí, sabíamos que la copia de Stack Overflow estaba muy extendida, pero esta velocidad de copia parece increíble. Sin embargo, un examen más detallado de los datos para ponerlos en contexto los hace más razonables.

Para empezar, la gran mayoría de las copias las realizan usuarios con una puntuación de reputación cero. Dado que crear una cuenta en Stack Overflow automáticamente le otorga una reputación de 1, significa que son visitantes ocasionales y anónimos, aunque también pueden ser usuarios con una cuenta que no han iniciado sesión. Al eliminar este grupo, el número de copias se reduce a menos de medio millón y se concentra entre aquellos con una puntuación de reputación de 5 o menos:

socp0

Publicidad:

Stack Overflow también verificó si las respuestas aceptadas, es decir, las respuestas que la persona que hizo la pregunta originalmente consideró útiles, se copiaron con más frecuencia que las que no fueron aceptadas. En lo que parece ser un resultado sorprendente, se encontró que se hicieron múltiples copias de respuestas no aceptadas:

socp2

Sin embargo, en promedio, las respuestas aceptadas obtienen siete copias por publicación única, mientras que las respuestas no aceptadas obtienen cinco copias por publicación única, lo que lleva a Stack Overflow a comentar que hay una mayor reutilización del conocimiento, es decir, aprovechando lo que otros desarrolladores han creado y probado, por parte de los aceptados. respuestas.

No son solo las respuestas las que se copian. También se copian las preguntas y los comentarios. Dada la distribución de preguntas copiadas que revelan que la mayoría de las copias provienen de publicaciones con 1-5 puntos de reputación, David Gibson, quien informó los datos en el blog Stack Overflow, escribe:

Sospecho que se debe a que los usuarios copian la pregunta para reproducirla y, finalmente, publicar una respuesta.

Sí, tiene sentido. Y también lo hace el descubrimiento de que a medida que una publicación aumenta la puntuación de la publicación, las copias por publicación también aumentan.

socp1

Como señala Gibson:

Esto tiene sentido porque a medida que aumenta la puntuación de una publicación, es más probable que nuestra comunidad reutilice el conocimiento.

Los puntos azules a la izquierda del gráfico son publicaciones con una puntuación negativa, aquí la exploración de Gibson de los datos da sentido a lo que de otro modo sería un misterio. Examine una respuesta con una puntuación de -2 que fue copiada 288 veces revelando que resulta ser una versión más larga de una respuesta aceptada con una puntuación de 29 que tuvo un total de 493 copias demostrando que es:

el ejemplo perfecto de una publicación «demasiado larga sin leer».

La publicación del blog ingresa a las etiquetas populares, observando la preponderancia de las etiquetas relacionadas con Python, y finalmente revela la publicación que recibió la mayor cantidad de copias. Nuevamente para citar del blog:

Con una puntuación de publicación de 3.497 y 11.829 copias, me complace anunciar que Cómo iterar sobre filas en un DataFrame en Pandas ha recibido la mayor cantidad de copias. Respondida en 2013, esta pregunta sigue ayudando a miles de personas cada semana.

En cuanto al teclado Copiar y Pegar diseñado para el Día de los Inocentes, hubo tanto interés que Stack Overflow está avanzando con su producción.

El botón

Publicidad:

También puede gustarte...

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *