¿El raspado de pantalla no es ético?

Interesante pregunta.

Como usted sabe, las organizaciones utilizan con frecuencia máquinas para automatizar el comportamiento humano, en este caso, leer y copiar contenido de la web, y los motores de búsqueda utilizan habitualmente máquinas para leer y almacenar el contenido del sitio web. Al publicar contenido en la web, el sitio web ha elegido hacerlo público. En ese sentido, no vería la lectura automática del sitio web poco ética.

En términos generales, lo mejor para todas las partes es considerar un beneficio común para el éxito a largo plazo. Con frecuencia recuerdo el modelo de AdSense y por qué funcionó tan bien, que beneficia a todos los involucrados: anunciantes, editores y usuarios. Un modelo en el que el modelo de negocios de una parte depende de la lesión de otra parece inevitablemente condenado al fracaso, ya sea a través de desafíos legales o la denegación de servicio de gato y ratón.

Creo que lo mejor para este tercero sería encontrar una manera de trabajar con el sitio web. Los sitios se rastrean de forma rutinaria, pero pocos rastreadores intentan trabajar de manera proactiva con sitios web para hacer que este proceso funcione para ellos (rastreo en horarios de inactividad, solicitudes de aceleración, etc.). Además, generalmente hay opciones creativas para proporcionar valor a ese sitio que puede no implicar una compensación monetaria (retroalimentación, distribución, atribución, tráfico, etc.).

¡Convierte limones en limonada!

Ético es una frase temática, legal es la que creo que debería preocuparte. Y un abogado es la persona que debe preguntar … no yo, habiendo dicho eso:

La detección es irrelevante, está bien hacerlo o no. Si lo reduce a su único mal si lo atrapan, me parece que sabe que el sitio no quiere que lo haga.

¿Por qué no formar una relación con el propietario del sitio web y preguntarle por qué no hay API, él podría usar algo como importar • io para hacer una gratis pero no sabe que él / ella puede? ¿Te has detenido a pensar por qué no quieren que los datos se compartan a través de la API? ¿Es parte del modelo de negocio que no conoces? ¿está cerrado por razones de seguridad detrás de un inicio de sesión donde los usuarios pueden ser examinados? o protección de datos. Pregúntales.

Quizás le interese leer: Decepcionante: Craigslist demanda a Padmapper por hacer que Craigslist sea más útil y valioso | Techdirt

Quizás todo eso podría haberse evitado si se hubieran hablado antes de construir un producto.

Desearía que este fuera un tema simple, pero con las leyes internacionales y regionales sobre contenido y propiedad es difícil saber cuál es su posición. En caso de duda, solicite permiso porque el perdón a veces puede ser más difícil de obtener.

Descargo de responsabilidad : trabajo para http://import.io , pero estas opiniones son mis propias opiniones personales, no las de mi empleador.

No, el contenido está ahí afuera; tu puedes tenerlo. En realidad es así de simple. En muchos casos, el raspado de pantalla puede arrancar áreas completamente nuevas de aplicaciones.

Ciertamente hay inconvenientes de ingeniería (tener que mantenerse compatible con la capa de presentación de un sitio) e inconvenientes legales (violación de EULA), pero fuera de esos problemas no es un problema ético. (Modula tu ética personal, por supuesto).

No, siempre y cuando no esté eludiendo las protecciones o restricciones en el sitio original.

¿Qué es diferente entre lo que estás describiendo y un navegador web genérico o proxy de calamar? Si escribo el navegador Foobar, ¿puedo usarlo para acceder y almacenar en caché el sitio? ¿Qué sucede si personalizo Foobar para sitios de foros? ¿Qué sucede si personalizo Foobar para un sitio específico? El hecho de que Firefox sea un navegador de sitio ‘genérico’ que almacena en caché el contenido no significa que esté haciendo algo diferente de lo que está describiendo. La única diferencia es que ha elegido no cumplir con la especificación estándar. Microsoft Explorer tampoco.

Qué tal un ejemplo de B&M: Oprah no tiene tiempo para ir de compras, por lo que envía a alguien que ha contratado como compradora personal para que vaya a comprarla. El comprador sabe lo que le gusta a Oprah y va y se lo consigue, usando el dinero de Oprah. Oprah ahorra mucho tiempo al optimizar sus compras de esta manera. Qué tonto sería si un B&M se enojara porque uno de los empleados de Oprah la estaba comprando y los echó.