Los riesgos de privacidad y seguridad del web scraping de datos de coronavirus

Web scraping para rastrear a las personas que han recibido la vacuna de inmunización contra el coronavirus será una empresa compleja y masiva.

Por
Este artículo fue traducido de nuestra edición en inglés utilizando tecnologías de IA. Pueden existir errores debido a este proceso. Las opiniones expresadas por los colaboradores de Entrepreneur son personales.

Web scraping para rastrear a las personas que han recibido la vacuna de inmunización contra el coronavirus será una empresa compleja y masiva. La necesidad de identificar los lugares de vacunación y las tareas para eliminar el virus agrava por completo la situación. Se requerirán una multitud de bases de datos interconectadas del gobierno y otras agencias estatales para rastrear el progreso de la vacuna contra el coronavirus. Estas bases de datos van desde códigos antiguos utilizados para desarrollar computadoras centrales y aplicaciones de primera generación hasta sistemas modernos.

Al mismo tiempo, el seguimiento de la vacunación contra el coronavirus es crucial para garantizar que el virus asesino haya sido enrutado. A pesar de los aparentes beneficios, es esencial comprender los riesgos de privacidad que surgen del seguimiento del progreso de la vacuna contra el coronavirus.

Entendiendo el proceso

Una reunión informativa con altos funcionarios del Departamento de Salud y Servicios Humanos de EE. UU. Reveló que se están enviando millones de dosis de vacunas a cientos de sitios identificados a medida que el proceso de vacunación gana impulso. Los colosales esfuerzos logísticos que se utilizan para acelerar el proceso involucran al personal del gobierno, incluidas múltiples agencias gubernamentales, socios privados y académicos, militares y miles de varios sitios de vacunación.

No realizar un seguimiento de los movimientos de la vacuna puede, en última instancia, causar retrasos en el envío y hacer que algunos pacientes pierdan segundas dosis críticas de la vacuna que les salvó la vida.

En cada paso de este proceso, las personas que entran en contacto con la vacuna deben recopilar e intercambiar datos personales confidenciales. La información recopilada incluye detalles sobre las instituciones de fabricación de vacunas, los sitios de vacunación y los departamentos de salud estatales. Sin embargo, todo se reduce a dos tipos de datos primarios: dónde se encuentran todos los viales de vacuna (la oferta) y quién la ha tomado (la demanda).

La Operación Warp Speed del gobierno federal, una asociación público-privada iniciada por el gobierno, facilita y asigna todas las dosis de COVID-19 en los EE. UU. Los estados solicitan las vacunas y las empresas de transporte realizan un seguimiento de la entrega. Otros proveedores de servicios de salud, como clínicas, hospitales, centros de atención a largo plazo y los sitios de vacunación, rastrean a las personas que reciben las vacunas e informan al gobierno. Operation Warp Speed tiene como objetivo producir y administrar 300 millones de dosis de vacunas seguras y efectivas, con las cantidades iniciales disponibles para principios de 2021.

Rusia comenzó a ofrecer su vacuna contra el coronavirus a cualquier ciudadano interesado. El país alienta a todos los rusos a vacunarse para frenar las infecciones. Las autoridades pertinentes cubrirán en primer lugar a los residentes de las residencias de ancianos, los trabajadores sanitarios y todos los mayores de 75 años. A continuación, Rusia emitirá aproximadamente 4 millones de vacunas para el viernes.

En casi todos los países que distribuyen la vacuna, se han implementado varios sistemas para hacer un seguimiento del progreso del paciente y registrar las reacciones adversas, si las hubiera.

Dicho de otro modo, la búsqueda en la web de marcadores y actualizaciones de vacunas contra el coronavirus comprende un conjunto de recursos y herramientas integrados, tanto nuevos como antiguos. Hacer un seguimiento y monitorear todas las fuentes de datos de la vacuna COVID-19 es un centro neurálgico llamado Tiberius (adoptado de Star Trek, un programa de televisión que inspiró la creación de Warp Speed). Tiberius está diseñado para monitorear los detalles sobre el movimiento de la vacuna contra el coronavirus. Sin embargo, las autoridades y los contratistas a nivel local y estatal no pueden ver los datos de salud de los pacientes ya que se eliminan sus identificadores.

Relacionado: Una vez solo para grandes empresas, el 'web scraping' es ahora una carrera armamentista en línea que ningún comercializador de Internet puede evitar

Componentes de web scraping involucrados en el seguimiento del progreso de la vacunación contra el coronavirus

El coronel RJ Mikesh, responsable de supervisar los procedimientos de tecnología de la información en Operation Warp Speed, informó a los periodistas el 7 de diciembre de 2020 que al menos 100 sistemas de datos participarán en la administración de la vacuna. Están diseñados para recopilar datos de los niveles estatales relacionados con los pedidos de vacunas, el envío, la entrega y el seguimiento de la primera y segunda dosis de los pacientes.

Algunos de los sistemas de gestión de vacunas COVID-19 incluyen las soluciones de software de McKesson, una empresa de atención médica, sistemas de gestión de inventario subcontratados por empresas de transporte de paquetes como UPS y FedEx, y el socio principal de distribución de la operación. Además, CVS y Walgreens utilizarán sus sistemas de gestión de datos para coordinar los datos de diferentes sitios de vacunación. Según Mikesh, ha sido necesario un esfuerzo enorme para garantizar que los sistemas estén conectados, funcionen sin problemas, verificados y probados. El principal desafío es asegurarse de que los sistemas funcionen bien una vez que la vacuna esté disponible para más personas.

Relacionado: El raspado de sitios web es un truco de crecimiento fácil que debe probar

Comprender el flujo de información sobre la vacuna contra el coronavirus

Una vez que los pacientes reciben sus vacunas contra el coronavirus, la farmacia o clínica responsable de administrar la vacuna envía sus identificadores y nombres a una base de datos gubernamental predefinida. Los estados y algunas ciudades seleccionadas son responsables de administrar los sistemas de información de inmunización, comúnmente conocidos como registros de inmunización.

Todos los estados de los EE. UU., Excepto los grandes municipios como Nueva York, tienen su propio registro de vacunación. Los sistemas existen desde hace muchos años y se desarrollaron para ayudar al gobierno a rastrear y monitorear los registros de vacunación completos. Son vitales ya que permiten a los usuarios autorizados, como las escuelas, acceder a los registros y al estado de inmunización de una persona, independientemente de dónde se administró la vacuna. Los sistemas de información también manejan y procesan los datos de suministro. Los estados los utilizan para crear registros y realizar nuevos pedidos al Centro para el Control y la Prevención de Enfermedades (CDC).

La búsqueda de datos de vacunación permite a los proveedores de atención médica administrar vacunas a todos. La cantidad de información que se crea todos los días relacionada con la investigación y la inmunización de la vacuna contra el coronavirus es enorme, por lo que es casi imposible desarrollar una línea de tiempo comprensible. Con esto en mente, las partes interesadas relevantes han recurrido al uso de varios sistemas de información para recopilar datos esenciales de pacientes y vacunas para ayudar en los programas de vacunación contra COVID-19.

Pero, ¿cómo afecta esto a la privacidad de los pacientes u organizaciones cuya información se puede acceder en cualquier estado o país? ¿Cuáles son las implicaciones de privacidad de la información?

Antes de analizar las posibles implicaciones de privacidad del raspado web de datos de pacientes y vacunas, echemos un vistazo a algunos servicios y sitios web donde las personas y las organizaciones pueden raspar la información.

Relacionado: Cómo la inteligencia artificial está ayudando a combatir la pandemia de COVID-19

Varios servicios / sistemas en los que puede extraer datos esenciales de vacunas y pacientes

El lago de datos COVID-19

El lago de datos COVID-19 reúne importantes datos y sistemas de información que cubren la oferta y la demanda de la vacuna. Extrae información del paciente de IZ Data Clearing House una vez que se han borrado los identificadores personales.

Universidad John Hopkins

Con docenas de vacunas ahora en ensayos clínicos, la Universidad John Hopkins recopilará detalles para comprender los plazos acelerados para el desarrollo, los diferentes tipos de vacunas e información sobre su eficacia y seguridad. Además, la universidad hará un seguimiento de los datos sobre los esfuerzos de vacunación. La Universidad y Medicina John Hopkins ha creado un centro de recursos sobre coronavirus que publica las métricas críticas para comprender el progreso de la vacunación por estado de EE. UU., Las dosis administradas y el porcentaje de personas completamente vacunadas por población.

Tiberio

Tiberius es el centro neurálgico de todos los procedimientos de seguimiento de la vacunación contra el coronavirus. Obtiene información directamente de los datos en tránsito sobre los envíos de vacunas y el lago de datos COVID-19. El software Tiberius combina datos logísticos con información del censo para coordinar la distribución de la vacuna contra el coronavirus.

Los CDC y Operation Warp Speed utilizarán Tiberius para calcular las asignaciones semanales a diferentes jurisdicciones considerando las poblaciones objetivo, la capacidad de almacenamiento y el inventario. Al menos 600 representantes de 64 jurisdicciones, incluidas agencias federales, estados y territorios, tendrán credenciales de inicio de sesión en Tiberius, mientras que los funcionarios de salud pueden monitorear el envío de pedidos de vacunas.

Puerta de enlace IZ

Supongamos que una persona recibe su primera inyección de COVID-19 en Nueva York. ¿Cómo se asegurarán los proveedores de atención médica de que una farmacia ubicada en Florida le dé la segunda oportunidad correcta? IZ Gateway es un sistema de intercambio de información centralizado para datos de pacientes. Es una herramienta tecnológica que utilizan los registros de vacunación para compartir información sobre los pacientes. IZ Gateway está alojado por la Asociación de Laboratorios de Salud Pública y transmite información del paciente a IZ Data Clearing House de los CDC. La Cámara de Compensación de Datos también extrae información del paciente de otras fuentes, como agencias federales y farmacias.

VTrckS

VTrckS, abreviatura de (Vaccine Tracking System), es una tecnología de gestión y pedidos de los CDC. El sistema de seguimiento ha estado en uso desde 2006 con la compañía de atención médica McKesson y ha estado involucrado en la distribución de más de 150 millones de dosis de vacunación para enfermedades como la gripe, la varicela y la MMR. Utiliza la información enviada a través de los sistemas de información de inmunización estatales para cumplir con los pedidos de vacunas. Una vez que realiza los pedidos, CDC contacta a McKesson con los detalles del pedido, que luego lo envía y envía la información al estado.

Sistema de gestión de administración de vacunas

Los CDC planean implementar un nuevo sistema basado en la web llamado Sistema de Gestión de Administración de Vacunas (VAMS) para rastrear la vacuna contra el coronavirus. El sistema está diseñado para monitorear y rastrear las vacunas desde que llegan a los sitios de vacunación designados hasta que los pacientes las reciben. VAMS puede ayudar a las ciudades o condados a establecer sitios de vacunación y reunir datos esenciales. También puede permitir a las organizaciones realizar un seguimiento de las dosis de vacuna programadas para los miembros de su personal. Los pacientes pueden usarlo para realizar un seguimiento de sus citas y recibir recordatorios una vez que vence la segunda dosis. Por otro lado, los proveedores de vacunas pueden usar VAMS para organizar las vacunas de acuerdo con los fabricantes, programar a los pacientes y verificar el inventario.

¿Cuáles son los posibles riesgos de privacidad?

Los métodos y sistemas de información implementados para facilitar y monitorear el lanzamiento de la vacuna contra el coronavirus y la inmunización pueden conllevar riesgos para la privacidad. La integración de la información manejada por farmacias, clínicas y otros centros de vacunación con las bases de datos estatales de inmunización brinda a los actores malintencionados la oportunidad de hacer un mal uso de los datos de los pacientes.

El Departamento de Defensa colabora con organizaciones privadas y estados para permitir el raspado web y el intercambio de datos utilizando las bases de datos de inmunización para permitir la distribución de la vacuna. Dichos sistemas permitirán a las personas recibir su primera dosis en un lugar y tomar la segunda dosis en un estado diferente.

El seguimiento de qué vacuna se administró a qué paciente ayudará a los proveedores de atención médica a garantizar que la persona tome la segunda dosis correcta.

Sin embargo, ¿qué pasa con los datos?

Los CDC publicaron detalles sobre cómo el gobierno federal hará un seguimiento de los efectos secundarios después de la primera dosis. Una de las formas es a través de textos diarios pidiendo a las personas vacunadas que describan sus efectos secundarios. El método genera algunas señales de alerta ya que las agencias carecen de un esquema claro de las salvaguardas utilizadas para proteger los datos. Uno de los riesgos de privacidad involucrados son las empresas que utilizan información sobre inmunizaciones por razones comerciales no autorizadas.

Además, los estados tienen diferentes reglas y regulaciones de protección de datos. Las diferencias en términos de qué puntos de datos proteger dejan los datos de los pacientes expuestos a acceso no autorizado, raspado web y uso. Por ejemplo, un estado como Texas tiene leyes que rigen el uso de datos personales en marketing, pero es posible que otros estados no tengan el mismo nivel de protección.

También existen ciertos tipos de datos sujetos a la Ley de Responsabilidad y Portabilidad de Seguros de Salud (HIPAA). La redacción de algunos de los contratos de datos de vacunas puede impedir que la ley se aplique a todas las partes que acceden y utilizan las bases de datos en un caso determinado. Posteriormente, suponga que las leyes federales de privacidad de datos de salud no pueden cubrir toda la información y que los contratos no incluyen estipulaciones sobre cómo las empresas pueden utilizar los datos de los pacientes. En ese caso, existe una alta probabilidad de que algunos pacientes tengan una mejor protección de la privacidad que otros.

Además, ¿qué pasaría si se produjera una infracción? Por ejemplo, el personal sanitario, como los farmacéuticos o los médicos, puede introducir la información de la vacuna de un paciente en una base de datos, y un tercero podría rasparla o un pirata informático acceder a ella ilegalmente. Si se produce una infracción cuando los datos están bajo el control del gobierno, el gobierno se vuelve responsable. Si la información está fuera del control de los proveedores de atención médica, es posible que no esté protegida por HIPAA. La falta de un acuerdo sencillo con respecto al manejo de las violaciones de datos y las políticas de protección de la información mutua expone los datos de los pacientes a serios riesgos de ciberseguridad y actividades ilegales de raspado web.

Web scraping legal con fines legales

La extracción de datos de los servicios enumerados que proporcionan actualizaciones de vacunas tiene algunas limitaciones éticas, legales y técnicas. El web scraping es legal para fines legales y cuando cumple con regulaciones como el Reglamento General de Protección de Datos (GDPR) de 2018.

  • Asegúrese de que el propósito del web scraping sea legal : identifique la información que se recopilará, las fuentes de datos y el formato. Asegúrese de que la información extraída no cause ningún daño financiero o de reputación a los propietarios de los datos.
  • Obtenga información disponible públicamente : algunos de los servicios y sitios web de la vacuna COVID-19 publican datos para el consumo público. Incluso si los datos son legales para copiar, es mejor verificar las políticas y los términos de servicio (ToS) del sitio web. Asegúrese de que la información de los sitios no contenga datos personales.
  • Verifique los derechos de autor : además de las Condiciones de servicio y las políticas, los sitios web proporcionan detalles de derechos de autor que los web scrapers deben respetar. Antes de raspar la información de la vacuna, asegúrese de que el servicio no tenga derechos de autor sobre los datos.
  • Identifique su raspador web: sea respetuoso e identifique su raspador web con una cadena de agente de usuario legítima. Puede crear una página que explique sus actividades y el motivo de la extracción de datos de los sitios. Si implementa bots, asegúrese de que cumplan con el archivo robot.txt de un sitio que detalla las páginas a las que pueden acceder los bots.