Home / Tecnología / Aquí está el plan de Cambridge Analytica para los datos de los votantes en Facebook – TechCrunch

Aquí está el plan de Cambridge Analytica para los datos de los votantes en Facebook – TechCrunch

Más detalles han surgido sobre cómo los datos de Facebook sobre millones de votantes estadounidenses fueron gestionados después de ser obtenidos en 2014 por la consultora británica Cambridge Analytica para la construcción de perfiles psicográficos de estadounidenses para abordar los mensajes electorales para la campaña Trump. [19659002] El conjunto de datos – de más de 50 millones de usuarios de Facebook – se encuentra en el centro de un escándalo que está envolviendo al gigante de las redes sociales ya que las revelaciones de los periódicos publicados el 17 de marzo arrojaron privacidad y protección de datos en la parte superior de la agenda de noticias. [19659003] Una comisión parlamentaria británica publicó una serie de documentos proporcionados por un ex empleado de California, Chris Wylie, quien hizo un testimonio público ante el comité durante una audición a principios de esta semana. Durante esta audiencia, afirmó creer que los datos sobre "sustancialmente" más de 50 millones de usuarios de Facebook se obtuvieron de CA. Facebook no ha comentado públicamente esta declaración.

Entre los documentos que el comité publicó hoy (con algunos editores) está el acuerdo de licencia de datos entre Global Science Research (GSR) – la compañía fundada por el profesor de la Universidad de Cambridge, Aleksandr Kogan , cuya aplicación de pruebas de personalidad fue utilizada por CA como vehículo para recopilar datos de usuarios de Facebook – y SCL Elections (una subsidiaria de CA), con fecha del 4 de junio de 2014.

El documento está firmado por Kogan y ahora suspendido CEO de CA Alexander Nix .

El contrato estipula que todos los fondos transferidos a GSR se usarán para obtener y procesar datos para el proyecto – "para desarrollar, agregar, refinar e integrar algoritmos, bases de datos y puntajes GS psicométricos" – y nada del dinero pagado a Kogan debe gastarse en otros fines comerciales, como salarios o espacio de oficina "a menos que SCL apruebe lo contrario".

Wylie le dijo al comité el martes que pudo trabajar con Kogan ya que había aceptado trabajar con ellos para adquirir y modelar los datos primero, sin establecer condiciones comerciales por adelantado.

El contacto también establece que la compañía de Kogan debe obtener "aprobación por escrito anticipada" de SCL para cubrir los costos no asociados con la recopilación de datos, incluida la "seguridad de TI".

Lo cual enfatiza las prioridades de CA en este proyecto: Obtenga la mayor información posible sobre los votantes de EE. UU. Lo más rápido posible, pero no se preocupe demasiado por mantener su información personal segura. La seguridad es una consideración de backburner en este contrato.

CA respondió al testimonio de Wylie el martes con una declaración rechazando sus acusaciones, y afirmando que "no contiene datos de GSR ni datos derivados de los datos de GSR".

no actualizó su página de prensa con ninguna declaración nueva a la luz de la publicación de un contrato firmado en 2014 por su ex CEO y Kogan de GSR.

A comienzos de esta semana, el comité confirmó que Nix aceptó su llamado a regresar para proporcionar más pruebas: la sesión pública está programada para el 17 de abril.

Modelos de votantes en 11 estados de los EE. UU.

La primera sección del contrato entre la empresa afiliada de CA y GSR describe brevemente el propósito del proyecto de realizar "modelos políticos" de la población en 11 estados de EE. UU.

En el frente de protección de datos el contrato incluye una cláusula que establece que ambas partes "garantizan y se comprometen" con

"Cada parte garantiza y se compromete a no hacer nada o dejar que venga hecho algo que podría llevar a una violación de estas leyes, regulaciones y / o directivas del otro lado ", dice.

CA sigue bajo investigación por parte de la agencia de protección de datos del Reino Unido, que obtuvo el mandato de ingresar a sus oficinas la semana pasada y pasó varias horas reuniendo pruebas. Las actividades de la compañía han sido examinadas como parte de una investigación más amplia del ICO sobre el uso del análisis de datos para fines políticos.

La Comisionada Elizabeth Denham ha declarado previamente que está recomendando un código de conducta para el uso de las redes sociales en la campaña política electoral, y dijo que espera publicar su informe para mayo

Otra cláusula en el contrato entre GSR y SCL especifica que la compañía de Kogan "buscará el consentimiento informado del usuario parcial involucrado con GS Technology", lo que supuestamente se referiría a las ~ 270,000 personas que acordaron apoyar el cuestionario de personalidad en la aplicación distribuida a través de la plataforma de Facebook.

Al final del proyecto, el contrato especifica que la compañía Kogan podría continuar utilizando los datos de SCL para "investigación académica en la que no se obtenga ganancia financiera".

Otra cláusula describe un beneficio adicional para la investigación que se desencadenaría si Kogan fuera capaz de alcanzar los objetivos de rendimiento y entregar SCL con los registros 2.1M correspondientes en los 11 estados de EE. UU. Para los que estaba destinado, siempre que cumpliera con los requisitos sus estándares mínimos de calidad y a un costo promedio de $ 0,50 o menos por registro coincidente. En esa ocasión, también recibió un conjunto de datos de SCL de aproximadamente 1 millón de residentes de Trinidad y Tobago, también "para uso en investigación académica".

La segunda parte del contrato explica el proyecto y sus especificaciones en detalle. [19659002] Aquí se afirma que el objetivo del proyecto es "deducir perfiles psicológicos", utilizando datos de autopercepción de pruebas de personalidad, preferencia de los partidos políticos y "datos de valores morales".

Los 11 estados de los EE. UU destinados por el proyecto también se nombran como: Arkansas, Colorado, Florida, Iowa, Luisiana, Nevada, New Hampshire, Carolina del Norte, Oregón, Carolina del Sur y Virginia Occidental.

El proyecto se detalla en el contrato como un proceso de siete pasos, con la compañía de Kogan, GSR, para generar una muestra inicial (aunque no se especifica qué tan grande es aquí) usando "paneles en línea"; analizar estos datos de entrenamiento de semillas utilizando sus propios "inventarios psicométricos" para tratar de determinar categorías de personalidad; El siguiente paso es la aplicación de cuestionario sobre la personalidad de Kogan que se distribuye en Facebook para recopilar todo el conjunto de datos de los entrevistados y también para extraer un subconjunto de datos de sus amigos de Facebook (aquí observamos: "Después del consentimiento del entrevistado, GS Technology raspa y almacena el perfil de Facebook del encuestado y una cantidad de datos sobre los amigos de Facebook del encuestado"); el paso 4 se refiere a los datos psicométricos de la muestra de semillas, además de los datos del perfil de Facebook y los datos de los amigos que se administran a través de algoritmos de modelado patentados, que el contrato específico se basa en el uso de Facebook para predecir puntuaciones de la personalidad, con el objetivo declarado de predecir las "facetas psicológicas, disposicionales y / o actitudinales de cada registro de Facebook"; esto genera una serie de puntajes para el perfil de Facebook; el paso 6 consiste en unir estos perfiles psicométricos con los datos de los registros electorales de SCL, con el objetivo de comparar (y consecuentemente anotar) al menos 2 millones de tarjetas electorales para golpear a los votantes en los 11 estados; el paso final es que los registros emparejados se devuelvan a SCL, que luego podría crear mensajes para los votantes en función de sus puntajes psicométricos modelados.

El "objetivo final" del producto de perfil psicométrico Kogan fue el entrenamiento creado y los conjuntos de datos de Facebook se imaginan como "un" estándar de oro "de comprensión de la personalidad de la información de perfil de Facebook, muy similar a la creación de un curso para navegar ".

La posibilidad de errores se menciona brevemente en el documento, pero agrega: "El muestreo en esta fase [phase 1 training set] se repetirá hasta que se cumplan las suposiciones y distribuciones".

En una sección posterior, en el análisis de la distribución demográfica, el contrato menciona la posibilidad de utilizar más "procedimientos de recopilación de datos dirigidos a múltiples plataformas", incluidos también "guiones telefónicos cortos con preguntas de un solo carácter", para corregir cualquier distorsión que pudiera encontrarse una vez que los datos de Facebook se han comparado con la base de datos de votantes en cada estado (y suponiendo que cualquier "falta de datos" no puede ser "compilada por muestras en línea específicas", como también dice).

En una sección sobre "antecedentes y lógica", el contrato establece que los modelos de Kogan fueron sometidos a "pruebas de validez" para los usuarios que no formaban parte de la muestra de capacitación y otras declaraciones: "El Los rasgos basados ​​en Facebook están cerca de los niveles de prueba y se han comparado con las predicciones de que sus parejas, familiares y amigos románticos toman sus características ".

"En todos los casos anteriores, los puntajes generados por la computadora dieron lo mejor, por lo que los puntajes generados por la computadora pueden ser más precisos que el conocimiento de amigos cercanos y familiares", agrega.

Su tecnología se describe como "diferente de la mayoría de las herramientas de medición de investigación social", ya que no solo se basa en datos autoinformados, con la siguiente afirmación de que: "Utilizando los datos observados por los perfiles de usuario de Facebook, las mediciones GS son realmente conductuales ".

Esta sugerencia, al menos, parece bastante tenue, dado que algunos usuarios de Facebook sin duda son conscientes del hecho de que el sitio está monitoreando su actividad cuando la usan, lo que a su vez afecta la forma en que usan Facebook. .

Así que la idea de que el uso de Facebook es un reflejo de 100% de personalidad merece muchas más preguntas críticas que implícitas en la descripción de Kogan en el contrato con SCL.

Y, de hecho, algunos comentarios sobre esta noticia pusieron en duda el valor de toda la exposición al sugerir que la orientación psicométrica de CA no era muy efectiva, por lo que no tuvo un impacto significativo en las elecciones estadounidenses.

Al contrario de las afirmaciones hechas para su tecnología en el contrato de 2014, el propio Kogan afirmó en una entrevista televisiva a principios de este mes (después del escándalo roto) que su modelo predictivo no fue muy preciso a nivel individual, sugiriendo que solo sería útil en conjunto para, por ejemplo, "entender la personalidad de los neoyorquinos" [19659002] Ayer Channel 4 News informó haber podido obtener algunos de los datos que Kogan había modelado para CA, alegando de esta forma, el testimonio de Wylie de que CA no había bloqueado el acceso a los datos. Y en su informe, la emisora ​​habló con algunos de los votantes estadounidenses nominados en Colorado, mostrándoles los puntajes que los modelos de Kogan les habían dado

No es sorprendente que no todos sus encuestados pensaran que los puntajes eran una reflejo preciso de quiénes eran [19659003] Sin embargo, independientemente de la efectividad (o no) de los métodos de Kogan, el hecho de que la información personal de más de 50 millones de usuarios de Facebook haya sido absorbida fácilmente por la plataforma es de incuestionable interés e inquietud pública.

El hecho agregado de que este conjunto de datos se usó para el modelado psicológico con fines de focalización de mensajes políticos -sin, en muchos casos, el conocimiento o el consenso de las personas- enfatiza aún más la controversia. Si el método de microtargeting político funcionó bien o fue golpeado por un error, está muy cerca.

En el contrato, los métodos de perfiles psicológicos de Kogan se describen como "menos costosos, más detallados y más rápidos de recopilar" que otros métodos de creación de perfiles individuales, como "encuestas políticas estándar o muestras telefónicas".

El contrato también indica cómo se cerró la ventana de oportunidad para su enfoque, al menos en la plataforma de Facebook. "El método GS se basa en una aplicación preexistente que funciona según los antiguos términos de servicio de Facebook", señala. "Las nuevas aplicaciones no pueden acceder a las redes de amigos y no existe ninguna otra aplicación de perfiles psicométricos bajo los viejos términos de Facebook".

Como escribí el fin de semana pasado, Facebook ha enfrentado un desafío legal al sistema de permisos de aplicación laxa que funcionó en 2011. Y después de una auditoría de protección de datos y una nueva auditoría del Comisionado para la protección de Datos irlandeses, en 2011 y 2012, el regulador recomendó el acceso de los desarrolladores de obturadores a las redes de amigos, que Facebook finalmente hizo (para aplicaciones antiguas y nuevas) a mediados de 2015

Pero a mediados de 2014 el los desarrolladores existentes en su plataforma aún podían acceder a los datos, ya que Kogan pudo entregarlos a SCL y sus afiliados.

Otros documentos publicados hoy por la comisión incluyen un contrato entre IQ agregado – una compañía de datos canadiense Wylie describió en su sesión de práctica el martes como "CA Canadá" (también conocido como otro afiliado de CA / SCL) , aunque AIQ impugna esto. (En una declaración en el sitio web de AIQ, con fecha del 24 de marzo, escribe: "AggregateIQ es una compañía digital, publicitaria, de desarrollo web y de software con sede en Canadá, y siempre ha sido propiedad y está gestionada por un 100% canadiense. nunca ha sido y no es parte de Cambridge Analytica o SCL IQ agregado nunca ha celebrado un contrato con Cambridge Analytica Chris Wylie nunca ha sido contratado por AggregateIQ. ")

Este contrato, con fecha 15 de septiembre de 2014, es para : "Diseño y desarrollo de un sistema de plataforma de participación", también conocida como la "plataforma Ripon" y descrita como: "Una plataforma de participación escalable que aprovecha el poder de los datos de modelado SCL, brindando un conjunto de herramientas y un & # 39; la interfaz del tablero de instrumentos que se puede usar para las campañas de destino en el ciclo de elecciones de 2014. Esta consistirá en una plataforma de participación personalizada (SCL Engage) para hacer que los datos de microtargeting de comportamiento de SCL sean utilizables, dando las campañas más responsables hacia donantes y partidarios.

Otro contrato entre Aggregate IQ y SCL está fechado el 25 de noviembre de 2013 y cubre la entrega de un sistema de CRM, un sitio web y la "adquisición de datos en línea" para un partido político en Trinidad y Tobago.

En este contrato, una sección sobre "adquisición de datos de comportamiento" especifica sus intenciones de esta manera:

  • Identificar y obtener fuentes de datos calificadas que ilustran el comportamiento del usuario y contribuyen al desarrollo de perfiles psicográficos en la región [19659044] Estos datos pueden incluir, entre otros:

    • Archivo de registro de proveedor de servicios de Internet (ISP)

    • Registro de datos de primer partido

    • Registro de datos de terceros

    • Datos de redes publicitarias

    • Marcadores sociales

    • Compartir redes sociales (Twitter, FB, MySpace)

    • Procesamiento del lenguaje natural (NLP) de U Texto e imágenes RL

    • Reconciliación de IP y User-Agent en la dirección de residencia, área de censo o área de difusión

En su testimonio a la comisión del martes, Wylie describió el proyecto AIQ Trinidad como un precursor del proyecto Rippon para ver cuántos datos se podían extraer y podríamos delinear diferentes atributos en las personas ".

También afirmó que AIQ usó técnicas de hackers para obtener datos. "El papel de AIQ era ir y encontrar la información", le dijo al comité. "El contrato está extrayendo datos del ISP y también hay correos electrónicos que envié al comité donde AIQ está trabajando con SCL para encontrar formas de extraer y anonimizar los datos del ISP, por lo que, como los datos de navegación sin formato. "

Otro documento en el paquete publicado hoy describe un lanzamiento de proyecto de SCL para realizar $ 200,000 de microtargeting y una campaña de campaña para la organización conservadora ForAmerica.org – para" creación de audiencia y campañas de movilización de apoyo " .

También hay una cadena interna de correo electrónico SCL con respecto a un proyecto de focalización política que también parece involucrar datos de Kogan en Facebook, que se conoce como el "proyecto Bolton" (que parece referirse al trabajo realizado para El actual asesor de seguridad nacional de EE. UU., John Bolton) – con algunas dudas sobre retrasos y problemas con la coincidencia de datos en algunos estados de los EE. UU. Y la calidad general de los datos.

"Necesitamos presentar la poca información que tenemos sobre las 6.000 sembradoras para [sic] debemos dar una lectura aproximada, rápida y muy preliminar sobre esa muestra ([name redacted]) tendremos que asegurarnos de que existan las exenciones apropiadas para manejar las expectativas y la probabilidad de que los resultados cambien una vez que se reciban los datos.) Debemos mantener feliz al cliente ", es uno de los próximos pasos sugeridos en un correo electrónico escrito por un personal no identificado de SCL que trabaja en el proyecto Bolton.

"El equipo de Ambassador dejó en claro que le gustaría recibir alguna respuesta en la última ronda de preguntas sobre política exterior, incluso si no es lo ideal, vamos a cabrear a un hombre que es potencialmente un un cliente aún más grande si permanecemos en silencio sobre esto porque era claro para nosotros que esto es algo que está particularmente interesado en ", escribe también el e-mail.

"En este momento, desafortunadamente no podemos darnos el lujo de proporcionar solo el conjunto de datos perfecto, pero debemos ofrecer algo que demuestre la validez de lo que prometemos que podemos hacer", agrega el e-mail.

Otro documento es un memorándum secreto preparado para Rebekah Mercer (la hija del multimillonario estadounidense Robert Mercer, Wylie dijo que Mercer proporcionó los fondos para crear CA), el ex concejal de triunfo Steve Bannon y el El presidente ejecutivo de CA (ahora suspendido) Alexander Nix les aconseja sobre la legalidad de una corporación extranjera (es decir, CA) y ciudadanos extranjeros (como Nix y otros), que realizan trabajos en campañas políticas de EE. UU.

Esta nota también describe la estructura legal de SCL y CA: la primera se describe como "propietario minoritario" de CA. Leemos:

Con estos antecedentes, primero debemos consultar Cambridge Analytica, LLC ("Cambridge") y luego las personas involucradas y las tareas involucradas. Según tengo entendido, Cambridge es una compañía de responsabilidad limitada de Delaware que se estableció en junio de 2014. Está dirigida por cinco ejecutivos, tres gerentes privilegiados, la Sra. Rebekah Mercer, la Sra. Jennifer Mercer y el Sr. Stephen Bannon, y dos directores conjuntos. , El Sr. Alexander Nix y una persona para nombrar. Los tres gerentes favoritos son todos ciudadanos de los Estados Unidos, el Sr. Nix no. Cambridge es propiedad y está principalmente controlada por ciudadanos estadounidenses, con SCL Elections Ltd., ("SCL"), una sociedad de responsabilidad limitada del Reino Unido que es un propietario minoritario. Además, algunas propiedades intelectuales de SCL han sido licenciadas a Cambridge, que la propiedad intelectual de Cambridge podría usar en su trabajo como compañía estadounidense en elecciones estadounidenses u otras actividades.

En el punto más importante del asesoramiento legal, el memorándum concluye que las leyes de los Estados Unidos que prohíben a los ciudadanos extranjeros que dirigen campañas -incluidas decisiones directas o indirectas sobre el gasto en dólares de campaña- tendrán "un impacto significativo en cómo Cambridge emplea personal y opera en el corto plazo ".

Sobre Willian Delgado

Check Also

Entrepreneur First, el constructor de la compañía con el apoyo de Greylock, aterriza en Bangalore – TechCrunc …

Entrepreneur First (EF), la compañía con sede en Londres que invierte en personas de "pre-equipo, …

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

A %d blogueros les gusta esto: