Engendramiento de biografías de grupos marginados


El mundo que la investigadora Angela Fan ve a su más o menos es mucho más diverso que lo que ve en Wikipedia. En Meta, Angela está trabajando para resolver el problema de representación de Wikipedia utilizando inteligencia fabricado.

Wikipedia suele ser la primera parada para muchas personas que buscan información sobre figuras históricas y promotores del cambio. Pero no todos están representados por igual en Wikipedia. Solo aprox. 20% de biografías en el sitio del Reino Unido son sobre mujeres e imaginamos que el porcentaje es aún beocio para las mujeres de grupos intersectoriales, como las mujeres africanas o asiáticas y las mujeres que trabajan en la ciencia.

Como parte de su esquema de doctorado como estudiante de informática en la Université de Lorraine, CNRS, en Francia, Angela trabajó con su asesor Claire Gardent desarrollar una nueva forma de tocar este desequilibrio utilizando inteligencia fabricado. Juntos, construyeron un sistema de inteligencia fabricado capaz de investigar y escribir el primer paño de entradas biográficas al estilo de Wikipedia. Todavía queda mucho trabajo por hacer, pero esperamos que este nuevo sistema algún día ayude a los editores de Wikipedia a crear miles de entradas biográficas precisas y convincentes para personas importantes que no están actualmente en el sitio.

Angela es de código franco de extremo a extremo Maniquí de inteligencia fabricado que crea automáticamente artículos biográficos de ingreso calidad sobre figuras públicas destacadas del mundo existente. El maniquí indagación en los sitios web información relevante y escribe una entrada al estilo de Wikipedia sobre esa persona, completa con comillas.

Anejo con el maniquí, están publicando un nuevo conjunto de datos que se creó para evaluar el desempeño del maniquí en 1527 biografías de mujeres de grupos marginados. Este conjunto de datos se puede utilizar para entrenar modelos, evaluar el rendimiento e impulsar el maniquí. Angela cree que estos rumores generados por IA pueden estar de moda como un punto de partida para que las personas escriban contenido de Wikipedia y verifiquen los hechos para transmitir más biografías de grupos subrepresentados en el sitio.

Cómo funciona el maniquí

Gráfico que explica cómo la modelo escribe una biografía completa

El maniquí primero recupera la información relevante de Internet para introducir el tema. Seguidamente, el módulo de concepción crea el texto, mientras que el tercer paso, el módulo de citas, construye la catálogo que hace relato a las fuentes utilizadas. Luego, el proceso se repite, y cada sección presenta la ulterior, cubriendo todos los rudimentos que conforman una acontecimientos sólida de Wikipedia, incluidos los primeros abriles de vida, la educación y la carrera del sujeto.

Destacar a más personas que están subrepresentadas en Wikipedia

El maniquí de Angela aborda solo una parte de un problema multifacético. Algunas fuentes tienen un sesgo que debe tenerse en cuenta. Por ejemplo, cuando las mujeres están representadas, es más probable que sus biografías incluyan detalles adicionales sobre sus vidas personales. Un estudio de 2015 encontró la palabra «divorciado» aparece cuatro veces tan a menudo en las biografías de mujeres como en las de hombres. Como resultado, es más probable que los detalles personales se mencionen en artículos sobre mujeres, lo que distrae la atención de los resultados que deberían ser destacados y celebrados.

El ex director ejecutor de Wikipedia explicó cómo un cálculo descubrió Además encontré un error importante en el sitio. Si correctamente los artículos de salubridad de Wikipedia son examinados por editores médicos, durante abriles algunos artículos sobre temas críticos de salubridad de la mujer, como la lactación materna, han sido etiquetados como de «desprecio importancia».

Hay aún más trabajo por hacer para otros grupos marginados e interseccionales en todo el mundo y en todos los idiomas. Nuestra evaluación y conjunto de datos se centra en las mujeres, lo que excluye a muchos otros grupos, incluidas las personas no binarias. Según un 2021 estudio sobre los prejuicios sociales en Wikipedia, los artículos sobre personas transgénero y no binarias tienden a ser más largos, pero gran parte del espacio adicional se dedica a su vida personal en empleo de ampliar los logros de la persona. Es importante aceptar que los sesgos existen en varias formas, especialmente en fuentes de información en serie predefinidas.

Esperamos que nuestras técnicas se puedan usar eventualmente como un punto de partida para los escritores humanos de Wikipedia y, en última instancia, conduzcan a una disponibilidad más equitativa de información en serie a la que puedan consentir los estudiantes que escriben biografías, y más allá.

Obtenga más información al respecto nuestro trabajo generando biografías inclusivas al estilo de Wikipedia.





Source link