
Desarrollo experimental
El proyecto desarrollará una plataforma para entender cómo la IA generativa representa conceptos humanos mediante embeddings, una técnica que traduce ideas en datos numéricos. La herramienta permitirá analizar y visualizar estos conceptos, detectar sesgos y asegurar una evolución ética de los modelos. Incluirá funciones como evaluación independiente, historial de cambios y un repositorio común, con un enfoque sostenible y abierto al público.
El proyecto busca desarrollar una plataforma que permita entender mejor cómo los sistemas de inteligencia artificial generativa, como ChatGPT o DALL-E, interpretan y representan conceptos y expresiones humanas, como el estado de "sorpresa". Para ello, emplean una técnica llamada "embeddings", que transforma características de palabras e imágenes en listas numéricas, ayudando a los modelos a "captar" el significado de ideas complejas.
Sin embargo, aunque los embeddings son eficaces, también pueden arrastrar problemas como sesgos sexistas, racistas o una falta de diversidad conceptual. Por eso, esta plataforma se centrará en supervisar y explicar los conceptos que la IA generativa aprende, detectando posibles problemas y asegurando que estos sistemas evolucionen sin distorsiones indeseadas.
Las funcionalidades clave de esta herramienta incluyen la evaluación y análisis de embeddings de manera independiente del tipo de IA, la visualización de relaciones conceptuales, un historial para detectar cambios entre versiones de modelos y la posibilidad de contribuir a un repositorio común de conceptos. El proyecto contempla un desarrollo integral de la plataforma, desde el diseño hasta la apertura pública, con la meta de mantener y mejorar la solución a largo plazo.
