
Estudios recientes publicado en Scientific Reports indica que los chatbots de inteligencia artificial a partir de un modelo de lenguaje grande (LLM) pueden superar a los humanos comunes en tareas creativas como generar ideas para usos alternativos de objetos comunes, lo que refleja un pensamiento divergente. Sin embargo, las personas que obtuvieron la mayor puntuación en estas tareas superaron a los charlatanes con mejor rendimiento.
El pensamiento divergente es un proceso de pensamiento a menudo asociado con la creatividad que enfatiza la generación de muchas ideas o soluciones diferentes para una tarea determinada. Generalmente se evalúa con la Tarea de Usos Alternativos (AUT), donde se pide a los participantes que piensen en tantos usos alternativos como sea posible para un objeto cotidiano en un corto período de tiempo. Las respuestas se califican en cuatro categorías diferentes: fluidez, flexibilidad, originalidad y detalle.
Mika Koivisto y Simone Grassini compararon las respuestas de 256 personas que utilizaron tres chatbots de IA (ChatGPT3, ChatGPT4 y Copy.Ai) con cuatro objetos del AUT: una cuerda, una caja, un bolígrafo y una vela. Los autores evaluaron la originalidad de las respuestas calificándolas según la distancia semántica (qué tan estrechamente se relaciona la respuesta con el uso original del objeto) y la creatividad.
Se utilizó un método de conteo para cuantificar la distancia semántica en una escala de 0 a 2, mientras que la creatividad fue evaluada subjetivamente en una escala de 1 a 5 por evaluadores humanos que desconocían los autores de las respuestas. En promedio, las respuestas generadas por el chat recibieron puntuaciones significativamente más altas. como las reacciones de las personas tanto ante la distancia semántica (0,95 frente a 0,91) como ante la creatividad (2,91 frente a 2,47).
Las respuestas humanas variaron considerablemente en ambas medidas: las puntuaciones mínimas fueron mucho más bajas que las respuestas de la IA, pero las puntuaciones máximas fueron generalmente más altas. La mejor respuesta humana superó a la mejor respuesta de todos los chatbots en siete de ocho categorías de puntuación.
Estos hallazgos sugieren que los chatbots de IA ahora pueden generar ideas creativas al menos tan bien como un ser humano normal. Al mismo tiempo, los autores señalan que sólo consideraron la realización de una tarea relacionada con la evaluación de la creatividad. Los autores sugieren que investigaciones futuras podrían explorar cómo se puede integrar la inteligencia artificial en el proceso creativo para mejorar el desempeño humano.