La cadena de pensamiento (CoT) en el trabajo con inteligencia artificial
La cadena de pensamiento (CoT) en el trabajo con inteligencia artificial
Es evidente que los desafíos de hoy en materia de construcción de productos digitales, automatización de procesos y transformación digital. Estamos viviendo una época en la que la importancia de todas las tareas relacionadas con la inteligencia artificial, el machine learning y el deep learning están en auge, ofreciendo sistemas únicos que cada vez nos llevan a desarrollos mucho más importantes. Pero todo esto que parece magia, no lo es, y si lo fuera debemos entender elementos generales para poder utilizarla de buena manera, y que nos transformemos en “aprendices de brujos” a la usanza de lo escrito del poema escrito por Goethe (1979) y que luego Walt Disney popularizó con su película protagonizada por el “ratón Mickey”, en el que no debemos recurrir a soluciones (en este caso) que no somos capaces de controlar o entender.
Es así cómo un elementos que hemos estado estudiando como equipo, es el de “Cadena de pensamientos” o chain of thought (CoT), que es una técnica que se ha convertido en una herramienta fundamental para mejorar las capacidades de razonamiento de los modelos de lenguaje, como los que utilizan herramientas avanzadas de inteligencia artificial (IA), incluyendo ChatGPT. Este método ayuda a que los modelos descompongan problemas complejos en pasos intermedios manejables, lo que simula un razonamiento similar al humano y facilita la solución de problemas paso a paso.
De qué estamos hablando: Concepto y relevancia
El corazón de la cadena de pensamiento radica en hacer que los modelos de lenguaje abordan problemas complejos de una manera más estructurada, compleja y por tanto mucho más precisa. En lugar de saltar directamente a una respuesta, los modelos desarrollan un razonamiento detallado y transparente, justificando cada paso que toman. Esto no solo mejora la precisión de las respuestas, sino que también genera confianza en los resultados.
En el artículo "Iteratively Prompt Pre-trained Language Models for Chain of Thought" (2022), Boshi Wang y su equipo destacan que los modelos preentrenados (PLMs) poseen un vasto conocimiento interno, pero enfrentan retos al abordar tareas de razonamiento de múltiples pasos. Para resolver esto, proponen un marco iterativo que adapta los prompts según el contexto de cada paso del razonamiento, maximizando así la coherencia y la eficacia del modelo.
Más o menos calor: Ajuste de la temperatura
Un elemento crucial para implementar cadenas de pensamiento es el control de la temperatura. La temperatura controla la aleatoriedad de la respuesta (los valores más altos la hacen más creativa), por lo tanto es un parámetro que influye en la creatividad y precisión de las respuestas generadas por el modelo. Este ajuste puede marcar la diferencia en cómo se abordan distintos tipos de tareas:
- Tareas críticas y precisas: En problemas matemáticos o lógicos, se recomienda una temperatura baja (alrededor de 0.2), lo que asegura pasos intermedios consistentes y respuestas deterministas.
- Tareas exploratorias o abiertas: En escenarios creativos o de análisis más libre, una temperatura moderada (0.6-0.8) permite que el modelo explore múltiples enfoques sin comprometer la coherencia.
Lo anterior indica que las temperaturas cuando son bajas, se priorizará la consistencia y la exactitud, en contraste a la temperatura alta que promoverá creatividad y exploración. Este balance es crucial en los sistemas que requieren razonamiento lógico paso a paso (como la cadena de pensamiento) o donde busquemos innovación en las respuestas.
Cómo Check Auditor puede integrar la cadena de pensamiento en su desarrollo
En sistemas como Check Auditor, especializadas en gestión de riesgos, identificación de anomalías, prevención de fraudes y auditorías, la cadena de pensamiento puede transformar el análisis de datos y documentos, entregando mejores respuesta en la interacción con los usuarios. Algunos ejemplos que podríamos evidenciar son:
- Procesamiento de carpetas tributarias: la cadena de pensamientos podría facilitar el análisis exhaustivo de declaraciones fiscales. Al desglosar y verificar paso a paso cada componente, se pueden identificar inconsistencias o riesgos de manera más eficiente.
- Análisis de balances financieros: Con este enfoque, los modelos podrían examinar indicadores clave como liquidez, endeudamiento y rentabilidad, proporcionando un análisis claro de cómo cada elemento impacta en la salud financiera de una empresa.
- Revisión de causas judiciales: Al analizar documentos legales, los modelos podrían identificar puntos relevantes, extraer antecedentes y estructurar un resumen lógico que facilite la toma de decisiones legales.
- Evaluación de riesgos empresariales: la cadena de pensamientos puede ser una herramienta valiosa para prever riesgos en proyectos o inversiones, justificando cada predicción con explicaciones fundamentadas y claras.
Las posibilidades son infinitas, y como tales se deben ir abordando de manera 1 a 1, con el objeto de estudiarlas, procesarlas y disponibilizarlas de la manera más óptima de cara a clientes.
El marco iterativo propuesto por Wang y su equipo ha sido probado en diversos conjuntos de datos complejos, como 2WikiMultiHopQA, R4C, y LoT, demostrando mejoras notables en la precisión de las respuestas y la capacidad de identificar información intermedia relevante. Estos resultados subrayan el potencial de la cadena de pensamientos para abordar problemas que requieren razonamiento lógico y conexión de datos dispersos.
Además, investigaciones como la de Wei et al. (2022) han explorado cómo combinar la cadena de pensamientos con técnicas como Few-shot prompting puede superar las limitaciones de los modelos tradicionales, acercándolos a un nivel de razonamiento humano. Este punto (Few-shot prompting) podemos profundizarlo en un próximo artículo.
En el futuro, será crucial optimizar estos aspectos para hacer que la cadena de pensamientos sea más accesible y eficiente.
Conclusión
Para finalizar, podemos establecer que la cadena de pensamiento es una técnica transformadora en el ámbito de la inteligencia artificial. Al permitir a los modelos de lenguaje abordar problemas de manera más humana y estructurada, abre nuevas posibilidades en campos tan diversos como la educación, la ciencia y los negocios. En aplicaciones específicas como las desarrolladas por Check Auditor, la cadena de pensamiento tiene el potencial de automatizar y optimizar procesos críticos, mejorando la precisión y la eficiencia en el análisis tributario, financiero y legal. Este avance no solo simplifica tareas complejas, sino que también impulsa una toma de decisiones más fundamentada, rápida y confiable.