En un sector donde la precisión es crítica y los errores pueden tener consecuencias graves, la implementación de Pharma.IA con lenguajes especializados representa una revolución. "La diferencia entre un LLM generalista y uno especializado es como la diferencia entre un médico general y un cirujano especializado", explica su creador Leandro Mbarak.
“Nuestros modelos están diseñados para comprender no sólo el lenguaje técnico de la industria, sino también para adaptarse a las necesidades específicas de los profesionales de la salud, garantizando un nivel de precisión y eficiencia sin precedentes”, agregó.
Los Modelos de Lenguaje de Gran Escala, conocidos como LLM por sus siglas en inglés, son una forma avanzada de inteligencia artificial que ha capturado la atención del mundo tecnológico por su capacidad de procesar y generar texto con un nivel de sofisticación que se acerca a la comprensión humana.
Estos modelos, entrenados con vastas cantidades de datos textuales, no sólo pueden responder preguntas o redactar informes, sino que también pueden realizar análisis complejos, lo que los convierte en herramientas indispensables en sectores que dependen del manejo de grandes volúmenes de información, como la industria farmacéutica.
El Meticuloso Proceso de Fine-Tuning: perfeccionando la Inteligencia Artificial
El desarrollo de estos modelos no se limitó a la utilización de datos preexistentes. En Pharma.IA, se ha llevado a cabo un proceso riguroso conocido como “fine-tuning” o ajuste fino. Este proceso consiste en tomar modelos de lenguaje ya existentes y entrenarlos con un conjunto de datos especializado que refleja el lenguaje técnico y las necesidades específicas de la industria farmacéutica.
En el caso de Pharma.IA, este dataset está compuesto por aproximadamente 80 millones de palabras, recopiladas y generadas a lo largo de un año. Cada palabra de este dataset fue cuidadosamente revisada por expertos del sector, asegurando que los modelos no sólo comprendan el lenguaje, sino que sean capaces de interpretar y analizar información en un contexto clínico y científico de alta complejidad.
“Es como enseñar a un profesional ya calificado a convertirse en un especialista en un campo particular," detalla Mbarak. "El fine-tuning asegura que nuestros modelos no solo puedan hablar el idioma de la farmacología, sino que también puedan realizar tareas de análisis profundo, ofreciendo un soporte valioso a los profesionales del sector en sus decisiones diarias.”
Pharma.IA no es solo un proyecto nacional; es una startup con una visión global, nacida en uno de los epicentros de la innovación mundial: el MIT.
Fundada en 2023, durante el período en que Leandro Mbarak cursaba su certificación como Chief Digital Officer en esta prestigiosa institución, la empresa ha seguido un camino de crecimiento sostenido, respaldado por la formación continua de su fundador en ciencias de datos e inteligencia artificial. Además, la startup ha recibido un apoyo significativo del programa Microsoft Startups Founders Hub, que ha sido crucial para la inversión en la infraestructura informática necesaria para desarrollar estos complejos proyectos de inteligencia artificial.
Este respaldo no solo refleja la confianza en el potencial de Pharma.IA, sino que también abre la puerta a futuras colaboraciones y desarrollos que podrían cambiar la forma en que operan las industrias reguladas, como la farmacéutica, en Argentina y el mundo.
Los 3 modelos que lanzó Pharma.IA
Los modelos de lenguaje avanzados desarrollados por Pharma.IA están diseñados para revolucionar las operaciones en los laboratorios farmacéuticos. Desde el análisis de grandes volúmenes de datos hasta la capacitación de personal y la asistencia en la preparación de documentación, estos modelos están destinados a potenciar las capacidades de los profesionales de la salud, minimizando errores y mejorando la eficiencia operativa.
Una de las características más destacadas de estos modelos es su capacidad para reducir las "alucinaciones" comunes en otros modelos de lenguaje, que son respuestas incorrectas generadas debido a la falta de contexto o datos erróneos.
Al estar entrenados con datos específicos del sector, los modelos de Pharma.IA garantizan que las respuestas sean precisas y relevantes, ofreciendo una ventaja competitiva a los laboratorios que decidan adoptarlos.
Pharma.IA ha lanzado tres modelos de lenguaje, cada uno con un enfoque y una funcionalidad diseñados para abordar diferentes necesidades dentro de la industria farmacéutica:
Liebre: Este modelo es sinónimo de agilidad y velocidad. Con su capacidad para procesar información rápidamente, Liebre es la herramienta ideal para aquellas aplicaciones que requieren resultados inmediatos, sin comprometer la precisión. Es perfecto para tareas cotidianas en las que la rapidez es crucial, como la consulta de bases de datos extensas o la generación rápida de informes.
Huemul: Con un enfoque en la robustez y la complejidad, Huemul es el modelo más avanzado de los tres. Está diseñado para los desafíos más exigentes de la industria, como la integración con sistemas de recuperación de información (RAG) que mejoran su capacidad analítica. Huemul es capaz de manejar grandes volúmenes de datos y realizar análisis detallados, lo que lo convierte en una herramienta indispensable para investigaciones clínicas y desarrollo de nuevos fármacos.
Puma: Equilibrando velocidad y capacidad, Puma es el modelo más versátil. Su diseño lo hace ideal para empresas que requieren un alto grado de seguridad y autonomía, permitiendo el uso de la inteligencia artificial sin depender de servicios en la nube. Puma es la opción perfecta para organizaciones que buscan mantener la privacidad y control total sobre sus datos, mientras aprovechan las ventajas de la inteligencia artificial.