Modelos de Inteligencia Artificial: breve historia y aplicaciones

24 Nov 2020

Christian Ramirez

Antes, si querías que una computadora hiciera algo nuevo tenías que programarlo. La programación, para quienes no la han practicado, requiere especificar con el más mínimo detalle cada paso que uno quiere que haga su computadora para alcanzar el objetivo. 

Si quieren que su ordenador haga algo que ustedes no saben hacer, entonces están ante un gran reto. Ese fue el reto al que se enfrentó Arthur Samuel. En 1956, quería que su computadora pudiera ganarle a él en un juego de damas. ¿Cómo se puede diseñar un programa que sea mejor que el programador? 

Se le ocurrió una idea: hizo jugar al computador contra sí mismo miles de veces. Funcionó, y en 1962, este computador ganó la competición estatal de damas en Connecticut. Con este experimento, nació el aprendizaje automático o aprendizaje de máquina.

Mi primer acercamiento con usos reales del aprendizaje de máquina fue cuando trabajé en Google. Quizás el primer gran éxito del aprendizaje automático en el mercado fue precisamente Google. Esta empresa demostró que era posible encontrar información usando un algoritmo informático basado en aprendizaje automático. Desde entonces, ha habido muchos éxitos comerciales del aprendizaje automático. Compañías como Amazon y Netflix lo usan para sugerir artículos o películas que puedan interesarle al cliente; Facebook y LinkedIn lo aprovechan para sugerir amigos en común. En otros sectores, el aprendizaje de máquina se ha utilizado, por ejemplo, para entrenar los autos sin piloto.

Ahora sabemos que las computadoras pueden aprender y hacer cosas que el humano no puede hacer, o no lo hace tan bien como las máquinas. Uno de los ejemplos más sorprendentes que he visto en aprendizaje automático ocurrió en un proyecto surgido en Kaggle, donde un equipo dirigido por un tal Geoffrey Hinton(en ese entonces un desconocido) de la Universidad de Toronto, ganó un concurso para el descubrimiento automático de medicamentos. Lo extraordinario fue no solo que batiera a todos los algoritmos desarrollados por Merck o la comunidad académica internacional, sino que, aunque nadie de su equipo tenía experiencia en química o biología, realizaron el proyecto en tan solo dos semanas.

¿Cómo lo hicieron? Usaron un algoritmo extraordinario llamado aprendizaje profundo. Fue tan exitoso que, unas semanas después, The New York Times publicó un artículo al respecto en su portada. 

El aprendizaje profundo es un algoritmo, inspirado en el cerebro humano, que no tiene limitaciones teóricas en lo que puede hacer. Cuantos más datos y tiempo de cálculo uno le dé, mejor funciona. 

Por ejemplo, el aprendizaje profundo es lo que hace posible que funcionen dispositivos y software de reconocimiento de voz y asistencia como SIRI, Google Home o Alexa.

Pero no se limita ahí. Lo extraordinario del aprendizaje profundo es que es un tipo de algoritmo que genera modelos pueden hacer casi cualquier cosa.

 Por ejemplo, también pueden ver. En una competencia en Alemania, llamada Banco de Prueba de Reconocimiento de Señales de Tránsito, el aprendizaje profundo ha aprendido a reconocer señales de tránsito. No solo reconoce señales de tránsito mejor que cualquier otro algoritmo, la clasificación mostró que era mejor que las personas, dos veces más bueno. 

En 2011, se concretó el primer ejemplo de computadoras que pueden ver mejor que las personas. Desde entonces, han ocurrido muchas cosas. En 2012, Google anunció que había hecho que un algoritmo de aprendizaje profundo viera vídeos en YouTube.

La máquina procesó la información de 16 000 computadoras al mes y aprendió, de manera independiente, conceptos como personas y gatos solo viendo los vídeos. Esto se parece mucho al aprendizaje humano. Los humanos no aprendemos porque nos cuenten lo que vemos, sino por nuestra propia experiencia.

 También en 2012, Geoffrey Hinton, que vimos anteriormente, ganó la famosa competición de ImageNet, logrando que una computara describiera los elementos de más de un millón y medio de imágenes.

A partir de 2014, el porcentaje de error en computadoras que reconocen imágenes llegó a un 6%, un número mejor que el de los humanos.

El que una computadora pueda ver, escuchar o entender, ya es interesante, pero si juntamos todo esto en una sola máquina, podemos llegar a oportunidades apasionantes. 

Por ejemplo, en medicina, un equipo de Boston anunció que habían descubierto decenas de características clínicas relevantes sobre tumores que ayudan a los médicos a hacer un diagnóstico de un cáncer. En Stanford, un grupo anunció que, mirando un tejido con aumento, habían desarrollado una máquina basada en el sistema de aprendizaje que es mejor que los patólogos humanos prediciendo las tasas de supervivencia de los enfermos de cáncer. 

En ambos casos, no solo fueron predicciones más precisas, sino que generaron una nueva ciencia reveladora. En el caso de la radiología, hubo nuevos indicadores clínicos que las personas pueden entender. En este caso de patología, el sistema informático descubrió que las células alrededor del cáncer son tan importantes como las células del cáncer mismo al hacer un diagnóstico. Esto es lo contrario de lo que los patólogos habían pensado por décadas. En cada uno de estos casos, fueron sistemas desarrollados por una combinación de expertos médicos y expertos del aprendizaje profundo.

Hasta ahora hemos visto 2 tipos de modelos de inteligencia artificial: por un lado, tenemos el aprendizaje de máquina y, por otro, el aprendizaje profundo. El campo de la inteligencia artificial es más amplio. Por ejemplo, tenemos los sistemas expertos o los algoritmos genéticos, que de ellos y sus aplicaciones hablaremos en otro momento.

Con todo lo que ya vimos que son capaces de hacer estos modelos, ¿qué hemos hecho en Kata? Bueno, empleando diversas técnicas de aprendizaje de máquina y aprendizaje profundo, hemos creado soluciones muy diversas, estos son solo algunos ejemplos.

Identificación de documentos legibles

En los escenarios de donde funciona Mobile (un producto de Kata dedicado al trabajo en campo) es muy recurrente que los operadores tomen fotografías de documentos de identificación o comprobantes de domicilio. Estos documentos son de suma importancia para nuestros clientes ya que con ellos comprueban o validan datos de sus clientes. Por ello, uno de los elementos indispensables es garantizar que la imagen de esos documentos sea legible y por tal motivo hemos desarrollado un motor de visión que usa aprendizaje profundo y es capaz de definir si un documento es legible o no.

Esta solución está integrada al producto y sirve para informar al operador si una fotografía que tomó no es legible. De esta forma se evita que lleguen documentos ilegibles a nuestros clientes y sus procesos son mas eficientes ya que no deben devolver órdenes porque los documentos no se pueden leer.

Extracción de información de una identificación oficial con una fotografía

Creamos e integramos a nuestros productos un lector de la cédula de identificación colombiana. Este funciona con una combinación entre técnicas de cómputo de visión y aprendizaje de máquina. Así, con una simple fotografía es posible extraer todos los datos personales de dicha cédula, así como los datos biométricos contenidos en la misma. Adicionalmente, se puede evaluar si se trata de un documento legítimo, lo cual es de suma importancia para nuestros clientes pues existen problemas de suplantación de identidad.

Algunas de estas soluciones que hemos implementado en los diferentes productos de Kata también están disponibles y listas para ser integradas por terceros. Para ver una lista de estos servicios les dejo la liga del repositorio de código, donde se explica a detalle cada servicio, así como su mecanismo de integración.

https://github.com/formiiklabs/apis/wiki

Esta experiencia que tenemos diseñando y construyendo modelos de inteligencia artificial y que aprovechamos en nuestros productos también la ponemos a disposición de nuestros clientes. Un ejemplo de ello es el diseño e implementación de una solución para el sector de la construcción, que emplea inteligencia artificial para determinar la mejor ubicación de una nueva oficina o centro de distribución considerando elementos como la ubicación de los clientes, la residencia de los colaboradores, las vías de acceso, los históricos de tráfico y los medios de transporte empleados por cada colaborador. Para más detalle sobre esta solución podemos consultar la referencia de nuestro cliente https://dii360.com/blog/ubiica-algoritmo-360

Estos son algunos pocos ejemplos de lo que hemos hecho en Kata Software. Como hemos visto, hay un sinfín de posibilidades en donde podemos aplicar soluciones de aprendizaje de máquina como podrían ser las predicciones de demanda de producto o servicios, detección de anomalías en cualquier tipo de proceso, segmentación de clientes, y un largo etcétera.

Christian Ramirez

R&D Chief Scientist
Perfil LinkedIn

Tipo de Blog

Blog normal