Redes neuronales en medicina. El uso de redes neuronales artificiales para el diagnóstico precoz de la diabetes mellitus. Lo que enseñan las redes neuronales en Rusia

Hoy estamos viendo un auge en el desarrollo tecnologías de la información y su introducción gradual, y a veces revolucionaria, en nuestras vidas

Digitalización, robotización, inteligencia artificial, redes neuronales artificiales… Cuántos nuevos conceptos y términos ya empujan los horizontes de lo posible, obligándonos a pensarlos y entenderlos, a buscar su aplicación aplicada, eficaz y segura. Y, sin embargo, no importa cuán prometedoras sean las nuevas tecnologías, todas son productos de la vida humana, su mente, el trabajo del cerebro y el pensamiento.

¿Qué es una neurona?

El cerebro humano promedio tiene alrededor de 86 mil millones de neuronas conectadas por numerosas conexiones (en promedio, varios miles de conexiones por neurona, pero este número puede fluctuar mucho). Las neuronas son células especiales capaces de propagar señales electroquímicas. La neurona tiene una estructura de entrada de información ramificada (dendritas), un núcleo y una salida ramificada (axón). Los axones de una célula están conectados a las dendritas de otras células a través de sinapsis. Cuando se activa, una neurona envía una señal electroquímica por su axón. A través de las sinapsis, esta señal llega a otras neuronas, que a su vez pueden activarse. La neurona se activa cuando el nivel total de señales que llegaban a su núcleo desde las dendritas supera cierto nivel (umbral de activación).

Redes neuronales

Redes neuronales artificiales, inteligencia artificial, aprendizaje automático… ¿Qué significan hoy en día todas estas tendencias y términos de moda?

En el sentido general de la palabra, las redes neuronales (NN - Neural Networks) son modelos matemáticos que funcionan según el principio de las redes. células nerviosas organismo animal Las NN artificiales (ANN) se pueden implementar tanto en soluciones programables como de hardware. Para facilitar la percepción, una neurona se puede representar como un tipo de célula que tiene muchas entradas y una salida. La cantidad de señales entrantes que se transforman en una señal saliente está determinada por el algoritmo de cálculo. Cada entrada de una neurona recibe valores operativos, que luego se distribuyen a lo largo de las conexiones interneuronales (sinopsis). Las sinapsis tienen un parámetro: el peso, por lo que la información de entrada cambia al pasar de una neurona a otra.

tendencia de tiempo

En los últimos años, ha habido una explosión de interés en las RNA. Los investigadores, programadores y desarrolladores de modelos de hardware, están creando implementaciones creativas de software y hardware siempre nuevas y efectivas, basadas en el principio de organización y funcionamiento de las redes neuronales biológicas. Las redes neuronales son atractivas desde un punto de vista intuitivo, porque se basan en un modelo biológico de los sistemas nerviosos. En el futuro, el desarrollo de tales modelos neurobiológicos puede conducir a la creación de computadoras verdaderamente pensantes. Y para crear inteligencia artificial, necesita construir un sistema con una arquitectura similar.

donde se aplican

ANN debido a la capacidad de aprender, así como al hecho de que esto se debe a la apariencia varias maneras acelerando su aprendizaje se utilizan con éxito en diversas áreas de nuestra vida: negocios, medicina, tecnología, geología, física, etc. ANN, como un método de modelado excepcionalmente poderoso que le permite reproducir dependencias extremadamente complejas, encuentra aplicaciones cada vez más numerosas: el creación de procesos de sistemas de producción de autoaprendizaje, vehículos no tripulados, sistemas de reconocimiento de imágenes, sistemas de seguridad inteligente, robótica, sistemas de monitoreo de calidad, interfaces de interacción de voz, sistemas de análisis e inventos en muchas otras áreas donde es necesario resolver los problemas de procesamiento de lo acumulado enorme flujo de información: reconocimiento, predicción, clasificación, control. En la actualidad, el proceso de aprendizaje de ANN se ha vuelto mucho más rápido y fácil: las capacidades se han vuelto más poderosas medios tecnicos(crecimiento tecnológico de la capacidad de memoria, velocidad; acumulación constante de bases de datos, etc.). Las llamadas redes neuronales "pre-entrenadas" han comenzado a desarrollarse activamente, lo que puede acelerar significativamente el proceso de implementación de la tecnología.

Algunas ventajas

El impresionante éxito e interés en las ANN está determinado por la capacidad de hacer frente a tareas tales como sistemas para reconocer y clasificar objetos en imágenes y paisajes en el área de estudio, una interfaz de interacción de voz para Internet de las cosas, análisis de video, sistemas de autoaprendizaje. que optimizan la gestión de flujos de materiales o la ubicación de objetos; intelectual; sistemas de control de autoaprendizaje para procesos y dispositivos de producción (incluidos los robóticos), traducción universal sobre la marcha para conferencias y uso personal, etc. Y si es demasiado pronto para decir si las redes neuronales alguna vez podrán reproducir completamente el capacidades del cerebro humano, la probabilidad El hecho de que en la próxima década las ANN puedan reemplazar a una persona en una cuarta parte de las profesiones existentes se está volviendo cada vez más como la verdad.

Inteligencia artificial

¿Qué es la inteligencia artificial? Por inteligencia artificial (IA), los desarrolladores entienden la capacidad de una máquina para imitar el comportamiento inteligente de las personas, es decir, la capacidad de navegar en un contexto cambiante y, teniendo en cuenta estos cambios, tomar decisiones óptimas que permitan alcanzar el objetivo. Puede ser difícil para un médico diagnosticar correctamente una enfermedad, especialmente si no tiene mucha práctica o un caso específico está lejos de su experiencia profesional. Aquí la IA puede venir al rescate, teniendo acceso a bases de datos con miles y millones de historias de casos (y otra información ordenada, incluidos artículos recientes, libros de texto, literatura médica especializada). Con la ayuda de algoritmos de aprendizaje automático, la IA clasifica un caso específico, escanea rápidamente la literatura científica sobre el tema que se ha publicado durante un período de tiempo determinado, estudia casos similares disponibles y propone un plan de tratamiento. Además, la IA podrá proporcionar un enfoque individualizado, teniendo en cuenta la información sobre caracteristicas geneticas el paciente, los patrones de movimiento recopilados por sus dispositivos portátiles, el historial médico anterior: toda la historia de la vida. La IA probablemente (al menos en la etapa actual de desarrollo de la tecnología) no reemplazará al médico, pero puede convertirse y ya se está convirtiendo en una herramienta útil, un asistente en el diagnóstico y el tratamiento.

¿Por qué es necesario en medicina?

Medicina, antes enfocada principalmente en el tratamiento enfermedades agudas, ahora podrá prestar más atención a las dolencias crónicas, muchas de las cuales no se consideraban enfermedades hace no mucho tiempo. Ya hoy, el volumen de datos médicos está creciendo rápidamente, queda claro que la velocidad y la calidad del análisis determinan la salud y la calidad de vida del paciente. Los médicos a menudo se enfrentan a la necesidad de tratar la obesidad, la depresión y las enfermedades de los ancianos. La diabetes, la insuficiencia cardíaca y los trastornos autoinmunes se diagnostican cada vez más fuera de la fase de exacerbación, en las etapas más tempranas, y no solo hablamos de terapia de mantenimiento, sino también de la capacidad de curar y corregir por completo estas disfunciones sistémicas del cuerpo. Se está desarrollando la medicina preventiva, que permite reconocer la predisposición a cierto tipo de enfermedades incluso antes de su manifestación, y la necesaria pertinencia para tomar las medidas oportunas. Y todo esto es trabajo para la IA.

Pronóstico para la odontología

Los investigadores de ANN predicen que el uso de redes neuronales en odontología también se desarrollará rápidamente en un futuro próximo. Esta dirección permitirá un análisis más rápido de una gran cantidad de información necesaria orientada al objetivo profesional y, lo que es más importante, podrá guiar y dar pistas a los médicos para resolver problemas clínicos complejos.

El material fue preparado de acuerdo a los datos.
Fuentes de Internet Galina Masis

Buenas tardes, mi nombre es Natalia Efremova y soy científica investigadora en NtechLab. Hoy hablaré sobre los tipos de redes neuronales y su aplicación.

Primero, permítanme decir algunas palabras sobre nuestra empresa. La empresa es nueva, quizás muchos de ustedes no saben lo que hacemos. El año pasado ganamos el desafío MegaFace. Esta es una competencia internacional de reconocimiento facial. En el mismo año se inauguró nuestra empresa, es decir, llevamos en el mercado alrededor de un año, incluso un poco más. Por ello, somos una de las empresas líderes en reconocimiento facial y procesamiento biométrico de imágenes.

La primera parte de mi informe estará dirigida a aquellos que no están familiarizados con las redes neuronales. Estoy directamente involucrado en el aprendizaje profundo. He estado trabajando en esta área durante más de 10 años. Aunque apareció hace poco menos de una década, existían unos rudimentos de redes neuronales que parecían un sistema de aprendizaje profundo.

En los últimos 10 años, el aprendizaje profundo y visión por computador desarrollado a un ritmo increíble. Todo lo que se ha hecho significativo en esta área ha sucedido en los últimos 6 años.

Hablaré de aspectos prácticos: dónde, cuándo, qué aplicar en términos de aprendizaje profundo para el procesamiento de imágenes y videos, para el reconocimiento de imágenes y rostros, ya que trabajo para una empresa que hace esto. Hablaré un poco sobre el reconocimiento de emociones, qué enfoques se utilizan en los juegos y la robótica. También hablaré sobre la aplicación no estándar del aprendizaje profundo, algo que recién está saliendo de las instituciones científicas y todavía se usa poco en la práctica, cómo se puede aplicar y por qué es difícil de aplicar.

El informe constará de dos partes. Dado que la mayoría de la gente está familiarizada con las redes neuronales, primero explicaré rápidamente cómo funcionan las redes neuronales, qué son las redes neuronales biológicas, por qué es importante para nosotros saber cómo funcionan, qué son las redes neuronales artificiales y qué arquitecturas se utilizan en qué áreas

Pido disculpas de inmediato, saltaré un poco a la terminología en inglés, porque ni siquiera sé la mayor parte de cómo se llama en ruso. Quizás tú también.

Entonces, la primera parte del informe estará dedicada a las redes neuronales convolucionales. Explicaré cómo funciona el reconocimiento de imágenes de la red neuronal convolucional (CNN) utilizando un ejemplo de reconocimiento facial. Hablaré un poco sobre las redes neuronales recurrentes (RNN) y el aprendizaje por refuerzo usando el ejemplo de los sistemas de aprendizaje profundo.

Como una aplicación no estándar de las redes neuronales, hablaré sobre cómo funciona CNN en medicina para el reconocimiento de imágenes de vóxel, cómo se utilizan las redes neuronales para reconocer la pobreza en África.

¿Qué son las redes neuronales?

Curiosamente, las redes neuronales biológicas sirvieron como prototipo para crear redes neuronales. Quizás muchos de ustedes saben cómo programar una red neuronal, pero creo que de dónde vino, algunos no. Dos tercios de toda la información sensorial que nos llega proviene de los órganos visuales de percepción. Más de un tercio de la superficie de nuestro cerebro está ocupado por las dos áreas visuales más importantes: la vía visual dorsal y la vía visual ventral.

La vía visual dorsal comienza en la zona visual primaria, en la coronilla, y continúa hacia arriba, mientras que la vía ventral comienza en la parte posterior de la cabeza y termina aproximadamente detrás de las orejas. Todo el reconocimiento de patrones importantes que tenemos, todo el significado del que somos conscientes, tiene lugar justo ahí, detrás de las orejas.

¿Por qué es importante? Porque muchas veces es necesario entender las redes neuronales. En primer lugar, todo el mundo habla de ello, y ya estoy acostumbrado a que suceda, y en segundo lugar, el hecho es que todas las áreas que se utilizan en las redes neuronales para el reconocimiento de patrones nos llegaron precisamente desde la vía visual ventral, donde cada una de ellas es un pequeño zone es responsable de su función estrictamente definida.

La imagen nos llega desde la retina, pasa por una serie de zonas visuales y finaliza en la zona temporal.

En los lejanos años 60 del siglo pasado, cuando apenas comenzaba el estudio de las áreas visuales del cerebro, se realizaron los primeros experimentos en animales, pues no existía la resonancia magnética funcional. El cerebro fue examinado usando electrodos implantados en varias zonas visuales.

La primera zona visual fue explorada por David Hubel y Thorsten Wiesel en 1962. Hicieron experimentos con gatos. A los gatos se les mostraron varios objetos en movimiento. A lo que respondieron las células cerebrales fue al estímulo que el animal reconoció. Incluso ahora, muchos experimentos se llevan a cabo de esta manera draconiana. Sin embargo, esto es lo más metodo efectivo averiguar qué está haciendo cada pequeña célula de nuestro cerebro.

De la misma manera, se descubrieron muchas más propiedades importantes de las zonas visuales que usamos en el aprendizaje profundo ahora. Una de las propiedades más importantes es el aumento de los campos receptivos de nuestras células a medida que pasamos de las áreas visuales primarias a los lóbulos temporales, es decir, las áreas visuales posteriores. El campo receptivo es esa parte de la imagen que cada célula de nuestro cerebro procesa. Cada célula tiene su propio campo receptivo. Esta misma propiedad se conserva en las redes neuronales, como probablemente todos saben.

Además, con el aumento de los campos receptivos aumentan los estímulos complejos que las redes neuronales suelen reconocer.

Aquí se ven ejemplos de complejidad de estímulos, varias formas bidimensionales que se reconocen en las áreas V2, V4 y varias partes campos temporales en macacos. También se están llevando a cabo varios experimentos de resonancia magnética.

Aquí puedes ver cómo se llevan a cabo tales experimentos. Esta es una parte de 1 nanómetro de la corteza de TI "unas zonas del mono al reconocer varios objetos. Resaltado donde se reconoce.

Resumamos. Una propiedad importante que queremos adoptar de las áreas visuales es que aumentan los tamaños de los campos receptivos y aumenta la complejidad de los objetos que reconocemos.

visión por computador

Antes aprendimos cómo aplicar esto a la visión por computadora; en general, como tal, no existía. En cualquier caso, no funcionó tan bien como lo hace ahora.

Transferimos todas estas propiedades a la red neuronal, y ahora funciona, si no incluye una pequeña digresión a los conjuntos de datos, de los que hablaré más adelante.

Pero primero, un poco sobre el perceptrón más simple. También se forma a imagen y semejanza de nuestro cerebro. El elemento más simple que se asemeja a una célula cerebral es una neurona. Tiene elementos de entrada que por defecto son de izquierda a derecha, ocasionalmente de abajo hacia arriba. A la izquierda están las partes de entrada de la neurona, a la derecha están las partes de salida de la neurona.

El perceptrón más simple es capaz de realizar solo las operaciones más básicas. Para realizar cálculos más complejos, necesitamos una estructura con gran cantidad capas ocultas.

En el caso de la visión artificial, necesitamos aún más capas ocultas. Y solo entonces el sistema reconocerá de manera significativa lo que ve.

Entonces, qué sucede al reconocer una imagen, te lo diré usando el ejemplo de las caras.

Para nosotros, mirar esta imagen y decir que representa el rostro de la estatua es bastante simple. Sin embargo, hasta 2010, esta era una tarea increíblemente difícil para la visión artificial. Quienes hayan tratado este tema antes de este momento, probablemente sepan lo difícil que fue describir el objeto que queremos encontrar en la imagen sin palabras.

Tuvimos que hacerlo de alguna manera geométrica, describir el objeto, describir la relación del objeto, cómo estas partes pueden relacionarse entre sí, luego encontrar esta imagen en el objeto, compararlas y obtener lo que reconocimos mal. Por lo general, era un poco mejor que lanzar una moneda. Ligeramente mejor que el nivel de probabilidad.

Ahora este no es el caso. Dividimos nuestra imagen en píxeles o en algunos parches: 2x2, 3x3, 5x5, 11x11 píxeles, según convenga a los creadores del sistema en el que sirven como capa de entrada a la red neuronal.

Las señales de estas capas de entrada se transmiten de una capa a otra mediante sinapsis, cada una de las capas tiene sus propios coeficientes específicos. Así pasamos de capa en capa, de capa en capa, hasta llegar a que hemos reconocido la cara.

Convencionalmente, todas estas partes se pueden dividir en tres clases, las denotaremos como X, W e Y, donde X es nuestra imagen de entrada, Y es un conjunto de etiquetas y necesitamos obtener nuestros pesos. ¿Cómo calculamos W?

Dado nuestro X e Y, esto parece ser fácil. Sin embargo, lo que se indica con un asterisco es una operación no lineal muy compleja que, lamentablemente, no tiene inversa. Incluso con 2 componentes dados de la ecuación, es muy difícil calcularla. Por lo tanto, debemos gradualmente, por prueba y error, seleccionando el peso W, asegurarnos de que el error disminuya lo más posible, es deseable que sea igual a cero.

Este proceso se da de forma iterativa, vamos decreciendo constantemente hasta encontrar el valor del peso W, que nos satisface lo suficiente.

Por cierto, ni una sola red neuronal con la que trabajé alcanzó un error igual a cero, pero funcionó bastante bien.

Esta es la primera red que ganó el concurso internacional ImageNet en 2012. Esta es la llamada AlexNet. Esta es la red que primero anunció, que hay redes neuronales convolucionales, y desde entonces, en todas las competencias internacionales, las redes neuronales convolucionales nunca han perdido sus posiciones.

A pesar de que esta red es bastante pequeña (solo tiene 7 capas ocultas), contiene 650.000 neuronas con 60 millones de parámetros. Para aprender iterativamente cómo encontrar los pesos correctos, necesitamos muchos ejemplos.

La red neuronal aprende del ejemplo de una imagen y una etiqueta. Como nos enseñan en la infancia “esto es un gato, esto es un perro”, las redes neuronales también se entrenan en en numeros grandes fotos. Pero el hecho es que antes de 2010 no había un conjunto de datos lo suficientemente grande que pudiera enseñar tantos parámetros para reconocer imágenes.

Las bases de datos más grandes que existían hasta ese momento eran PASCAL VOC, que tenía solo 20 categorías de objetos, y Caltech 101, que se desarrolló en el Instituto de Tecnología de California. El último tenía 101 categorías y eso era mucho. Aquellos que no pudieron encontrar sus objetos en ninguna de estas bases de datos tuvieron que costar sus bases de datos, lo cual, diré, es terriblemente doloroso.

Sin embargo, en 2010 apareció la base de datos ImageNet, en la que había 15 millones de imágenes, divididas en 22.000 categorías. Esto resolvió nuestro problema de entrenamiento de redes neuronales. Ahora todos los que tengan alguna dirección académica pueden ir fácilmente al sitio de la base, solicitar acceso y obtener esta base para entrenar sus redes neuronales. Responden bastante rápido, en mi opinión, al día siguiente.

En comparación con los conjuntos de datos anteriores, esta es una base de datos muy grande.

El ejemplo muestra cuán insignificante es todo lo que fue antes de ser. Simultáneamente a la base ImageNet, apareció la competición ImageNet, un reto internacional en el que pueden participar todos los equipos que deseen competir.

Este año ganó la red creada en China, tenía 269 capas. No sé cuántos parámetros, sospecho que son demasiados.

Arquitectura de red neuronal profunda

Convencionalmente, se puede dividir en 2 partes: los que estudian y los que no estudian.

El negro indica aquellas partes que no aprenden, todas las demás capas pueden aprender. Hay muchas definiciones de lo que hay dentro de cada capa convolucional. Una de las designaciones aceptadas es que una capa con tres componentes se divide en etapa de convolución, etapa de detector y etapa de agrupación.

No entraré en detalles, habrá muchos más informes que detallarán cómo funciona esto. Te lo cuento con un ejemplo.

Como los organizadores me pidieron que no mencionara muchas fórmulas, las descarté por completo.

Entonces, la imagen de entrada cae en una red de capas, que pueden llamarse filtros de diferentes tamaños y diferente complejidad de los elementos que reconocen. Estos filtros forman su propio índice o conjunto de características, que luego ingresan al clasificador. Por lo general, esto es SVM o MLP, un perceptrón multicapa, que es conveniente para cualquier persona.

A imagen y semejanza de una red neuronal biológica, se reconocen objetos de diversa complejidad. A medida que aumentaba el número de capas, todo esto perdía contacto con la corteza, ya que hay un número limitado de zonas en la red neuronal. 269 ​​o muchas, muchas zonas de abstracción, por lo que solo se salva un aumento de complejidad, número de elementos y campos receptivos.

Si nos fijamos en el ejemplo del reconocimiento facial, entonces nuestro campo receptivo de la primera capa será pequeño, luego un poco más, más, y así sucesivamente hasta que finalmente podamos reconocer todo el rostro.

En términos de lo que tenemos dentro de los filtros, primero habrá palos inclinados más algo de color, luego partes de las caras y luego la cara completa será reconocida por cada celda de la capa.

Hay gente que asegura que una persona siempre reconoce mejor que una red. ¿Es tan?

En 2014, los científicos decidieron probar qué tan bien reconocemos en comparación con las redes neuronales. Se llevaron 2 de los mejores este momento redes son AlexNet y la red de Matthew Ziller y Fergus, y se compara con la respuesta diferentes zonas cerebro de macaco, al que también se le enseñó a reconocer algunos objetos. Los objetos eran del reino animal para que el mono no se confundiera y se hacían experimentos para ver quién los reconocía mejor.

Como es claramente imposible obtener una respuesta de un mono, se le implantaron electrodos y se midió directamente la respuesta de cada neurona.

Resultó que en condiciones normales las células cerebrales respondieron tan bien como el modelo de última generación en ese momento, es decir, la red de Matthew Ziller.

Sin embargo, con un aumento en la velocidad de visualización de objetos, un aumento en la cantidad de ruidos y objetos en la imagen, la velocidad de reconocimiento y su calidad en nuestro cerebro y el cerebro de los primates se reducen drásticamente. Incluso la red neuronal convolucional más simple reconoce mejor los objetos. Es decir, oficialmente, las redes neuronales funcionan mejor que nuestro cerebro.

Problemas clásicos de redes neuronales convolucionales

En realidad no hay tantos, pertenecen a tres clases. Entre ellas se encuentran tareas tales como identificación de objetos, segmentación semántica, reconocimiento de rostros, reconocimiento de partes del cuerpo humano, detección de límites semánticos, selección de objetos de atención en la imagen y selección de normales a la superficie. Se pueden dividir condicionalmente en 3 niveles: desde las tareas de nivel más bajo hasta las tareas de nivel más alto.

Usando esta imagen como ejemplo, veamos qué hace cada una de las tareas.

  • Definición de límites- esta es la tarea de nivel más bajo para la que ya se utilizan clásicamente las redes neuronales convolucionales.
  • Definición de un vector a una normal nos permite reconstruir una imagen 3D a partir de una 2D.
  • Prominencia, definición de objetos de atención.- esto es a lo que una persona prestaría atención al considerar esta imagen.
  • Segmentación semántica le permite dividir los objetos en clases según su estructura, sin saber nada acerca de estos objetos, es decir, incluso antes de que sean reconocidos.
  • Resaltado de límites semánticos- esta es la selección de límites, divididos en clases.
  • Aislamiento de partes del cuerpo humano..
  • Y la tarea de más alto nivel - reconocimiento de los propios objetos, que ahora consideraremos usando el ejemplo del reconocimiento facial.

Reconocimiento facial

Lo primero que hacemos es ejecutar el detector de rostros sobre la imagen para encontrar el rostro. A continuación, normalizamos, centramos el rostro y lo procesamos en la red neuronal. Después de eso, obtenemos un conjunto o vector de características que describe de manera única las características de esta cara.

Luego podemos comparar este vector de características con todos los vectores de características que están almacenados en nuestra base de datos y obtener una referencia a una persona específica, a su nombre, a su perfil, todo lo que podemos almacenar en la base de datos.

Así es como funciona nuestro producto FindFace: es un servicio gratuito que lo ayuda a buscar perfiles de personas en la base de datos de VKontakte.

Además, disponemos de una API para empresas que quieran probar nuestros productos. Brindamos servicios de detección de rostros, verificación e identificación de usuarios.

Ahora hemos desarrollado 2 escenarios. El primero es la identificación, la búsqueda de una persona en una base de datos. La segunda es la verificación, esta es una comparación de dos imágenes con cierta probabilidad de que se trate de la misma persona. Además, actualmente estamos desarrollando el reconocimiento de emociones, el reconocimiento de imágenes de video y la detección de vida: se trata de comprender si una persona está viva frente a la cámara o frente a una fotografía.

Algunas estadísticas. Al identificar, al buscar 10 mil fotos, tenemos una precisión de alrededor del 95% dependiendo de la calidad de la base de datos, 99% de precisión de verificación. Y además de esto, este algoritmo es muy resistente a los cambios: no tenemos que mirar a la cámara, es posible que tengamos algunos objetos que bloquean: gafas, Gafas de sol, barba, mascarilla médica. En algunos casos, incluso podemos superar dificultades tan increíbles para la visión artificial como unas gafas y una máscara.

Búsqueda muy rápida, tarda 0,5 segundos en procesar mil millones de fotos. Hemos desarrollado un índice único de búsqueda rápida. También podemos trabajar con imágenes de baja calidad de cámaras de CCTV. Podemos procesarlo todo en tiempo real. Puede cargar fotos a través de la interfaz web, a través de Android, iOS y buscar entre 100 millones de usuarios y sus 250 millones de fotos.

Como dije, obtuvimos el primer lugar en la competencia MegaFace, un análogo de ImageNet, pero para reconocimiento facial. Lleva varios años funcionando, el año pasado fuimos los mejores entre 100 equipos de todo el mundo, incluido Google.

Redes neuronales recurrentes

Usamos redes neuronales recurrentes cuando no nos basta con reconocer solo la imagen. En los casos en que es importante para nosotros seguir la secuencia, necesitamos el orden de lo que está sucediendo con nosotros, usamos redes neuronales recurrentes ordinarias.

Se aplica al reconocimiento de lenguaje natural, procesamiento de video, incluso reconocimiento de imágenes.

No hablaré sobre el reconocimiento del lenguaje natural; después de mi informe, habrá dos más que estarán destinados al reconocimiento del lenguaje natural. Por lo tanto, hablaré sobre el trabajo de las redes recurrentes usando el ejemplo del reconocimiento de emociones.

¿Qué son las redes neuronales recurrentes? Esto es casi lo mismo que las redes neuronales regulares, pero con retroalimentación. Necesitamos retroalimentación para transmitir el estado previo del sistema a la entrada de la red neuronal oa una de sus capas.

Supongamos que procesamos emociones. Incluso en una sonrisa, una de las emociones más simples, hay varios momentos, desde una expresión facial neutra hasta el momento en que tenemos una sonrisa completa. Se suceden en secuencia. Para entender esto bien, necesitamos poder observar cómo sucede esto, para transferir lo que había en el cuadro anterior al siguiente paso del sistema.

En 2005, en la competencia Emotion Recognition in the Wild específicamente para el reconocimiento de emociones, un equipo de Montreal presentó un sistema recurrente que parecía muy simple. Tenía solo unas pocas capas convolucionales y trabajaba exclusivamente con video. Este año, también agregaron reconocimiento de audio y datos agregados cuadro por cuadro que se obtienen de redes neuronales convolucionales, datos de señales de audio con operación de red neuronal recurrente (con estado) y ganaron el primer lugar en la competencia.

Aprendizaje reforzado

El siguiente tipo de redes neuronales, que se usa con mucha frecuencia recientemente, pero que no ha recibido tanta publicidad como los 2 tipos anteriores, es el aprendizaje profundo, el aprendizaje por refuerzo.

El caso es que en los dos casos anteriores usamos bases de datos. Tenemos datos de caras, o datos de imágenes, o datos con emociones de videos. Si no lo tenemos, si no lo podemos filmar, ¿cómo podemos enseñarle al robot a recoger objetos? Hacemos esto automáticamente, no sabemos cómo funciona. Otro ejemplo: compilar grandes bases de datos en juegos de computadora es difícil y no es necesario, se puede hacer mucho más fácil.

Probablemente todo el mundo haya oído hablar del éxito del aprendizaje por refuerzo profundo en Atari y Go.

¿Quién ha oído hablar de Atari? Bueno, alguien escuchó, está bien. Creo que todo el mundo ha oído hablar de AlphaGo, así que ni siquiera les diré qué está pasando exactamente allí.

¿Qué está pasando en Atari? La arquitectura de esta red neuronal se muestra a la izquierda. Aprende jugando consigo misma para obtener la máxima recompensa. La recompensa máxima es el resultado más rápido del juego con la puntuación más alta posible.

Arriba a la derecha: la última capa de la red neuronal, que representa la cantidad total de estados del sistema, que jugó contra sí mismo durante solo dos horas. El rojo muestra los resultados deseados del juego con la recompensa máxima y el azul, indeseable. La red construye un determinado campo y se mueve a través de sus capas entrenadas hasta el estado que quiere alcanzar.

En robótica, la situación es un poco diferente. ¿Por qué? Aquí tenemos varias complicaciones. Primero, no tenemos muchas bases de datos. En segundo lugar, necesitamos coordinar tres sistemas a la vez: la percepción del robot, sus acciones con la ayuda de manipuladores y su memoria: qué se hizo en el paso anterior y cómo se hizo. En general, todo esto es muy difícil.

El hecho es que ninguna red neuronal, incluso el aprendizaje profundo en este momento, puede hacer frente a esta tarea con la suficiente eficiencia, por lo que el aprendizaje profundo es solo una parte de lo que los robots deben hacer. Por ejemplo, Sergey Levin proporcionó recientemente un sistema que le enseña a un robot a agarrar objetos.

Aquí están los experimentos que realizó en sus 14 brazos robóticos.

¿Que está pasando aqui? En estos cuencos que ves frente a ti, hay varios objetos: bolígrafos, gomas de borrar, tazas más pequeñas y más grandes, trapos, diferentes texturas, diferentes durezas. No está claro cómo entrenar al robot para capturarlos. Durante muchas horas, e incluso semanas, robots entrenados para poder capturar estos objetos, se compilaron bases de datos en esta ocasión.

Las bases de datos son una especie de respuesta del entorno que necesitamos acumular para poder entrenar al robot para que haga algo en el futuro. En el futuro, los robots serán entrenados en este conjunto de estados del sistema.

Aplicaciones no estándar de las redes neuronales

Desafortunadamente este es el final, no tengo mucho tiempo. Hablaré de aquellas soluciones no estándar que existen ahora y que, según muchas previsiones, tendrán alguna aplicación en el futuro.

Entonces, los científicos de Stanford idearon recientemente una aplicación muy inusual de la red neuronal CNN para la predicción de la pobreza. ¿Que hicieron?

En realidad el concepto es muy simple. El hecho es que en África el nivel de pobreza supera todos los límites imaginables e imaginables. Ni siquiera tienen la capacidad de recopilar datos demográficos sociales. Por lo tanto, desde 2005, no tenemos ningún dato sobre lo que está sucediendo allí.

Los científicos recopilaron mapas diurnos y nocturnos de los satélites y los alimentaron a la red neuronal con el tiempo.

La red neuronal se preconfiguró en ImageNet "e. Es decir, se configuraron las primeras capas de filtros para que pudiera reconocer algunas cosas muy simples, por ejemplo, techos de casas, para buscar un asentamiento en mapas diurnos. Luego se crearon mapas diurnos. en comparación con los mapas nocturnos, la iluminación de una misma zona de la superficie para poder decir cuánto dinero tiene la población para al menos iluminar sus casas durante la noche.

Aquí se ven los resultados de la predicción construida por la red neuronal. El pronóstico se hizo con diferentes resoluciones. Y verás, el último cuadro, datos reales recopilados por el gobierno de Uganda en 2005.

Se puede ver que la red neuronal hizo una predicción bastante precisa, incluso con un ligero cambio desde 2005.

Había, por supuesto, efectos secundarios. Los científicos que se dedican al aprendizaje profundo siempre se sorprenden al encontrar diferentes efectos secundarios. Por ejemplo, como aquellos que la red ha aprendido a reconocer agua, bosques, grandes obras de construcción, carreteras, todo esto sin maestros, sin bases de datos preconstruidas. Generalmente completamente independiente. Había ciertas capas que reaccionaban, por ejemplo, a las carreteras.

Y última aplicación del que me gustaría hablar es de la segmentación semántica de imágenes 3D en medicina. En general, las imágenes médicas son un área compleja con la que es muy difícil trabajar.

Hay varias razones para esto.

  • Tenemos muy pocas bases de datos. No es tan fácil encontrar una foto del cerebro, además de dañado, y además es imposible sacarla de cualquier lado.
  • Incluso si tenemos una imagen de este tipo, necesitamos llevar a un médico y obligarlo a colocar manualmente todas las imágenes de varias capas, lo que consume mucho tiempo y es extremadamente ineficiente. No todos los médicos tienen los recursos para hacer esto.
  • Se requiere una precisión muy alta. El sistema médico no puede estar equivocado. Al reconocer, por ejemplo, focas, no reconocieron, está bien. Y si no reconocemos el tumor, entonces esto no es muy bueno. Hay requisitos especialmente estrictos para la confiabilidad del sistema.
  • Imágenes en elementos tridimensionales: vóxeles, no píxeles, lo que aporta una complejidad adicional a los diseñadores de sistemas.
Pero, ¿cómo solucionaste este problema en este caso? CNN era de doble flujo. Una parte procesó una resolución más normal, la otra una resolución ligeramente peor para reducir la cantidad de capas que necesitamos entrenar. Debido a esto, el tiempo de formación de la red se redujo ligeramente.

Dónde se usa: para determinar el daño después de un golpe, para buscar un tumor en el cerebro, en cardiología para determinar cómo funciona el corazón.

Aquí hay un ejemplo para determinar el volumen de la placenta.

Automáticamente, funciona bien, pero no lo suficiente como para lanzarlo a producción, por lo que apenas está comenzando. Hay varias startups para crear este tipo de sistemas. vision medica. En general, hay muchas nuevas empresas en aprendizaje profundo en el futuro cercano. Dicen que los capitalistas de riesgo han asignado más presupuesto para nuevas empresas de aprendizaje profundo en los últimos seis meses que en los últimos 5 años.

Esta área se está desarrollando activamente, hay muchas direcciones interesantes. Estamos viviendo tiempos interesantes. Si está involucrado en el aprendizaje profundo, entonces probablemente sea hora de que abra su propia startup.

Bueno, probablemente terminaré con esto. Muchísimas gracias.

17.04.1997 Alexander Yezhov, Vladímir Chechetkin

Dolor agudo en el pecho. Ambulancia entrega al paciente a la sala de emergencias, donde el médico de turno debe hacer un diagnóstico y determinar si realmente se trata de un infarto de miocardio. La experiencia demuestra que la proporción de pacientes que han sufrido un infarto entre los ingresados ​​con síntomas similares es pequeña. métodos precisos sin embargo, todavía falta el diagnóstico. El electrocardiograma a veces no contiene signos evidentes de la enfermedad. ¿Y cuántos parámetros de la condición del paciente pueden ayudar de una forma u otra a hacer el diagnóstico correcto en este caso? Más de cuarenta. ¿Puede un médico sala de emergencias analizar rápidamente todos estos indicadores junto con las relaciones para tomar una decisión sobre la dirección del paciente al departamento de cardiología? Hasta cierto punto, las tecnologías de redes neuronales ayudan a resolver este problema. Redes neuronales para tareas de diagnóstico Sistemas concretos Posibilidades de aplicación de las redes neuronales Lucha contra el cáncer Neurosistemas, genética y moléculas Las redes neuronales caminan por el planeta En lugar de una conclusión Dolor torácico agudo. Ambulancia entrega

Dolor agudo en el pecho. Una ambulancia traslada al paciente a urgencias, donde el médico de guardia debe realizar un diagnóstico y determinar si realmente se trata de un infarto de miocardio. La experiencia demuestra que la proporción de pacientes que han sufrido un infarto entre los ingresados ​​con síntomas similares es pequeña. Sin embargo, todavía no existen métodos de diagnóstico precisos. El electrocardiograma a veces no contiene signos evidentes de la enfermedad. ¿Y cuántos parámetros de la condición del paciente pueden ayudar de una forma u otra a hacer el diagnóstico correcto en este caso? Más de cuarenta. ¿Puede el médico de urgencias analizar rápidamente todos estos indicadores, junto con sus relaciones, para tomar la decisión de derivar al paciente al servicio de cardiología? Hasta cierto punto, las tecnologías de redes neuronales ayudan a resolver este problema. .

Las estadísticas son las siguientes: el médico diagnostica correctamente el infarto de miocardio en el 88% de los pacientes y hace este diagnóstico erróneamente en el 29% de los casos. Hay demasiadas falsas alarmas (sobrediagnóstico). Historial de aplicaciones varios métodos El procesamiento de datos para mejorar la calidad del diagnóstico se remonta a décadas atrás, pero el mejor de ellos ayudó a reducir el número de casos de sobrediagnóstico en solo un 3%.

En 1990, William Bakst, de la Universidad de California en San Diego, utilizó una red neuronal, un perceptrón multicapa, para reconocer el infarto de miocardio en pacientes ingresados ​​en la sala de emergencias con dolor agudo en el pecho. Su objetivo era crear una herramienta que pueda ayudar a los médicos que no pueden hacer frente al flujo de datos que caracteriza la condición del paciente ingresado. Otro objetivo puede ser mejorar los diagnósticos. El investigador dificultó su tarea, pues analizó los datos solo de aquellos pacientes que ya habían sido derivados al servicio de cardiología. Bakst utilizó sólo 20 parámetros, entre los que se encontraban edad, sexo, localización del dolor, respuesta a la nitroglicerina, náuseas y vómitos, sudoración, síncope, frecuencia respiratoria, frecuencia cardíaca, infartos previos, diabetes, hipertensión, distensión de la vena yugular, una serie de Características del ECG y la presencia de cambios isquémicos significativos.

La red tuvo una precisión del 92 % en la detección de infarto de miocardio y produjo solo un 4 % de falsas alarmas, lo que confirmó erróneamente la derivación de pacientes sin infarto al departamento de cardiología. Entonces, existe un hecho de la aplicación exitosa de redes neuronales artificiales en el diagnóstico de la enfermedad. Ahora es necesario explicar en qué parámetros se evalúa la calidad del diagnóstico en el caso general. Supongamos que de cada diez personas que realmente tienen un ataque al corazón, el método de diagnóstico puede detectar la enfermedad en ocho. Entonces la sensibilidad del método será del 80%. Si tomamos diez personas que no tienen un infarto, y el método de diagnóstico lo sospecha en tres personas, entonces la proporción alarmas falsas será del 30%, mientras que una característica adicional, la especificidad del método, será igual al 70%.

Un método de diagnóstico ideal debe tener una sensibilidad y especificidad del cien por cien: en primer lugar, no perder a una sola persona realmente enferma y, en segundo lugar, no asustar a las personas sanas. Para asegurarse, puede y debe intentar, en primer lugar, garantizar la sensibilidad del método al cien por cien; no puede perderse la enfermedad. Pero esto resulta, por regla general, en la baja especificidad del método: en muchas personas, los médicos sospechan enfermedades que los pacientes en realidad no padecen.

Redes neuronales para tareas de diagnóstico

Las redes neuronales son sistemas no lineales que permiten una clasificación de datos mucho mejor que la que se usa habitualmente. métodos lineales. Cuando se aplican al diagnóstico médico, permiten aumentar significativamente la especificidad del método sin reducir su sensibilidad.

Recuerde que la red neuronal que diagnostica un infarto de miocardio trabajaba con un gran conjunto de parámetros, cuyo impacto en el diagnóstico de una persona no se puede evaluar. Sin embargo, las redes neuronales pudieron tomar decisiones basadas en los patrones ocultos que identificaron en datos multidimensionales. Una característica distintiva de las redes neuronales es que no están programadas; no usan ninguna regla de inferencia para hacer un diagnóstico, pero están entrenadas para hacerlo con ejemplos. En este sentido, las redes neuronales no se parecen en nada a los sistemas expertos, cuyo desarrollo en los años 70 se produjo tras la “victoria” temporal de la Inteligencia Artificial sobre el enfoque del modelado de la memoria, el reconocimiento de patrones y la generalización, que se basó en el estudio de la organización neural del cerebro.

Uno de los más conocidos de los sistemas expertos desarrollados, cuyo funcionamiento se basaba en el conocimiento extraído de expertos y en la implementación de procedimientos de inferencia, fue el sistema MYCIN. Este sistema fue desarrollado en Stanford a principios de los años 70 para diagnosticar shock séptico. La mitad de los pacientes morían a causa de ella en un día, y los médicos podían detectar sepsis en solo el 50% de los casos. MYCIN parecía ser un verdadero triunfo de la tecnología de sistemas expertos, ya que podía detectar la sepsis el 100 % de las veces. Sin embargo, después de familiarizarse más con este sistema experto, los médicos han mejorado significativamente métodos tradicionales diagnósticos, y MYCIN perdió su significado, convirtiéndose sistema educacional. Los sistemas expertos "fueron" solo en cardiología, para el análisis de electrocardiogramas. Las complejas reglas que constituyen el contenido principal de los libros de análisis clínico de ECG han sido utilizadas por los sistemas apropiados para emitir una conclusión diagnóstica.

El diagnóstico es un caso especial de clasificación de eventos, y el más valioso es la clasificación de aquellos eventos que no están en el conjunto de entrenamiento de la red neuronal. Aquí se manifiesta la ventaja de las tecnologías de redes neuronales: pueden realizar dicha clasificación, generalizando la experiencia anterior y aplicándola en nuevos casos.

Sistemas específicos

Un ejemplo de un programa de diagnóstico es el paquete de cardiodiagnóstico desarrollado por RES Informatica junto con el Centro de Investigación en Cardiología de Milán. El programa permite realizar cardiodiagnósticos no invasivos basados ​​en el reconocimiento de espectros de tacogramas. El tacograma es un histograma de los intervalos entre latidos cardíacos sucesivos, y su espectro refleja el equilibrio de las actividades del sistema nervioso simpático y parasimpático humano, que cambia específicamente en diversas enfermedades.

De una forma u otra, ya se puede afirmar que las redes neuronales se están convirtiendo en una herramienta para el cardiodiagnóstico; en Inglaterra, por ejemplo, se utilizan en cuatro hospitales para prevenir el infarto de miocardio.

En medicina, también se utiliza otra característica de las redes neuronales: su capacidad para predecir secuencias temporales. Ya se ha señalado que los sistemas expertos han tenido éxito en el análisis de ECG. Las redes neuronales también son útiles aquí. Ki Zhenghu, Yu Henu y Willis Tompkins de la Universidad de Wisconsin han desarrollado un sistema de filtrado de redes neuronales para electrocardiogramas que puede suprimir el ruido no lineal y no estacionario mucho mejor que los métodos utilizados anteriormente. El caso es que la red neuronal predijo bien el ruido por sus valores en momentos anteriores. Y el hecho de que las redes neuronales son muy efectivas para predecir secuencias de tiempo (como tipos de cambio o cotizaciones bursátiles) quedó convincentemente demostrado por los resultados de la competencia de programas predictivos realizada por la Universidad de Santa Fe: las redes neuronales ocuparon el primer lugar y dominaron entre los mejores métodos.

Posibilidades de uso de redes neuronales

El ECG es una aplicación privada, aunque extremadamente importante. Sin embargo, hoy en día hay muchos otros ejemplos del uso de redes neuronales para predicciones médicas. Se sabe que las largas colas en los departamentos de cirugía cardíaca (de semanas a meses) son causadas por la escasez de unidades de cuidados intensivos. No es posible aumentar su número debido al alto costo de la atención de reanimación (los estadounidenses gastan el 70% de los fondos en las últimas 2 semanas de vida en este departamento).

La única salida es utilizar los fondos disponibles de manera más eficiente. Supongamos que la condición de los pacientes operados en un día determinado es tan grave que necesitan una estadía prolongada en la unidad de cuidados intensivos (más de dos días). Todo este tiempo, los cirujanos estarán ociosos, porque no hay dónde colocar a los pacientes recién operados. Es más prudente operar a los pacientes gravemente enfermos antes de los fines de semana o días festivos: los quirófanos aún están cerrados estos días, los cirujanos descansarán y los pacientes se recuperarán en cuidados intensivos. Pero al comienzo de la semana laboral, es mejor operar a aquellos pacientes que necesitarán estar en la unidad de cuidados intensivos solo uno o dos días. Luego, las camas en la unidad de cuidados intensivos se desocuparán más rápido y aceptarán nuevos pacientes operados el martes y el miércoles.

La pregunta es cómo adivinar quién tendrá que permanecer en la unidad de cuidados intensivos durante mucho tiempo después de la operación y quién no. Jack Too y Michael Guerier del Hospital St. Michael de la Universidad de Toronto utilizaron redes neuronales para hacer esta predicción. Como datos iniciales se tomaron únicamente aquellos datos del paciente que se conocen en el preoperatorio. Tenga en cuenta que en trabajos anteriores que no utilizan redes neuronales, como factores aumento del riesgo estancia en la unidad de cuidados intensivos, también se utilizó información importante postoperatoria - diversas complicaciones que surgieron durante la intervención quirúrgica.

Tu y Guerir entrenaron un perceptrón de dos capas para dividir a los pacientes en tres grupos de riesgo, según su edad, género, estado funcional ventrículo izquierdo, el grado de complejidad de la próxima operación y la presencia enfermedades concomitantes. De los pacientes identificados por la red como de bajo riesgo de demora en cuidados intensivos, solo el 16,3 % pasó más de dos días en cuidados intensivos. Al mismo tiempo, más del 60% de los identificados por la red como de alto riesgo cumplieron con el pronóstico desfavorable.

Lucha contra el cáncer

Nosotros pagamos Atención especial enfermedades cardiovasculares, ya que son ellos quienes ostentan el triste liderazgo en la lista de causas de muerte. En segundo lugar se encuentran las enfermedades oncológicas. Una de las principales áreas en las que se está trabajando actualmente en el uso de redes neuronales es el diagnóstico del cáncer de mama. Esta enfermedad es la causa de muerte de cada novena mujer.

La detección del tumor se lleva a cabo durante el análisis de rayos X inicial de la mama (mamografía) y el análisis posterior de una pieza de tejido tumoral (biopsia). A pesar de que existen reglas generales para diferenciar las neoplasias benignas de las malignas, según la mamografía, solo del 10 al 20% de los resultados de la biopsia quirúrgica posterior confirman realmente la presencia de cáncer de mama. De nuevo, estamos ante un caso de especificidad de método extremadamente baja.

Investigadores de la Universidad de Duke entrenaron una red neuronal para reconocer mamogramas tejido maligno basado en ocho características comúnmente tratadas por los radiólogos. Resultó que la red puede resolver el problema con una sensibilidad de alrededor del 100 % y una especificidad del 59 % (en comparación con el 10-20 % de los radiólogos). cuantas mujeres de tumores benignos¡Puede evitar el estrés asociado con la toma de una biopsia si utiliza esta red neuronal! En la Clínica Mayo (Minnesota), la red neuronal analizó los resultados de la ecografía mamaria y proporcionó una especificidad del 40%, mientras que para las mismas mujeres, la especificidad de la conclusión de los radiólogos resultó ser cero. ¿No es cierto que el éxito del uso de tecnologías de redes neuronales no parece en absoluto accidental?

Después del tratamiento del cáncer de mama, es posible la recurrencia del tumor. Las redes neuronales ya ayudan a predecirlos de manera efectiva. Se está realizando una investigación similar en la Facultad de Medicina de la Universidad de Texas. Las redes entrenadas han demostrado su capacidad para identificar y tener en cuenta relaciones muy complejas de variables predictivas, en particular, sus relaciones triples para mejorar la capacidad predictiva.

Las posibilidades de uso de las redes neuronales en medicina son diversas, y su arquitectura es diversa. Según el pronóstico de los resultados a largo plazo del tratamiento de la enfermedad por un método u otro, se puede preferir uno de ellos. El famoso especialista holandés Herbert Kappen de la Universidad de Nimegen logró un resultado significativo en el pronóstico del tratamiento del cáncer de ovario (una enfermedad de cada setenta mujeres) (no utiliza perceptrones multicapa en su trabajo, sino el llamado Boltzmann Máquinas: redes neuronales para evaluar probabilidades).

Aquí hay un ejemplo de otro tipo de cáncer. Investigadores de escuela de Medicina en Kagawa (Japón) entrenó una red neuronal que predijo con casi precisión los resultados de la resección hepática en pacientes con carcinoma hepatocelular basándose en datos preoperatorios.

En el Instituto de Innovación e Investigación de Fusión de Troitsk (TRINITI), como parte de un proyecto para crear sistemas de asesoramiento de redes neuronales implementado por el Ministerio de Ciencia, se ha desarrollado un programa de redes neuronales que selecciona un método de tratamiento para el cáncer de piel de células basales (basalioma ) basado en un pronóstico a largo plazo de recurrencia. El número de casos de basalioma, una enfermedad oncológica de personas de piel blanca con piel delgada, es un tercio de todas las enfermedades oncológicas.

El diagnóstico de una de las formas de melanoma, un tumor que a veces es difícil de distinguir de la forma pigmentada de basalioma, se implementó utilizando el simulador de red neuronal Multineuron desarrollado en el Centro de Computación de SOAN en Krasnoyarsk bajo la dirección de A. N. Gorban.

Las redes neuronales también se pueden utilizar para predecir el efecto de varios tratamientos en desarrollo. Ya se han utilizado con éxito en química para predecir las propiedades de los compuestos en función de su estructura molecular. Investigadores del Instituto Nacional del Cáncer de EE. UU. han utilizado redes neuronales para predecir el mecanismo de acción de los fármacos utilizados en la quimioterapia contra el cáncer. Tenga en cuenta que hay millones de moléculas diferentes que necesitan ser investigadas por su actividad anticancerígena. Los especialistas del Instituto del Cáncer dividieron los fármacos oncológicos conocidos en seis grupos según el mecanismo de su acción sobre Células cancerígenas y entrenó redes multicapa para clasificar nuevas sustancias y reconocer sus efectos. Los resultados de los experimentos sobre la supresión del crecimiento celular de varios tumores se utilizaron como datos iniciales. La clasificación de redes neuronales le permite determinar cuáles de los cientos de moléculas probadas diariamente vale la pena estudiar más a fondo en experimentos in vitro e in vivo muy costosos. Para resolver un problema similar, también se utilizaron las redes de Kohonen. Estas redes neuronales autoorganizadas sin supervisión dividieron las sustancias en un número desconocido de grupos y, por lo tanto, permitieron a los investigadores identificar sustancias con nuevos mecanismos de acción citotóxicos.

Neurosistemas, genética y moléculas

El diagnóstico y tratamiento de enfermedades oncológicas, así como el desarrollo de nuevos fármacos, representan sin duda el área de aplicación más importante de las tecnologías de redes neuronales. Recientemente, sin embargo, ha habido una creciente conciencia entre investigadores y médicos de que los avances futuros deben estar estrechamente relacionados con el estudio de las causas moleculares y genéticas de las enfermedades.

No es casualidad que en abril de 1997, expertos de los Institutos Nacionales de Salud (EE.UU.) hicieran recomendaciones para fortalecer la investigación relacionada con la identificación de las causas de causando cáncer y desarrollos destinados a la prevención de enfermedades. Durante mucho tiempo, las redes neuronales se han utilizado activamente en el análisis de secuencias de ADN genómico, en particular, para el reconocimiento de promotores, regiones que preceden a los genes y se unen a la proteína ARN polimerasa, que inicia la transcripción. Se utilizan para diferenciar las regiones codificantes y no codificantes del ADN (exones e intrones) y para predecir la estructura de las proteínas.

En 1996, se hizo un descubrimiento sensacional que vinculó la investigación fundamental en genética molecular con el problema de la patogenia y el tratamiento de la enfermedad oncológica más común: el cáncer de piel de células basales. Los investigadores han descubierto un gen (PTC) en el noveno cromosoma humano, mutaciones en las que, a diferencia del gen p53, están provocadas por la exposición a la radiación ultravioleta y son la causa del desarrollo de tumores. La clave del descubrimiento fue el estudio del llamado gen parche, cambios en los que se estimularon defectos de desarrollo en la mosca de la fruta y el hecho de que en niños que también padecen defectos de desarrollo tejido óseo(síndrome del nevo basal), a menudo hay múltiples basaliomas.

Ahora, los genetistas y los médicos están llenos de esperanzas de encontrar un tratamiento farmacológico para el basaloma o utilizar métodos de cirugía genética, y reemplazar con ellos métodos de tratamiento tan despiadados como el láser convencional, los rayos X y la criocirugía. ¿Podrían las redes neuronales ser útiles para estos estudios? En particular, ¿pueden usarse para evaluar el posible impacto de una mutación particular sobre el cambio en las propiedades de las proteínas correspondientes o para evaluar su valor pronóstico, por ejemplo, para el desarrollo de recurrencia del cáncer de mama?

Si esto pudiera hacerse, las redes neuronales reducirían significativamente el área de búsqueda de los biólogos moleculares, quienes a menudo realizan experimentos muy costosos para evaluar el papel de las mutaciones en una molécula de ADN. Recuerde que el crecimiento y la división celular descontrolados conduce al desarrollo de tumores malignos. El genoma humano, que contiene información sobre todas las proteínas producidas en el cuerpo, tiene unos tres mil millones de nucleótidos. Pero solo el 2-3% de ellos codifican proteínas; el resto lo necesita el propio ADN para mantener la estructura correcta, la replicación y otras cosas.

En las secuencias de ADN genómico, se pueden distinguir aproximadamente tres componentes: el primero contiene numerosas copias de fragmentos idénticos (ADN satélite); el segundo contiene secuencias moderadamente repetitivas dispersas por todo el genoma; y en el tercero ADN _único. En el ADN satelital, las diferentes copias se representan de manera desigual: su número varía de cientos a millones. Por lo tanto, generalmente se subdividen en mini y microsatélites.

Sorprendentemente, la distribución de microsatélites en el genoma es tan específica que puede usarse como un análogo de las huellas dactilares humanas. También se cree que esta distribución también se puede utilizar para diagnosticar diversas enfermedades.

De forma oculta, las repeticiones de secuencias de nucleótidos juegan un papel importante en secuencias de ADN únicas. Según la hipótesis de Francis Crick, la evolución del ADN comienza a partir de estructuras cuasi-periódicas, y si podemos encontrar repeticiones ocultas, encontraremos dónde ocurrieron las mutaciones que determinaron la evolución, lo que significa que encontraremos tanto los sitios más antiguos como los más importantes en qué mutaciones son más peligrosas. La distribución de repeticiones ocultas también está estrechamente relacionada con la estructura y función de las proteínas codificadas por la secuencia correspondiente.

TRINITY ha desarrollado un sistema en el que se utilizan modificaciones de la red neuronal de Hopfield para buscar repeticiones ocultas y evaluar el papel de las mutaciones en las secuencias de ADN. Se espera que este enfoque pueda ser utilizado para una generalización análisis espectral las secuencias de datos son muy vista general, por ejemplo, para el análisis de electrocardiogramas.

Las redes neuronales recorren el planeta

La geografía de los grupos de investigación que utilizan redes neuronales para desarrollar aplicaciones médicas es muy amplia. No hay nada que decir sobre los EE. UU.: se están realizando estudios similares en la universidad de cada estado y su dirección principal es el cáncer de mama. ¿Por qué hay universidades? Las academias militares también están haciendo esto. En la República Checa, Jiří Shima desarrolló la teoría del entrenamiento de redes neuronales que pueden funcionar de manera efectiva con los llamados datos de intervalo (cuando no se conocen los valores de los parámetros, sino el intervalo de su cambio), y los utiliza en varios médicos. aplicaciones En China, investigadores del Instituto de Energía Atómica entrenaron una red neuronal para distinguir entre pacientes con enfermedades leves y graves del epitelio esofágico y aquellos con cáncer de esófago con base en el análisis elemental de las uñas.

En Rusia, SINP MSU utiliza redes neuronales para analizar enfermedades de los órganos auditivos.

Finalmente, en Australia, George Christ utilizó la teoría de redes neuronales para construir la primera hipótesis sobre las causas síndrome misterioso la muerte súbita recién nacidos

***

Por supuesto, el artículo proporciona una lista, lejos de ser completa, de ejemplos del uso de tecnologías de redes neuronales artificiales en medicina. La psiquiatría, la traumatología y otras secciones quedaron a un lado, en las que las redes neuronales se prueban para el papel de un asistente de diagnóstico y clínico. No todo, por supuesto, parece color de rosa en la alianza de la nueva tecnología informática y la atención médica. Los programas de redes neuronales a veces son extremadamente costosos para su implementación generalizada en la clínica (de miles a decenas de miles de dólares), y los médicos son bastante escépticos acerca de cualquier innovación informática. La conclusión emitida por la red neuronal debe ir acompañada de explicaciones o comentarios aceptables.

Pero todavía hay motivos para el optimismo. Dominar y aplicar tecnologías de redes neuronales es mucho más fácil que aprender estadísticas matemáticas o lógica difusa. Para crear una red neuronal sistema médico Lleva meses, no años. Sí, y los parámetros son muy alentadores: recordemos una vez más la alta especificidad de los diagnósticos.

Y otra esperanza de cooperación es la misma palabra "neurona". Aún así, es tan bien conocido por los médicos ...

Alexander Yezhov, Vladimir Chechetkin - Instituto de Innovación e Investigación de Fusión (Troitsk).

El número de publicaciones sobre la aplicación de la neurotecnología en medicina es difícil de estimar con precisión. Sin embargo, si en 1988-89 eran pocos, desde 1995 han aparecido cientos cada año. Las siguientes direcciones pueden ser útiles:



Pero también para resolver tareas más importantes, por ejemplo, para buscar nuevos medicamentos. The Village recurrió a expertos para averiguar cuáles son las características de la tecnología y cómo las empresas y universidades nacionales la utilizan.

¿Qué son las redes neuronales?

Entender qué lugar ocupan las redes neuronales en el mundo inteligencia artificial y cómo se relacionan con otras tecnologías para crear sistemas inteligentes, comencemos con las definiciones.

Redes neuronales- uno de los métodos de aprendizaje automático, cuyas bases se originaron en 1943, incluso antes de la aparición del término "inteligencia artificial". Son un modelo matemático que se asemeja remotamente al trabajo del sistema nervioso de los animales.

Según Stanislav Protasov, investigador principal de la Universidad de Innopolis, las redes neuronales convolucionales, inventadas por el matemático Jan Lekun, son el análogo más cercano al cerebro humano. “Están en el corazón de muchas aplicaciones que dicen ser inteligencia artificial, como FindFace o Prisma”, señala.

Aprendizaje automático- una subsección de inteligencia artificial en la intersección de las matemáticas y la informática. Estudia métodos para construir modelos y algoritmos basados ​​en el principio del aprendizaje. La máquina analiza los ejemplos que recibe, resalta patrones, los generaliza y crea reglas que resuelven varios problemas, por ejemplo, predecir el desarrollo futuro de eventos o reconocer y generar imágenes, texto y voz. Además de las redes neuronales, aquí también se utilizan métodos de regresión lineal, árboles de decisión y otros enfoques.

Inteligencia artificial- una sección de informática sobre la creación de medios tecnológicos para que las máquinas realicen tareas que antes se consideraban prerrogativa exclusiva del hombre, así como la designación de tales desarrollos. La dirección tomó forma oficialmente en 1956.

Alejandro Krainov

Qué se puede llamar inteligencia artificial y qué no es una cuestión de acuerdo. En general, la humanidad no ha llegado a una formulación inequívoca de lo que es la inteligencia en general, por no hablar de la artificial. Pero si resumimos lo que está sucediendo, entonces podemos decir que la inteligencia artificial son redes neuronales profundas que resuelven problemas complejos a un nivel cercano al nivel de una persona y, en cierta medida, el autoaprendizaje. Al mismo tiempo, el autoaprendizaje aquí significa la capacidad de extraer de forma independiente una señal útil de los datos sin procesar.

¿Cuál es el estado actual de la industria?

Según Gartner, una agencia analítica, el aprendizaje automático se encuentra ahora en la cima de las expectativas infladas. Típico de esta etapa, la emoción alrededor nueva tecnología conduce a un entusiasmo excesivo, que se convierte en intentos fallidos de usarlo en todas partes. Se estima que la industria necesitará de dos a cinco años para deshacerse de las ilusiones. Según los expertos rusos, las redes neuronales pronto tendrán que pasar una prueba de fuerza.

sergey negodyaev

Gestor de cartera, Fondo de desarrollo de iniciativas de Internet

Aunque los científicos han estado formalizando y desarrollando redes neuronales durante 70 años, hay dos puntos de inflexión en el desarrollo de esta tecnología. El primero fue en 2007, cuando la Universidad de Toronto creó algoritmos de aprendizaje profundo para redes neuronales multicapa. El segundo momento que provocó el auge actual fue 2012, cuando investigadores de la misma universidad aplicaron redes neuronales profundas y ganaron el concurso ImageNet, habiendo aprendido a reconocer objetos en fotos y videos con un mínimo de errores.

Ahora hay suficiente potencia informática para resolver, si no alguna, la gran mayoría de las tareas basadas en redes neuronales. Ahora el principal obstáculo es la falta de datos etiquetados. En términos relativos, para que el sistema aprenda a reconocer una puesta de sol en un video o una foto, necesita alimentar un millón de imágenes de puestas de sol, indicando exactamente dónde se encuentra en el cuadro. Por ejemplo, cuando subes una foto a Facebook, tus amigos la reconocen como un gato bajo los rayos del sol poniente, y la red social ve en ella un conjunto de etiquetas: “animal”, “gato”, “madera”, "piso", "tarde", "naranja". Quien tenga más datos de entrenamiento tendrá una red neuronal que será más inteligente.

Andrei Kalinin

Jefe de Poisk Mail.Ru

Las aplicaciones de entretenimiento basadas en redes neuronales como Artisto o Vinci son solo la punta del iceberg y una excelente manera de mostrar sus capacidades a un público más amplio. De hecho, las redes neuronales son capaces de resolver una serie de problemas complejos. Las áreas más "calientes" ahora son los pilotos automáticos, los asistentes de voz, los bots de chat y la medicina.

Alejandro Krainov

Jefe del Servicio de Visión por Computador, Yandex

Podemos decir que el boom de las redes neuronales ya ha llegado, pero aún no ha llegado a su punto máximo. Además, solo será más interesante. Las áreas más prometedoras hoy en día son, quizás, la visión por computadora, los sistemas de diálogo, el análisis de texto, la robótica, los vehículos no tripulados y la generación de contenido: textos, imágenes, música.

Áreas prometedoras para la implementación de redes neuronales

Transporte

robótica

Biotecnología

Agricultura

Internet de las Cosas

Medios y Entretenimiento

Lingüística

La seguridad

Vlad Shershulsky

Director de Programas de Cooperación Tecnológica de Microsoft en Rusia

La revolución neuronal ya ha sucedido hoy. A veces es incluso difícil distinguir la ficción de la realidad. Imagine una cosechadora automatizada con múltiples cámaras. Toma 5 mil fotografías por minuto y analiza a través de la red neuronal si la maleza está frente a él o la planta infectada con plagas, luego de lo cual decide qué hacer a continuación. ¿Ficción? Realmente ya no.

Boris Wolfson

Director de Desarrollo de Cazatalentos

Hay cierta exageración en torno a las redes neuronales y, en mi opinión, expectativas un poco altas. Pasaremos por un período de frustración antes de aprender a usarlos de manera efectiva. Muchos resultados de investigación innovadores aún no son muy aplicables en los negocios. En la práctica, a menudo es más razonable utilizar otros métodos de aprendizaje automático, por ejemplo, varios algoritmos basados ​​en árboles de decisión. Probablemente no parezca tan emocionante o futurista, pero estos enfoques son muy comunes.

¿Qué enseñan las redes neuronales en Rusia?

Los participantes del mercado están de acuerdo en que muchos logros de las redes neuronales todavía son aplicables solo en el campo académico. Más allá de sus fronteras, la tecnología se utiliza principalmente en aplicaciones de entretenimiento, lo que alimenta el interés por el tema. Sin embargo, los desarrolladores rusos enseñan redes neuronales para resolver problemas comerciales y socialmente significativos. Echemos un vistazo más de cerca a algunas áreas.

ciencia y medicina

La Escuela Yandex de Análisis de Datos participa en el experimento CRAYFIS junto con representantes de Skolkovo, el Instituto de Física y Tecnología de Moscú, la Escuela Superior de Economía y las universidades estadounidenses UCI y NYU. Su esencia es buscar partículas cósmicas de ultra alta energía utilizando teléfonos inteligentes. Los datos de las cámaras se transmiten a redes neuronales aceleradas, capaces de capturar rastros de partículas que interactúan débilmente en imágenes.

Este no es el único experimento internacional en el que participan especialistas rusos. Los científicos de la Universidad de Innopolis Manuel Mazzara y Leonard Johard están involucrados en el proyecto BioDynaMo. Con el apoyo de Intel y el CERN, quieren crear un prototipo que pueda reproducir una simulación a gran escala de la corteza cerebral. Con su ayuda, se planea aumentar la eficiencia y la economía de los experimentos que requieren la presencia de un cerebro humano vivo.

El profesor de Innopolis Yaroslav Kholodov participó en el desarrollo de un modelo informático capaz de predecir la formación de enlaces de proteínas diez veces más rápido. Con este algoritmo se puede acelerar el desarrollo de vacunas y fármacos. En la misma área, se destacaron los desarrolladores de Mail.Ru Group, Insilico Medicine y MIPT. Utilizaron redes adversarias generativas, entrenadas para inventar estructuras moleculares, para buscar sustancias que pudieran ser útiles en enfermedades que van desde el cáncer hasta las enfermedades cardiovasculares.

belleza y salud

En 2015, la empresa rusa Youth Laboratories lanzó el primer concurso internacional de belleza Beauty.AI. Las fotos de los participantes en él fueron evaluadas por redes neuronales. A la hora de determinar los ganadores se tuvo en cuenta el género, la edad, la nacionalidad, el color de piel, la simetría facial y la presencia o ausencia de arrugas en los usuarios. Este último factor también impulsó a los organizadores a crear el servicio RYNKL, que le permite rastrear cómo el envejecimiento afecta la piel y cómo varios medicamentos lo combaten.

Las redes neuronales también se utilizan en telemedicina. La empresa rusa Mobile Medical Technologies, que gestiona los proyectos Online Doctor y Pediatrician 24/7, está probando un bot de diagnóstico que será útil tanto para pacientes como para médicos. Para el primero, le dirá a qué especialista contactar para ciertos síntomas, y para el segundo, ayudará a determinar de qué está enfermo exactamente el visitante.

Optimización de procesos de negocio y publicidad

La startup rusa Leadza ha logrado utilizar redes neuronales para asignar de manera más efectiva el presupuesto para publicidad en Facebook e Instagram. El algoritmo analiza los resultados de campañas pasadas, construye un pronóstico de métricas clave y, en base a ellas, redistribuye automáticamente los costos para que las tiendas en línea puedan obtener más clientes a un menor costo.

El equipo de GuaranaCam utilizó tecnologías de aprendizaje automático para evaluar la efectividad de colocar productos y materiales publicitarios fuera de línea. El sistema se basa en la nube de Microsoft Azure y analiza el comportamiento del consumidor mediante cámaras de circuito cerrado de televisión. Los dueños de negocios reciben un informe de estado comercial en tiempo real. El proyecto ya se está aplicando en el centro comercial Mega Belaya Dacha.

Los ejemplos domésticos exitosos del uso de redes neuronales en los negocios no terminan ahí. LogistiX, que ha estado experimentando con tecnologías de inteligencia artificial desde 2006, ha desarrollado un sistema de optimización de almacenes. Se basa en una red neuronal de aprendizaje que analiza los datos sobre los empleados recibidos de los rastreadores de actividad física y redistribuye la carga entre ellos. Ahora el equipo enseña redes neuronales para distinguir entre el matrimonio.

El holding Belfingroup fue aún más lejos. Su "hija" BFG-soft ha creado una plataforma en la nube BFG-IS, que le permite administrar la empresa utilizando su modelo virtual. Este último se crea automáticamente en función de los datos de producción recopilados por el sistema y no solo muestra la mejor manera de organizar los procesos teniendo en cuenta los objetivos establecidos, sino que también predice las consecuencias de cualquier cambio, desde el reemplazo del equipo hasta la introducción de turnos adicionales. A finales de 2016, el Fondo de Desarrollo de Iniciativas de Internet decidió invertir 125 millones de rublos en la empresa.

Reclutamiento y manejo de personal

El agregador de reclutadores ruso Stafory está terminando de entrenar una red neuronal recurrente que no solo puede dar respuestas monosilábicas a las preguntas de los candidatos, sino también entablar una conversación completa con ellos sobre la vacante que les interesa. Y el equipo del portal SuperJob está probando un servicio que predice cuál de los cientos de currículos del mismo tipo tendrá demanda de un empleador en particular.

Transporte

El desarrollador ruso de sistemas inteligentes Cognitive Technologies utiliza redes neuronales para reconocer vehículos, peatones, señales de tránsito, semáforos y otros objetos que ingresan al encuadre. La empresa también recopila datos para entrenar una red neuronal para un vehículo no tripulado. Hablamos de decenas de miles de episodios que describen la reacción de los conductores ante determinadas situaciones críticas en las carreteras. Como resultado, el sistema debe formular escenarios óptimos para el comportamiento del robot automático. Las mismas tecnologías se utilizan para crear un transporte agrícola inteligente.

Además, las redes neuronales se pueden utilizar en el campo del transporte de otras formas. En el verano de 2016, Yandex agregó a su tablón de anuncios Avto.ru la función de detectar automáticamente un modelo de automóvil a partir de su foto. En ese momento, el sistema conocía 100 marcos.

psicología y seguridad

La startup rusa NTechLab, que superó a Google en The MegaFace Benchmark, una competencia internacional de algoritmos de reconocimiento facial, utilizó tecnologías de aprendizaje automático en la aplicación FindFace. Te permite buscar a una persona en las redes sociales por foto. A menudo, los usuarios recurren al servicio para detectar falsificaciones, pero también puede ser útil para los agentes del orden. Con su ayuda, ya se ha establecido la identidad de varios delincuentes, incluido el invasor de Citibank en Moscú. La versión comercial de FindFace.Pro se proporciona a las empresas interesadas en la identificación del cliente. Ahora el sistema está siendo entrenado para determinar el género, la edad y las emociones de los demás, lo que puede ser útil no solo para comunicarse con los clientes, sino también para administrar al personal.

Del mismo modo, las redes neuronales son utilizadas por otra empresa rusa: VisionLabs. Utiliza tecnología de reconocimiento facial para brindar seguridad en los bancos y crear ofertas especiales para los clientes más fieles de varios puntos de venta.

La startup Emotian está trabajando en una dirección similar. Está finalizando el sistema para determinar el estado emocional de las ciudades. Hasta ahora, la red neuronal calcula las zonas más felices en función de las publicaciones en las redes sociales, pero en el futuro la empresa va a tener en cuenta los datos biométricos de las cámaras.

Medios y creatividad

Uno de los principales actores en el mercado ruso de redes neuronales es Yandex. La empresa utiliza el aprendizaje automático no solo en sus servicios de búsqueda, sino también en otros productos. En 2015, lanzó un sistema de recomendación " zen”, que forma una fuente de noticias, artículos, fotos y videos basados ​​en los intereses de un usuario en particular. Cuanto más recurra a los materiales seleccionados por el algoritmo, con mayor precisión determinará la red neuronal qué más podría gustarle.

Además, Yandex también está experimentando con la creatividad. Los empleados de la empresa ya lograron aplicar el enfoque de redes neuronales a la poesía, y luego

- 26.76 Kb

Redes neuronales en medicina

Alexander Yezhov, Vladímir Chechetkin

Instituto de Innovación e Investigación de Fusión, Troitsk

[correo electrónico protegido]

Sistemas específicos

Lucha contra el cáncer

Neurosistemas, genética y moléculas

Las redes neuronales recorren el planeta

En lugar de una conclusión

Dolor agudo en el pecho. Una ambulancia traslada al paciente a urgencias, donde el médico de guardia debe realizar un diagnóstico y determinar si realmente se trata de un infarto de miocardio. La experiencia demuestra que la proporción de pacientes que han sufrido un infarto entre los ingresados ​​con síntomas similares es pequeña. Sin embargo, todavía no existen métodos de diagnóstico precisos. El electrocardiograma a veces no contiene signos evidentes de la enfermedad. ¿Y cuántos parámetros de la condición del paciente pueden ayudar de una forma u otra a hacer el diagnóstico correcto en este caso? Más de cuarenta. ¿Puede el médico de urgencias analizar rápidamente todos estos indicadores, junto con sus relaciones, para tomar la decisión de derivar al paciente al servicio de cardiología? Hasta cierto punto, las tecnologías de redes neuronales ayudan a resolver este problema.

Las estadísticas son las siguientes: el médico diagnostica correctamente el infarto de miocardio en el 88% de los pacientes y hace este diagnóstico erróneamente en el 29% de los casos. Hay demasiadas falsas alarmas (sobrediagnóstico). La historia del uso de varios métodos de procesamiento de datos para mejorar la calidad del diagnóstico se remonta a décadas, pero el mejor de ellos ayudó a reducir la cantidad de casos de sobrediagnóstico en solo un 3%.

En 1990, William Bakst, de la Universidad de California en San Diego, utilizó una red neuronal, un perceptrón multicapa, para reconocer el infarto de miocardio en pacientes ingresados ​​en la sala de emergencias con dolor torácico agudo. Su objetivo era crear una herramienta que pueda ayudar a los médicos que no pueden hacer frente al flujo de datos que caracteriza la condición del paciente ingresado. Otro objetivo puede ser mejorar los diagnósticos. El investigador dificultó su tarea, pues analizó los datos solo de aquellos pacientes que ya habían sido derivados al servicio de cardiología. Bakst utilizó sólo 20 parámetros, entre los que se encontraban edad, sexo, localización del dolor, respuesta a la nitroglicerina, náuseas y vómitos, sudoración, síncope, frecuencia respiratoria, frecuencia cardíaca, infartos previos, diabetes, hipertensión, distensión de la vena yugular, una serie de Características del ECG y la presencia de cambios isquémicos significativos.

La red tuvo una precisión del 92 % en la detección de infarto de miocardio y produjo solo un 4 % de falsas alarmas, lo que confirmó erróneamente la derivación de pacientes sin infarto al departamento de cardiología. Entonces, existe un hecho de la aplicación exitosa de redes neuronales artificiales en el diagnóstico de la enfermedad. Ahora es necesario explicar en qué parámetros se evalúa la calidad del diagnóstico en el caso general. Supongamos que de cada diez personas que realmente tienen un ataque al corazón, el método de diagnóstico puede detectar la enfermedad en ocho. Entonces la sensibilidad del método será del 80%. Si tomamos diez personas que no tienen un ataque cardíaco y el método de diagnóstico lo sospecha en tres personas, entonces la proporción de falsas alarmas será del 30%, mientras que una característica adicional, la especificidad del método, será del 70 %

Un método de diagnóstico ideal debe tener una sensibilidad y especificidad del cien por cien: en primer lugar, no perder a una sola persona realmente enferma y, en segundo lugar, no asustar a las personas sanas. Para asegurarse, puede y debe intentar, en primer lugar, garantizar la sensibilidad del método al cien por cien; no puede perderse la enfermedad. Pero esto resulta, por regla general, en la baja especificidad del método: en muchas personas, los médicos sospechan enfermedades que los pacientes en realidad no padecen.

Redes neuronales para tareas de diagnóstico

Las redes neuronales son sistemas no lineales que permiten clasificar los datos mucho mejor que los métodos lineales comúnmente utilizados. Cuando se aplican al diagnóstico médico, permiten aumentar significativamente la especificidad del método sin reducir su sensibilidad.

Recuerde que la red neuronal que diagnostica un infarto de miocardio trabajaba con un gran conjunto de parámetros, cuyo impacto en el diagnóstico de una persona no se puede evaluar. Sin embargo, las redes neuronales pudieron tomar decisiones basadas en los patrones ocultos que identificaron en datos multidimensionales. Una característica distintiva de las redes neuronales es que no están programadas; no usan ninguna regla de inferencia para hacer un diagnóstico, pero están entrenadas para hacerlo con ejemplos. En este sentido, las redes neuronales no se parecen en nada a los sistemas expertos, cuyo desarrollo en los años 70 se produjo tras la “victoria” temporal de la Inteligencia Artificial sobre el enfoque del modelado de la memoria, el reconocimiento de patrones y la generalización, que se basó en el estudio de la organización neural del cerebro.

Uno de los más conocidos de los sistemas expertos desarrollados, cuyo funcionamiento se basaba en el conocimiento extraído de expertos y en la implementación de procedimientos de inferencia, fue el sistema MYCIN. Este sistema fue desarrollado en Stanford a principios de los años 70 para diagnosticar el shock séptico. La mitad de los pacientes morían a causa de ella en un día, y los médicos podían detectar sepsis en solo el 50% de los casos. MYCIN parecía ser un verdadero triunfo de la tecnología de sistemas expertos, ya que podía detectar la sepsis el 100 % de las veces. Sin embargo, después de conocer más de cerca este sistema experto, los médicos mejoraron significativamente los métodos de diagnóstico tradicionales y MYCIN perdió su importancia y se convirtió en un sistema educativo. Los sistemas expertos "fueron" solo en cardiología, para el análisis de electrocardiogramas. Las complejas reglas que constituyen el contenido principal de los libros de análisis clínico de ECG han sido utilizadas por los sistemas apropiados para emitir una conclusión diagnóstica.

El diagnóstico es un caso especial de clasificación de eventos, y el más valioso es la clasificación de aquellos eventos que no están en el conjunto de entrenamiento de la red neuronal. Aquí se manifiesta la ventaja de las tecnologías de redes neuronales: pueden realizar dicha clasificación, generalizando la experiencia anterior y aplicándola en nuevos casos.

Sistemas específicos

Un ejemplo de un programa de diagnóstico es el paquete de cardiodiagnóstico desarrollado por RES Informatica junto con el Centro de Investigación en Cardiología de Milán. El programa permite realizar cardiodiagnósticos no invasivos basados ​​en el reconocimiento de espectros de tacogramas. El tacograma es un histograma de los intervalos entre latidos cardíacos sucesivos, y su espectro refleja el equilibrio de las actividades del sistema nervioso simpático y parasimpático humano, que cambia específicamente en diversas enfermedades.

De una forma u otra, ya se puede afirmar que las redes neuronales se están convirtiendo en una herramienta para el cardiodiagnóstico; en Inglaterra, por ejemplo, se utilizan en cuatro hospitales para prevenir el infarto de miocardio.

En medicina, también se utiliza otra característica de las redes neuronales: su capacidad para predecir secuencias temporales. Ya se ha señalado que los sistemas expertos han tenido éxito en el análisis de ECG. Las redes neuronales también son útiles aquí. Ki Zhenghu, Yu Henu y Willis Tompkins de la Universidad de Wisconsin han desarrollado un sistema de filtrado de redes neuronales para electrocardiogramas que puede suprimir el ruido no lineal y no estacionario mucho mejor que los métodos utilizados anteriormente. El caso es que la red neuronal predijo bien el ruido por sus valores en momentos anteriores. Y el hecho de que las redes neuronales son muy efectivas para predecir secuencias de tiempo (como tipos de cambio o cotizaciones bursátiles) quedó convincentemente demostrado por los resultados de la competencia de programas predictivos realizada por la Universidad de Santa Fe: las redes neuronales ocuparon el primer lugar y dominaron entre los mejores métodos.

Posibilidades de uso de redes neuronales

El ECG es una aplicación privada, aunque extremadamente importante. Sin embargo, hoy en día hay muchos otros ejemplos del uso de redes neuronales para predicciones médicas. Se sabe que las largas colas en los departamentos de cirugía cardíaca (de semanas a meses) son causadas por la escasez de unidades de cuidados intensivos. No es posible aumentar su número debido al alto costo de la atención de reanimación (los estadounidenses gastan el 70% de los fondos en las últimas 2 semanas de vida en este departamento).

La única salida es utilizar los fondos disponibles de manera más eficiente. Supongamos que la condición de los pacientes operados en un día determinado es tan grave que necesitan una estadía prolongada en la unidad de cuidados intensivos (más de dos días). Todo este tiempo, los cirujanos estarán ociosos, porque no hay dónde colocar a los pacientes recién operados. Es más prudente operar a los pacientes gravemente enfermos antes de los fines de semana o días festivos: los quirófanos aún están cerrados estos días, los cirujanos descansarán y los pacientes se recuperarán en cuidados intensivos. Pero al comienzo de la semana laboral, es mejor operar a aquellos pacientes que necesitarán estar en la unidad de cuidados intensivos solo uno o dos días. Luego, las camas en la unidad de cuidados intensivos se desocuparán más rápido y aceptarán nuevos pacientes operados el martes y el miércoles.

La pregunta es cómo adivinar quién tendrá que permanecer en la unidad de cuidados intensivos durante mucho tiempo después de la operación y quién no. Jack Too y Michael Guerier del Hospital St. Michael de la Universidad de Toronto utilizaron redes neuronales para hacer esta predicción. Como datos iniciales se tomaron únicamente aquellos datos del paciente que se conocen en el preoperatorio. Tenga en cuenta que en estudios previos que no utilizaron redes neuronales, también se utilizó información posoperatoria importante como factores para un mayor riesgo de permanecer en cuidados intensivos, varias complicaciones que surgieron durante la intervención quirúrgica.

Tu y Guerir entrenaron un perceptrón bicapa para dividir a los pacientes en tres grupos de riesgo, teniendo en cuenta su edad, género, estado funcional del ventrículo izquierdo, el grado de complejidad de la próxima operación y la presencia de enfermedades concomitantes. De los pacientes identificados por la red como de bajo riesgo de demora en cuidados intensivos, solo el 16,3 % pasó más de dos días en cuidados intensivos. Al mismo tiempo, más del 60% de los identificados por la red como de alto riesgo cumplieron con el pronóstico desfavorable.

Lucha contra el cáncer

Prestamos especial atención a las enfermedades cardiovasculares, ya que ocupan el triste liderazgo en la lista de causas de muerte. En segundo lugar se encuentran las enfermedades oncológicas. Una de las principales áreas en las que se está trabajando actualmente en el uso de redes neuronales es el diagnóstico del cáncer de mama. Esta enfermedad es la causa de muerte de cada novena mujer.

La detección del tumor se lleva a cabo durante el análisis de rayos X inicial de la mama (mamografía) y el análisis posterior de una pieza de tejido tumoral (biopsia). A pesar de que existen reglas generales para diferenciar las neoplasias benignas de las malignas, según la mamografía, solo del 10 al 20% de los resultados de la biopsia quirúrgica posterior confirman realmente la presencia de cáncer de mama. De nuevo, estamos ante un caso de especificidad de método extremadamente baja.

Investigadores de la Universidad de Duke entrenaron una red neuronal para reconocer mamogramas de tejido maligno basándose en ocho características que los radiólogos suelen tratar. Resultó que la red puede resolver el problema con una sensibilidad de alrededor del 100 % y una especificidad del 59 % (en comparación con el 10-20 % de los radiólogos). ¡Cuántas mujeres con tumores benignos pueden salvarse del estrés de tomar una biopsia usando esta red neuronal! En la Clínica Mayo (Minnesota), la red neuronal analizó los resultados de la ecografía mamaria y proporcionó una especificidad del 40%, mientras que para las mismas mujeres, la especificidad de la conclusión de los radiólogos resultó ser cero. ¿No es cierto que el éxito del uso de tecnologías de redes neuronales no parece en absoluto accidental?

Después del tratamiento del cáncer de mama, es posible la recurrencia del tumor. Las redes neuronales ya ayudan a predecirlos de manera efectiva. Se está realizando una investigación similar en la Facultad de Medicina de la Universidad de Texas. Las redes entrenadas han demostrado su capacidad para identificar y tener en cuenta relaciones muy complejas de variables predictivas, en particular, sus relaciones triples para mejorar la capacidad predictiva.

Las posibilidades de uso de las redes neuronales en medicina son diversas, y su arquitectura es diversa. Según el pronóstico de los resultados a largo plazo del tratamiento de la enfermedad por un método u otro, se puede preferir uno de ellos. El famoso especialista holandés Herbert Kappen de la Universidad de Nimegen logró un resultado significativo en el pronóstico del tratamiento del cáncer de ovario (una enfermedad de cada setenta mujeres) (no utiliza perceptrones multicapa en su trabajo, sino el llamado Boltzmann Máquinas: redes neuronales para evaluar probabilidades).

Aquí hay un ejemplo de otro tipo de cáncer. Investigadores de una escuela de medicina en Kagawa, Japón, entrenaron una red neuronal que predijo los resultados de la resección hepática en pacientes con carcinoma hepatocelular con datos preoperatorios casi libres de errores.

En el Instituto de Innovación e Investigación de Fusión de Troitsk (TRINITI), como parte de un proyecto para crear sistemas de asesoramiento de redes neuronales implementado por el Ministerio de Ciencia, se ha desarrollado un programa de redes neuronales que selecciona un método de tratamiento para el cáncer de piel de células basales (basalioma ) basado en un pronóstico a largo plazo de recurrencia. El número de casos de basalioma, una enfermedad oncológica de personas de piel blanca con piel delgada, es un tercio de todas las enfermedades oncológicas.

El diagnóstico de una de las formas de melanoma, un tumor que a veces es difícil de distinguir de la forma pigmentada de basalioma, se implementó utilizando el simulador de red neuronal Multineuron desarrollado en el Centro de Computación de SOAN en Krasnoyarsk bajo la dirección de A. N. Gorban.

Breve descripción

Redes neuronales para tareas de diagnóstico

Sistemas específicos

Posibilidades de uso de redes neuronales

Lucha contra el cáncer

Neurosistemas, genética y moléculas

Las redes neuronales recorren el planeta



Artículos similares

  • Inglés - reloj, tiempo

    Todos los que están interesados ​​en aprender inglés han tenido que lidiar con designaciones extrañas p. metro. y un m , y en general, dondequiera que se mencione la hora, por alguna razón solo se usa el formato de 12 horas. Probablemente para nosotros viviendo...

  • "Alquimia en papel": recetas

    Doodle Alchemy o Alchemy on paper para Android es un interesante juego de rompecabezas con hermosos gráficos y efectos. Aprende a jugar este increíble juego y encuentra combinaciones de elementos para completar Alchemy on Paper. El juego...

  • ¿El juego falla en Batman: Arkham City?

    Si se enfrenta al hecho de que Batman: Arkham City se ralentiza, se bloquea, Batman: Arkham City no se inicia, Batman: Arkham City no se instala, no hay controles en Batman: Arkham City, no hay sonido, aparecen errores arriba, en Batman:...

  • Cómo destetar a una persona de las máquinas tragamonedas Cómo destetar a una persona de los juegos de azar

    Junto con un psicoterapeuta en la clínica Rehab Family en Moscú y un especialista en el tratamiento de la adicción al juego, Roman Gerasimov, Rating Bookmakers trazó el camino de un jugador en las apuestas deportivas, desde la formación de la adicción hasta la visita a un médico,...

  • Rebuses Entretenido rompecabezas rompecabezas adivinanzas

    El juego "Acertijos Charadas Rebuses": la respuesta a la sección "Acertijos" Nivel 1 y 2 ● Ni un ratón, ni un pájaro: retoza en el bosque, vive en los árboles y roe nueces. ● Tres ojos - tres órdenes, rojo - el más peligroso. Nivel 3 y 4 ● Dos antenas por...

  • Condiciones de recepción de fondos por veneno.

    CUÁNTO DINERO VA A LA CUENTA DE LA TARJETA SBERBANK Los parámetros importantes de las transacciones de pago son los términos y tasas para acreditar fondos. Estos criterios dependen principalmente del método de traducción elegido. ¿Cuáles son las condiciones para transferir dinero entre cuentas?