Clasificación de objetos

Contenido

Clasificación de objetos#

¿Qué es la clasificación?#

En pocas palabras, la clasificación fenotípica se trata de categorizar objetos en diferentes grupos según sus características (también conocidas como medidas).

⚠️ ¿Dónde pueden salir mal las cosas?

Las medidas válidas siguen siendo importantes La clasificación puede ser simple o compleja, pero los resultados siempre dependen de la validez de sus medidas. Por esta razón, todas las advertencias de las secciones de medición anteriores también se aplican aquí.
Las máquinas son perezosas Los clasificadores de aprendizaje automático no necesariamente van a aprender las características biológicamente relevantes que distinguen objetos de distintos grupos. Las características confusas, o características que varían con su fenotipo pero que no están biológicamente relacionadas con él, pueden limitar la utilidad de su clasificador y llevar a conclusiones incorrectas. Por ejemplo, si los médicos a menudo colocan reglas al lado de los lunares malignos y no al lado de los lunares benignos y tratan de entrenar un clasificador de aprendizaje automático para distinguir entre malignos y benignos, el modelo podría aprender a clasificar imágenes con reglas como malignos sin aprovechar ninguna de los las características relevantes de los lunares. Este es un ejemplo real ²⁵. Si es posible, examinar en qué características se basa su modelo para clasificar objetos puede ser una forma de verificar esto. También es importante estandarizar la forma en que captura imágenes de sus diferentes clases de objetos e incluir un conjunto de entrenamiento lo suficientemente grande con imágenes con mucha variación. No querrá que todas sus células positivas provengan de muestras que tomó en imágenes en marzo y todas sus células negativas de muestras que tomó en imágenes en enero, por ejemplo.
Violación de suposiciones del modelo Si usa un clasificador de aprendizaje automático, los diferentes modelos vienen con diferentes suposiciones integradas. Si está empezando, puede ser difícil saber cuál elegir. Hay herramientas interactivas como CellProfiler Analyst ²⁶ y Piximi que facilitan el entrenamiento de un clasificador, especialmente si no sabe programar.
Límites desordenados La mayoría de los métodos de clasificación supervisada, en los que el usuario asigna objetos a una puntuación o a un contenedor, en última instancia tratan cada contenedor como una entidad totalmente separada; la biología rara vez es tan ordenada. Por ejemplo, un clasificador supervisado para la fase del ciclo celular debe asignar una célula a una fase, pero, de hecho, la progresión a través del ciclo celular no es un proceso parecido a un interruptor perfecto, como se puede visualizar mediante mediciones de células individuales (coloreadas por su clase dada por un observador humano). Es posible que se necesiten métodos más sofisticados para clasificar fenotipos más continuos.

una distribución continua de los estados del ciclo celular — Figura 7 **La división estricta en clases supervisadas puede ser complicada para los procesos biológicos continuos**. Adaptado de Eulenberg, P., Köhler, N., Blasi, T. *et al*. Reconstruir el ciclo celular y la progresión de la enfermedad mediante el aprendizaje profundo. *Nat Commun* 8, 463 (2017) ²⁷#