Durante el evento Re:Invent, Amazon Web Services, anunció nuevas capacidades para su servicio de machine learning: SageMaker, ofreciendo a los desarrolladores automatizar y escalar todos los pasos del flujo de trabajo de machine learning.
Los anuncios de reúnen nuevas capacidades, como una preparación de datos más rápida, un repositorio especialmente diseñado para datos preparados, automatización del flujo de trabajo, mayor transparencia en los datos de entrenamiento para mitigar el sesgo y explicar las predicciones, capacidades de entrenamiento distribuidas para entrenar modelos grandes hasta dos veces más rápido, y monitoreo de modelos en dispositivos edge.
Tradicionalmente, para crear un modelo machine learning, los desarrolladores deben comenzar preparando los datos a través de un proceso muy manual. Luego, necesitan visualizarlo en notas, elegir el algoritmo correcto, configurar el marco, entrenar el modelo, ajustar millones de parámetros, implementar el modelo y monitorear su desempeño. Este proceso debe repetirse continuamente para garantizar que el modelo siempre funcione como se espera.
En el pasado, este proceso ponía el machine learning fuera del alcance de todos los desarrolladores, excepto los más capacitados.
Amazon SageMaker busca eliminar este proceso engorroso a fin de simplificar el despliegue de procesos inteligentes de machine learning para los desarrolladores, al ofrecer un servicio administrado que elimina los desafíos de cada etapa del proceso de machine learning, lo que hace que sea radicalmente más fácil y rápido para los desarrolladores y científicos de datos comunes y corrientes crear, entrenar e implementar modelos de machine learning.
Los anuncios de las nuevas capacidades de Amazon SageMaker son:
- 1 – Amazon SageMaker Data Wrangler que ofrece una forma más rápida y sencilla de que los desarrolladores preparen datos para machine learning
- 2 – Amazon SageMaker Feature Store ofrece un almacén de datos especialmente diseñado para almacenar, actualizar, recuperar y compartir características de machine learning
- 3 – Amazon SageMaker Pipelines ofrece a los desarrolladores un servicio de integración y entrega continua (CI/ CD), fácil de usar y especialmente diseñado para machine learning
- 4 – Amazon SageMaker Clarify ofrece una mayor visibilidad de sus datos de entrenamiento para que puedan limitar el sesgo en los modelos de machine learning y explicar las predicciones.
- 5 – Deep Profiling de Amazon SageMaker Debugger monitorea el rendimiento del entrenamiento de machine learning para ayudar a los desarrolladores a que sus modelos aprendan más rápido
- 6 – Distributed Training de Amazon SageMaker ofrece nuevas capacidades que pueden entrenar modelos grandes hasta dos veces más rápido de lo que sería posible con los procesadores de machine learning actuales.
- 7 – Amazon SageMaker Edge Manager ofrece monitoreo y administración de modelos de machine learning para dispositivos edge y así garantizar que los modelos implementados en producción funcionen correctamente
- 8. Amazon SageMaker JumpStart, un portal para desarrolladores con modelos pre entrenados y flujos de trabajo prediseñados