Session
Vamos todos a la FEASTa
Uno de los procesos más importantes a la hora de desarrollar nuestros modelos, es el de preparar y modelar nuestros datos, crear nuevas variables, normalizar etc. de forma que podamos obtener el mejor resultado posible a partir de los datos, denominándose este proceso Feature Engineering, sin olvidar que luego cuando queremos realizar la inferencia de los mismos, tenemos que volver a realizar las mismas transformaciones para pasárselo a nuestro modelo entrenado.
El problema viene cuando tenemos varios modelos que usan los mismos datos y necesitan o comparten todas o algunas de las transformaciones, ya sea en entrenamiento como en inferencia. Esto al final hace que se pierda mucho tiempo, y muchos recursos, en aplicar las mismas o transformaciones sobre los mismos datos, y sin olvidar lo que esta tan de moda últimamente como es la gobernanza de los modelos y de sus componentes, como pueden ser la Features.
Para tratar de paliar esto, ha aparecido un nuevo proyecto OpenSource iniciado por GCP allá por el 2019 y ahora mismo está bajo licencia Apache, y sobre el cual se ha realizado una implementación específica para Azure y que será la que veamos que se liberó hace unos 6 meses bajo licencia MIT, y que será el que veamos en profundidad en esta sesión.
Roberto Navarro
Microsoft MVP IA, NTT Data, Azure Evangelist & Architect BigData/IA
Madrid, Spain
Links
Please note that Sessionize is not responsible for the accuracy or validity of the data provided by speakers. If you suspect this profile to be fake or spam, please let us know.
Jump to top