Data science colaborativo: Kaggle

Desde este espacio web se ha hablado en diversas ocasiones del consumo colaborativo y de plataformas que favorecen dicho tipo de economía. En este caso, en vez de hablar de elementos de consumo, vamos a presentar una de las principales plataformas de análisis colaborativo, Kaggle.

¿Qué es Kaggle?

Kaggle es una plataforma de análisis de datos que permite “conectar” a muchas empresas con profesionales de Data Science por tal de, mediante competiciones entre los usuarios o grupos de usuarios, resolver complejos problemas de negocio y científicos.

¿Qué valor añadido aporta Kaggle a la comunidad de usuarios?

Debo reconocer, en este apartado, que soy un asiduo lector de la comunidad Kaggle y ello me ha permitido aprender y mejorar mis conocimientos en herramientas como R o Python, aprendiendo de profesionales que exponen sus dudas o soluciones a los problemas. Ese es uno de los valores añadidos de Kaggle para su comunidad, la posibilidad de aprender y mejorar las habilidades de manera gratuita.

También cabe destacar, de Kaggle, y relacionado con este punto sobre el aprendizaje, el hecho de ofrecer datasets (bases de datos) de muy diversas temáticas para que los usuarios puedan descargárselos y aplicar sus conocimientos, además de observar las aportaciones y comentarios de otros usuarios de la comunidad.

Otro de los puntos clave que ofrece Kaggle está en el hecho que el usuario puede exponer sus conocimientos en Data Science, de manera práctica, resolviendo problemas, lo que mejora su perfil profesional de cara a las empresas u otros usuarios. Ello permite incrementar la red de contactos y ser más “visible”.

¿Qué aporta Kaggle a las empresas?

Para las empresas participantes, Kaggle no es sólo una alternativa por tal de facilitar respuesta a algunos de sus aspectos de negocio si no también una herramienta por tal de detectar “talento” que podría llegar a ser reclutado para los departamentos de Business Intelligence de dichas empresas.

Algunos de los proyectos que se han llevado o se están llevando a cabo son los siguientes:

Banco Santander: En su momento, Banco Santander planteó a la comunidad el reto de poder predecir los productos que el cliente utilizaría en un futuro basándose en el comportamiento previo de dichos clientes.

Intel: En colaboración con MobileODT proponen a la comunidad Kaggle el reto de encontrar un algoritmo que permita determinar un tipo de cuello de útero basándose en imágenes, por tal de realizar un tratamiento preventivo que se pueda ajustar a las necesidades de la paciente. Los premios para los mejores se sitúan entre los 10.000$ y los 50.000$.

Mercedes-Benz Daimler: Mercedes-Benz “reta” a la comunidad Kaggle a buscar algoritmos que permitan reducir el tiempo de los tests (y como consecuencia, reducir las emisiones de dióxido de carbono) analizando un dataset con información sobre vehículos con diferentes características para predecir el tiempo de pruebas. Los considerados 3 mejores equipos en la resolución del caso serán recompensados con cantidades entre los 5.000$ y 12.000$.

Sberbank Russian Housing Market: Uno de los principales bancos de Rusia y de Europa del Este, Sberbank, también apuesta por dicha plataforma colaborativa. El reto lanzado por la entidad bancaria consiste en el análisis de la fluctuación de precios en el mercado de la vivienda en la volátil economía rusa mediante datasets que disponen de la información de las transacciones en el sector de la vivienda y de datos macro del país. Se busca determinar algoritmos que permitan la predicción de los precios del mercado basándose en diversas variables.

Como se puede apreciar Kaggle dispone de un buen potencial y del interés de aquellas personas o empresas que prestan especial atención a los datos.

Fuente fotografía: UF Data Science

Share this article

Cofundador de Markonomia. Licenciado en Administración y Dirección de Empresas por la Universitat de Barcelona (EUS) y master en Business Intelligence y Big Data en Universitat Oberta de Catalunya. Cerca de 5 años desarrollando proyectos de análisis de datos en el sector bancario. Fotógrafo freelance en eventos deportivos nacionales e internacionales.

Facebook Comments

Deja un comentario