miércoles, 20 de marzo de 2024

Introducción a Parquet en Java

Parquet es un formato de ficheros columnar muy utilizado en el mundo del Data Engineering, pero poco conocido en el mundo Java tradicional.
El formato tiene muchas características que lo hacen muy útil en aplicaciones que no son BigData o incluso sin ser intensivas en datos.
En esta charla, se explicará cómo funciona Parquet internamente, beneficios y ventajas, herramientas existentes para procesarlos, y te ahorrará el trabajo de tener que entender el ecosistema de librerías y lenguajes, y cómo encajan a la hora de procesar ficheros Parquet.
Se mostrará cómo trabajar con ellos en Java sin necesidad de usar herramientas o frameworks complejos, presentándolo como algo asequible a cualquiera que no esté metido en el mundo Big Data y necesite intercambiar y procesar ficheros de forma rápida y segura.

Jerónimo López
Jerónimo López es Backend Staff Engineer en Clarity AI, con 20 años de experiencia laboral. La mayor parte de su carrera ha sido en el ecosistema Java, y es co-coordinador de MadridJUG. Pasando por la consultoría, fundó su propia startup: Otogami, el mejor buscador y comparador de ofertas de videojuegos del mundo.

Video




No hay comentarios:

Publicar un comentario