Hace ya bastante tiempo que la palabra “Big Data” se ha colado en nuestro día a día, sobre todo para los que nos dedicamos al mundo de la gestión de la información. Estos últimos años hemos visto como la información se ha ido multiplicando y a menudo nos hemos dado cuenta que gestionarla ya no es tan fácil. Cada vez hay más, de más formatos, de más procedencias… y si queremos que nos sea útil para realizar acciones y tomar decisiones, está claro que debemos aprender a gestionarlas y explotarlas. Este libro de la colección EPI-UOC (¡el 36, ya!) se basa en esta premisa para mostrarnos qué podemos hacer y cómo. Como dice el propio resumen del libro, la gestión correcta nos aportará, entre otras cosas, valor y ventaja competitiva.
Para ello disponemos de cinco capítulos:
- El primero, “¿Qué es big data?” nos pone la base, nos explica qué es y porqué hoy en día es tan importante. Incluso ya nos dice que se trata de la “palabra de moda” de los últimos años, aunque toma consciencia de lo difícil que es centrarse en una sola definición, y más según el punto de vista que se enfoque.
- El segundo capítulo es quizá el más largo y el más “denso” (por decirlo de algún modo). Se titula “¿Cómo gestionar eficientemente?” y, partiendo de la idea de que tiene que hacerse de forma segura y fiable, nos presenta lo que sería la cadena de valor, que incluiría la generación de datos, la adquisición, el almacenamiento y el análisis. En este capítulo se detalla cada una de las fases con esmero y nos sirve para dar respuesta a preguntas tales como: ¿cómo se generan los datos, cuáles nos llegan de forma automática?, “nos sirve una única herramienta? ¿hay alguna más perfecta que otras?”, “cómo eliminamos el ruido documental, repeticiones y redundancias?”, “podremos recuperar todos los datos?”, “cómo puedo interpretar toda esta información, cómo puede serme útil?”, “¿debo tener en cuenta la información que proviene de redes sociales?”
- La “Generación de conocimiento para la acción” es el tercer capítulo del libro. Una vez finalizada la cadena mencionada en el capítulo anterior, los datos tienen que servirnos para realizar acciones y tomar decisiones. En una empresa, por ejemplo, el análisis de ya solamente los datos internos pueden servir para detectar mejoras a realizar, prever el futuro de una forma más o menos acertada, conocer mejor los clientes y lo que quieren, realizar campañas de márqueting más exitosas, etc. Uno de los ejemplos que pone el libro es el de la marca automovilística Ford, que recoge datos mientras la gente conduce los coches. También se hace hincapié a otros sectores y como el big data puede influir notablemente en el ámbito de la salud, el turismo, el sector financiero, las bibliotecas, los seguros, la administración pública (y la importancia de la reutilización de datos), etc.
- En el capítulo 4, “Herramientas para gestionar macrodatos”, se centra ya en los aspectos técnicos necesarios (a nivel de software y hardware) para procesar tal cantidad de información y teniendo en cuenta todo lo visto anteriormente (formatos variados, procedencias distintas, rapidez de la consulta, fiabilidad y seguridad, etc.). El capítulo introduce algunos conceptos para poder entender mejor las opciones que se presentan, y luego sigue con los distintos elementos de la cadena de valor mostrándonos que es necesario tener en cuenta en cada una de las fases. Entre las soluciones se destaca Hadoop (aquí podéis leer más sobre ello y, aquí, su web oficial).
- Finalmente, el último capítulo es el que se centra en las “Competencias para la gestión de datos masivos”. Como sabéis, la demanda profesional empieza a ser muy alta y uno de los problemas principales es que no está bien definido el perfil profesional… sino que está en construcción. Concretamente, el proyecto europeo EDISON está trabajando en ello para definir las competencias y conocimientos necesarios para gestionar estos datos masivos. Lo único seguro es que hay muchos perfiles profesionales implicados, y solo viendo la cadena de valor nos podemos hacer a la idea. Una de las propuestas es la denominación de “científico de datos”, que vendría a ser un poco la mezcla de ingeniero informático, ingeniero de telecomunicaciones y profesional de la información. Una vez se defina el perfil será más fácil ofrecer formación específica y acceder a las ofertas laborales de una forma más concreta.
En definitiva, el libro nos remarca la magnitud y la importancia de este tipo de información en la sociedad actual. Siempre ha habido datos y siempre se han usado para tomar decisiones, pero ahora son cantidades inabastables con todo tipo de detalles y en todo tipo de formatos.
Personalmente creo que esta obra debería estar en el estante de cualquier profesional que quiera adentrarse en el mundo del big data y quiera conocer más al detalle los requisitos de gestión y explotación. Se trata de un libro con mucha información, por lo que fácilmente podremos recurrir a él en caso de duda. Que no os engañe el tamaño: las 140 páginas son completas y necesarias. Se aporta, además, una bibliografía de más de 20 obras que nos pueden ayudar a entrar más en materia.
Sobre la autora y la colección
Montserrat García-Alsina es doctora en Sociedad de la Información y el Conocimiento, y actualmente profesora de la Universitat Oberta de Catalunya (UOC). También forma parte del grupo de investigación KIMO (Knowledge and Information Management in Organizations) de la misma universidad.
La colección de libros EPI-UOC lleva ya seis años en marcha y se han publicado 37 libros. Todo empezó como un proyecto iniciado por el equipo de la revista El profesional de la información con la colaboración de la Editorial UOC, con la idea de ofrecer pequeñas monografías temáticas que sirvieran a los profesionales para estar al día. Están mayormente escritos de forma amena para poder también llegar al público general. Y bueno, que lleven ya casi 40 números es buena señal. Podéis aprovechar que viene el verano (perdón, estamos ya en él) para leer alguno ;-): aquí va la lista entera de títulos.
Referencia bibliográfica
García-Alsina, Montserrat. Big Data. Gestión y explotación de grandes volúmenes de datos. Barcelona: UOC, 2017. 146 p. ISBN 978-84-9116-251-3.
Para más información