¿Qué es Big Data?

¿Qué es Big Data?

Big Data o análisis de gran cantidad de datos, es cuando las empresas o instituciones recopilan a través de internet u otros mecanismos una gran cantidad de información y datos para hacer análisis profundos y complejos del tema que quieren tratar. Estos datos se pueden recopilar de paginas de internet, plataformas digitales y redes sociales, de forma voluntaria a partir de computadoras personales, tabletas y celulares inteligentes a través de cuestionarios, compras de productos, registros electrónicos, comportamientos en la web y el uso de la misma. Asimismo, la presencia de sensores y otras entradas en dispositivos inteligentes están permitiendo la recopilación de mas datos, mayor calidad y para un espectro de situaciones mas amplia.

Algunos de los retos de mas importantes del Big Data es que las empresas puedan distinguir entre una gran cantidad de datos, cuales son relevantes y cuales no dependiendo de lo que se esta buscando. Otro tema importante es como estructurar y estandarizar los datos que se obtengan, si estos no vienen estandarizados desde antes pueden requerir un manejo especial antes de analizarlos. Los datos no estructurados como videos, documentos de texto, correos electrónicos, pueden requerir tratamientos mas sofisticados.

Los datos se almacenan con mayor frecuencia en bases de datos informáticas y se analizan a través de le utilización de diferentes programas especializados en manejar grandes cantidades de información de datos complejos. La mayoría de los programas son Software as a Service (SaaS) que rentan las empresas para medir todo tipo de correlaciones. Por ejemplo, cual que tanto compran las mujeres X producto en X tipo de tiendas, cuales de estos productos los compran online. O que tipo de clientes son mas propensos a que paguen o no un crédito.

Prácticamente todos los departamentos de las empresas pueden usar Big Data, desde recursos humanos, ventas, marketing, operaciones, entre otras. Para la industria financiera tambien se utiliza mucho big data para medir correlaciones en el área de riesgos, de manera que se pueda medir estadísticamente que tipo de clientes son mas propensos a pagar un crédito y cuales no y de esta manera medir la perdida esperada y determinar las tasas de interés y políticas de crédito.