Consejos de Tecnología

Big Data y como Dominarla (Guía Práctica)

Con el aumento de la tecnología, la información digital de las personas, negocios, y maquinas se han incrementado exponencialmente a lo largo de las décadas. Los datos ahora son considerados el petróleo del siglo 21.

Las organizaciones producían megabytes de datos hace algunas pocas décadas ahora producen petabytes de nuevos datos cada hora. Por ejemplo, más de 3.3 billones usuarios de teléfonos inteligentes en el mundo.

 

 

Introducción a Big Data

Cada persona consume, interactúa y por lo tanto crea datos a lo largo de miles de aplicaciones y plataformas de monetización de contenido llevando a la creación de 2.5 quintillones de bytes en datos cada día. Esta estimado que para el 2020, cada persona en el mundo creará 1.7MB de datos cada segundo.

Volumen de big data

Imagínese que es responsable de manejar todos los datos creados por todas las personas y maquinas en el mundo en todos los medios posibles como redes sociales, motores de búsqueda, jets, barcos, y cada objeto conectado directa o indirectamente a una computadora.

Esta masiva cantidad de datos requerirá herramientas, procesos, infraestructura, y experiencia necesaria para encontrar significado y patrones que puedan iluminar preguntas fundamentales.

Este estudio, investigación y trabajo sobre tal excesiva y vasta cantidad de datos conforma el termino de grades datos (Big Data).

¿Por qué debería aprender sobre Big Data?

Antes de responder como, es importante responder por qué. ¿Porque usted o cualquiera debería aprender sobre Big Data? La tecnología como los humanos evoluciona y se adapta a sus alrededores. Charles Babbage invento las computadoras para resolver problemas matemáticos.

A media que las computadoras se volvieron más poderosas, fuero aplicadas a lo largo de disciplinas e industrias para resolver problemas que eran o difíciles o imposibles de resolver para los humanos.

Eventualmente, las computadoras redujeron su tamaño y el uso expandido de GUIs se convirtió en algo común entre las personas.

Las computadoras redujeron aún más su tamaño para formar aparatos como los teléfonos inteligentes que hoy nos permiten realizar cosas maravillosas.

Los datos generados de los teléfonos inteligentes fueron almacenados, computados y analizados para encontrar patrones que expliquen el comportamiento humano.

Algoritmos complejos computan vastas cantidades de datos generadas en los mercados bursátiles, motores de búsquedas, redes sociales, lanzamientos de cohetes, supermercados y en casi todo gran esfuerzo humano.

Todos estos datos generados son recolectados, almacenados y analizados para encontrar soluciones significativas a los problemas.

Big data

Como un practicante de Big Data, usted será responsable de encontrar respuestas a preguntas como el valor creado por usuarios en las redes sociales, patrones en los sistemas de salud alrededor del mundo o incluso responder a preguntas simples como el número de visitantes a un sitio web que compran un producto con sus características.

Encontrar respuestas a dichas preguntas ayudara a su organización a crecer y competir en una escala global.

Por lo tanto, usted debería aprender Big Data si quiere encontrar respuestas a dichas preguntas desde vastos conjuntos de datos generados por empresas similares.

¿Quien debería aprender Big Data?

Aprender es para todo el mundo sin importar la materia o la complejidad de los temas. Cada tecnología o concepto es construido con base en conceptos más simples.

Big Data también está construido con base en conceptos similares más simples como matemática, estadística, algoritmos, lenguajes de programación, bases de datos, y varios conceptos similares y frameworks.

Por lo tanto, aprender Big Data algunas veces les viene bien a personas que vienen de contextos como matemáticas, estadística, y computación.

Usted puede dominar Big Data incluso si usted no forma parte de ninguno de los campos mencionados anteriormente, pero le podría tomar un poco más de tiempo dependiendo de su velocidad de aprendizaje.

La Forma de Dominar Big Data

Algunas veces se hace bastante difícil encontrar un camino definido para aprender un tema tan enorme como Big Data.

Sin embargo, con la democratizada forma de aprender que ahora ofrece internet y sus billones de usuarios y miles de creadores de contenido significa que no existe La falta de información, guías, cursos y expertos para guiarte cuando tropiezas.

Esta guía explica las diferentes formas en las que puede aprender Big Data y comenzar su carrera en este campo de la tecnología que crece rápidamente.

Siempre es beneficioso si usted está inmerso en el ambiente del tema mientras este aprendiendo sobre el. Por lo que, comience buscando sobre Big Data y leyendo sobre ello de los principales blogs, sitios web, artículos de investigación, y otras fuentes similares.

Fases del Aprendizaje de Big Data

Aprender sobre un tema siempre sucede en etapas y eso eventualmente construye la experiencia. Comenzaremos por el principio al entender los conceptos simples y progresaremos lentamente hacia temas de mayor orden y complejidad que nos ayuden a entender y aplicar los conceptos en la vida real.

Big Data también puede ser clasificado en tres distintas fases donde usted comienza por entender los datos y sus tipos.

Uste aprende a manejar, importar y utilizar datos basado en sus propios requerimientos. Al utilizar las herramientas comunes para almacenar, importar y visualizar conjuntos de datos puede sentirse cómodo con los bloques de construcción del propio Big Data.

Luego usted puede profundizar mucho más en el entendimiento de como las organizaciones utilizan los datos para encontrar respuestas a los problemas.

Al utilizar las herramientas correctas y aplicaciones usted puede practicar en grandes bases de datos y ganar una experiencia intermedia en la materia.

Esta es la fase en donde pasará más tiempo. Sin importar de cuan sofisticados sean los datos o que tan largos pudieran ser los conjuntos de datos, usted aprenderá como administrar y derivar significado de ellos.

Mientras más problemas usted resuelva en esta etapa, más cerca esta de obtener experiencia.

Una vez usted haya dominado los conceptos intermedios y este cómodo con administrar los datos a lo largo de sistemas y herramientas, usted puede seguir adelante a aplicar técnicas de expertos en análisis predictivo. Hasta ahora usted ha estado utilizando datos para encontrar significado.

Ahora uste estará utilizando datos para predecir lo que pasara en el futuro basados en lo que ya ha pasado en el pasado. Su nivel general de experiencia en Big Data depende de su experticia en cada tecnología subyacente.

Lo Básico.

Usted comenzará conociendo los a los datos pequeños y grandes. Como no puede almacenar terabytes de datos en sus sistemas, usted estará utilizando pequeños conjuntos de datos o algunas veces sub conjuntos de datos de una base de datos más grandes.

Para exponerse a los diferentes tipos de datos generados por organizaciones y aplicaciones usted ganará un mejor entendimiento de que esperar y como administrar dichos enormes conjuntos de datos.

Al aumentar gradualmente el tamaño de los conjuntos de datos usted puede aprender más acerca de las herramientas necesarias requeridas y los retos que enfrentará mientras computa grandes bases de datos.

Es aquí cuando necesita servidores en la nube para almacenar y computar grandes bases de datos. Además, uste estará aprendiendo sobre el análisis y visualización de datos a través de herramientas BI como PowerBI y Excel.

También le será búsqueda datos de las bases de datos con SQL y SPSS. Al profundizar en las prácticas de minería de datos usted ganara la experiencia necesaria para ser empleado.

Intermedio

Para cuando alcance el nivel intermedio, estará cómodo con todos los tipos de datos y será capaz de encontrar formas efectivas de visualizarlos a escala.

Ahora tiene que utilizar grandes conjuntos de datos en la nube para encontrar soluciones para problemas aún más sofisticados. Estará utilizando servicios de nube de Amazon, Google y Microsoft para interactuar y encontrar soluciones para los datos en tiempo real.

Mientras los datos son producidos por las organizaciones cada segundo, utilizar datos en tiempo real para tomar decisiones es una gran habilidad en demanda.

Al utilizar las herramientas correctas para el análisis y la exploración, usted será responsable de encontrar como los consumidores se comportar y como ese comportamiento cambia con el tiempo.

También será responsable de adaptar sus estrategias y habilidades analíticas al utilizar las herramientas estándar de la industria y los marcos de referencia como Hadoop en la nube.

Experto

Moverse del nivel intermedio al experto, requiere una extensa experiencia a lo largo de múltiples dominios y tecnologías.

Podría tomarle meses o incluso años moverse al nivel experto dependiendo de cuantos problemas usted resuelva en sus niveles básicos e intermedios.

Como un experto, usted implementara tecnologías de las Ciencias de Datos, Aprendizaje de Maquinas e Inteligencia Artificial para encontrar soluciones efectivas a grandes problemas en las organizaciones.

Al implementar algoritmos de aprendizaje de las maquinas basados en la nube será capaz de comprimir, analizar y computar grandes conjuntos de datos mientras produce resultados para usos simplemente administrativos.

También podría ser responsable por manejar las expectativas del cliente y por lo tanto sus habilidades suaves también tendrán un papel importante en su éxito.

Habilidades necesarias

Algunas de las habilidades mayormente utilizadas por los expertos en Big Data están enumeradas a continuación. Como siempre su experiencia en cada tecnología a continuación determinara cuan valioso es para una organización y el dominio en el cual estará trabajando.

Comenzando por computación básica en sistemas basados en Unix a administrar clusters de instancias en la nube a computar conjuntos de datos a grandes escalas son necesarias para su crecimiento como un profesional en Big Data.

  1. Linux: El sistema operativo más comúnmente utilizado por las organizaciones y también en los sistemas den la nube, será una herramienta increíble a su disposición. Mientras mejor maneje sus instancias Linux, mejor puede utilizar sus recursos a mano para crecer y escalar los algoritmos de aprendizaje de máquinas para computar Big Data.
  2. Ciencia de Datos: la Estadística y la Ciencia de los Datos son los bloques de construcción de Big Data. Por lo tanto, un entendimiento claro de los principios subyacentes de análisis en muy importante para entender las funciones de orden superior y los conceptos de Big Data.
  3. Java and Python: Java es el lenguaje de programación más ampliamente utilizado entre los expertos en Big Data. Usted será responsable de escribir códigos personalizados para utilizar APIs desde múltiples fuentes mientras analiza y computa bases de datos. Python es otro lenguaje popular que es relativamente más fácil de aprender. Sin embargo, usted algunas veces necesitara experiencia en ambos lenguajes ya que algunos ambientes todavía no soportan Python.
  4. SQL y NoSQL: los fundamentos de los lenguajes de búsqueda son necesarios para todos los aspectos de la ciencia de datos, análisis, y Big Data. Sin SQL y NoSQL, sería imposible buscar eficientemente incluso en la base de datos más pequeña.
  5. Aprendizaje de Maquinas: algoritmos que aprenden de sus conjuntos de datos para producir resultados accionables mientras continúan aprendiendo cuando los nuevos datos están disponibles es muy importante para manejar tanto las bases de datos estadísticas como las bases de datos en tiempo real.
  6. Hadoop: Hadoop es actualmente la plataforma más popular y ampliamente utilizada en Big Data, utilizada para almacenar los datos de las empresas en clusters distribuidos. La mayoría de sus algoritmos de aprendizaje de máquinas serán aplicados a conjuntos de datos almacenados en Hadoop. Las tecnologías subyacentes como MapReduce más adelante le ayudaran a profundizar más en los aspectos de los datos.
  7. Otras tecnologías: como HDFS, HIVE, pig, Spark, Hbase, Drill, ZooKeeper, Kafka, Storm.

Cursos, Certificados y  Carreras Profesionales

Ahora puede encontrar numerosas fuentes de Big Data, Hadoop, Spark y otras tecnologías relacionadas con la web.

Sitios de Mercados como Udemy, Pluralsight, Lynda y otros tienen cientos de cursos listos para el consumo.

Algunos otros sitios web también proporcionan cursos extensos en todos los temas relacionados a Big Data y su aplicación a lo largo de las industrias.

Incluso los proveedores de servicios en la nube tienen módulos de entrenamiento y recursos de computo gratuitos para ayudarlo a iniciar con Big Data y los montones de tecnología relacionada.

Numerosas universidades ahora proporcionan licenciaturas y maestrías en analítica y Big Data para ayudar a preparar a los estudiantes para la súbita demanda en oportunidades relacionadas a la ciencia de los datos.

Si prefiere un aprendizaje basado en un salón de clases. Inscribirse en cualquiera de los principales cursos en las universidades puede proporcionarle el ambiente necesario para aprender y crecer junto con las personas con un pensamiento similar.

Si le gustan los cursos en línea, puede encontrar algunos de los mejores cursos en EDX, Udemy, Coursera, y otros mercados principales.

Los ambientes de aprendizaje en línea también proporcionan el ecosistema necesario para que aprenda e interactúe con los proveedores de los cursos y los aprendices de todo el mundo.

Los mejores ranqueados son muchas veces los cursos más recomendados. Existen numerosos recursos gratuitos de los cuales aprender en internet que utilizan la monetización de contenido para proporcionar calidad de contenido.

Las certificaciones serán necesarias cuando esté buscando trabajo en el campo. Certificaciones de Amazon, Google y Microsoft tienen un lugar especial y por lo tanto son altamente recomendadas.

Junto con Big Data y las tecnologías relacionadas también tendrá que ganar experticia en los ambientes de nube que son ampliamente utilizados por las empresas. Estas certificaciones son por lo tanto de gran demanda por los empleadores.

Luego de que usted crea que ha ganado suficiente experiencia en cualquiera de los subcampos de Big Data, es tiempo de escoger un camino de carrera.

Algunos de los roles más comunes y en demanda son Administradores de Bases de Datos, Desarrolladores de Bases de Datos, Analista de Datos, Científicos de Datos, Modeladores de Datos, Ingenieros de Big Data y muchos más.

Aprender en el trabajo siempre es preferible mientras que gana las habilidades necesarias utilizadas en la organización mientras que también se expone a ambientes y retos que no puede obtener en el salón de clases o en un ambiente de aprendizaje en línea.

Mokhtar Ebrahim
Fundadora de LikeGeeks. Estoy trabajando como administrador de sistemas Linux desde 2010. Soy responsable de mantener, proteger y solucionar problemas de servidores Linux para múltiples clientes de todo el mundo. Me encanta escribir guiones de shell y Python para automatizar mi trabajo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *