Las preguntas de esta sección se mostraron a los desarrolladores que se dedican al Análisis de datos, la Ingeniería de datos, el Machine learning, o a aquellos cuyo rol de trabajo era analista de datos, ingeniero de datos o científico de datos. Esta encuesta estaba dirigida específicamente a los desarrolladores, por lo que los resultados pueden no ser representativos de la audiencia de big data en general.

Macrodatos

¿Qué paquetes de estadísticas utiliza para analizar y visualizar datos?

Los editores de hojas de cálculo son las herramientas más utilizadas para el análisis y la visualización de datos (46 %).

¿Qué plataformas analíticas de big data utiliza?

La mayoría de los desarrolladores de big data no utiliza plataformas específicas de análisis de datos (68 %). La plataforma de análisis de datos más utilizada es Google Colab (19 %).

¿Qué herramientas de big data utiliza?

Jupyter es la herramienta de big data más popular, utilizada por el 32 % de los desarrolladores de big data. Otras herramientas populares son Apache Spark (20 %) y Apache Kafka (17 %).

¿Qué versión de Spark utiliza?

¿Dónde aloja la mayoría de sus datos?

En su mayoría, los datos se alojan en servidores internos (36 %) o locales (26 %). El 21 % de las personas encuestadas utiliza AWS para el alojamiento de datos; los otros tipos de alojamiento son menos comunes.

¿La informática es el negocio principal de su empresa?

Los especialistas en machine Learning suelen trabajar en empresas tecnológicas.

¿En cuál de los siguientes sectores opera su empresa principalmente?

En los sectores no tecnológicos, los sectores financieros son los que contratan con más frecuencia a ingenieros de datos, mientras que los especialistas en machine learning trabajan más a menudo en los sectores educativo y científico.

¿En cuál de los siguientes sectores opera su empresa principalmente?

Utilización de Python, Scala y Java junto con Apache Spark

Python se utiliza junto con Apache Spark en un 66 %, con Java en un 34 % y con Scala en un 11 %.

Las 10 mejores combinaciones de herramientas de big data

El 10 % utiliza tanto Apache Spark como Apache Kafka. El 9 % utiliza tanto Apache Spark como Apache Hadoop.

Los 3 idiomas más utilizados con Apache Kafka

Los tres lenguajes más populares utilizados junto con Apache Kafka son Python, Java y SQL.

Proporción Python/R en Estados Unidos, Europa, Rusia y Asia

R se utiliza más en Rusia (5 %) y Python se utiliza más en Asia (59 %).

Lenguaje principal por utilización de alojamiento de big data

Python y Java se usan más con Google Cloud, JavaScript y PHP se usan más con AWS, y C# se usa más con Azure.

Utilización de herramientas de big data por utilización de alojamiento de big data

Jupyter y Apache Beam se utilizan con más frecuencia con Google Cloud. Apache Spark y Apache Kafka se utilizan con más frecuencia entre los usuarios de AWS.

Lenguaje principal por utilización en Análisis de datos / Ingeniería de datos / Machine learning

Los especialistas en machine learning utilizan con más frecuencia Python, C++ y C, y con menos frecuencia SQL y PHP, en comparación con los desarrolladores que participan en el análisis y la ingeniería de datos.

Lenguaje principal por sectores

Los desarrolladores relacionados con la educación y la ciencia utilizan más Python y R.

Utilización de herramientas de big data por sectores

Jupyter se utiliza con más frecuencia en la educación y la ciencia. Apache Spark, Apache Kafka, Apache Hadoop y Apache Hive se utilizan con más frecuencia en la banca.

Porcentaje de utilización de Apache Spark por país o región

Los mayores porcentajes de usuarios de Apache Spark se encuentran en China, India, Corea del Sur, España y América Latina.

¡Gracias por el tiempo que nos has dado!

Esperamos que nuestro informe le haya resultado útil. Comparta este informe con sus amigos y compañeros.

Participar en próximas encuestas

By submitting this form I agree to the JetBrains Privacy Policy

Si tiene alguna pregunta o sugerencia, no dude en ponerse en contacto con nosotros a través de surveys@jetbrains.com.