Apache ORC
Apache ORC (Optimized Row Columnar) es un formato de almacenamiento de datos orientado a columnas, gratuito y de código abierto del ecosistema Apache Hadoop. Es similar a los otros formatos de archivo de almacenamiento en columnas disponibles en el ecosistema de Hadoop, como RCFile y Parquet. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop.
Apache ORC | ||
---|---|---|
Información general | ||
Tipo de programa | Sistema de archivos distribuido | |
Desarrollador | Apache Software Foundation | |
Lanzamiento inicial | 12 de mayo de 2015 | |
Licencia | Apache License 2.0 | |
Estado actual | Activo | |
Idiomas | inglés | |
Información técnica | ||
Plataformas admitidas | Java | |
Enlaces | ||
En febrero de 2013, el formato de archivo Optimized Row Columnar (ORC) fue anunciado por Hortonworks en colaboración con Facebook. [1] Un mes después, se anunció el formato Apache Parquet, desarrollado por Cloudera y Twitter. [2]
Véase también
- Portal:Software libre. Contenido relacionado con Software libre.
- Apache Hive
- Pig (herramienta de programación)
- Apache Spark
Referencias
- Alan Gates (20 de febrero de 2013). «The Stinger Initiative: Making Apache Hive 100 Times Faster». Hortonworks blog. Consultado el Dec 31, 2018.
- Justin Kestelyn (13 de marzo de 2013). «Introducing Parquet: Efficient Columnar Storage for Apache Hadoop». Cloudera blog. Archivado desde el original el 19 de septiembre de 2016. Consultado el 4 de mayo de 2017.
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.