Databricks

Databricks es una empresa estadounidense de software empresarial fundada por los creadores de Apache Spark.[1] Databricks desarrolla una plataforma basada en web para trabajar con Spark, que proporciona gestión automatizada de clústeres y cuadernos de estilo IPython. La empresa desarrolla Delta Lake, un proyecto de código abierto para aportar fiabilidad a los lagos de datos para el aprendizaje automático y otros casos de uso de la ciencia de datos.[2]

Databricks
Tipo Empresa privada
Industria Software de computación
Fundación 2013; hace 10 años
Fundador

Ali Ghodsi, Andy Konwinski, Ion Stoica, Patrick Wendell, Reynold Xin, Matei Zaharia,

Arsalan Tavakoli
Sede central San FranciscoCalifornia (Estados Unidos)
Personas clave

Ali Ghodsi (DIRECTOR GENERAL)

Ion Stoica (Presidente ejecutivo)
Ingresos Más de 1.000 millones de dólares (2022)
Empleados 4,000+ (2022)
Sitio web http://databricks.com/

Historia

Databricks surgió del proyecto AMPLab de la Universidad de California, Berkeley, que participó en la creación de Apache Spark, un marco de computación distribuida de código abierto construido sobre Scala. La empresa fue fundada por Ali Ghodsi, Andy Konwinski, Arsalan Tavakoli-Shiraji, Ion Stoica, Matei Zaharia,[3] Patrick Wendell y Reynold Xin.

En noviembre de 2017, la empresa fue anunciada como un servicio de primera parte en Microsoft Azure a través de la integración Azure Databricks.[4]

En junio de 2020, Databricks adquirió Redash, una herramienta de código abierto diseñada para ayudar a los científicos y analistas de datos a visualizar y construir cuadros de mando interactivos de sus datos.[5]

En febrero de 2021, junto con Google Cloud, Databricks proporcionó integración con el motor Kubernetes de Google y la plataforma BigQuery de Google.[6] Fortune clasificó a Databricks como uno de los mejores grandes "Lugares de trabajo para millennials" en 2021.[7] En ese momento, la compañía dijo que más de 5000 organizaciones utilizaban sus productos.[8]

En agosto de 2021, Databricks finalizó su octava ronda de financiación recaudando 1.600 millones de dólares y valorando la empresa en 38.000 millones.[9]

En octubre de 2021, Databricks realizó su segunda adquisición de la empresa alemana no-code 8080 Labs. 8080 Labs fabrica bamboolib, una herramienta de exploración de datos que no requiere codificación para su uso.[10]

En respuesta a la popularidad de ChatGPT de OpenAI, en marzo de 2023, la empresa presentó un modelo de lenguaje de código abierto, llamado Dolly en honor a la oveja Dolly, que los desarrolladores podían utilizar para crear sus propios chatbots. Su modelo utiliza menos parámetros para producir resultados similares a los de ChatGPT, pero Databricks no había publicado pruebas comparativas formales para demostrar si su bot igualaba realmente el rendimiento de ChatGPT.[11][12][13]

Databricks adquirió la startup de seguridad de datos Okera en mayo de 2023 para ampliar sus capacidades de gobernanza de datos[14]. Al mes siguiente, adquirió la startup de IA generativa de código abierto MosaicML por 1.400 millones de dólares.[15][16]

Financiación

En septiembre de 2013, Databricks anunció que recaudó 13,9 millones de dólares de Andreessen Horowitz y dijo que su objetivo era ofrecer una alternativa al sistema MapReduce de Google.[17][18] Microsoft fue un inversor destacado de Databricks en 2019, participando en la Serie E de la empresa con una cantidad no especificada.[19][20] La empresa ha recaudado 1.900 millones de dólares en financiación, incluida una Serie G de 1.000 millones de dólares liderada por Franklin Templeton con una valoración posterior al dinero de 28.000 millones de dólares en febrero de 2021. Otros inversores son Amazon Web Services, CapitalG (una empresa de capital de crecimiento dependiente de Alphabet Inc.) y Salesforce Ventures.[8]

Rondas de financiación
Serie Fecha Importe (millones de $) Inversores principales
A 2013 13.9[17] Andreessen Horowitz
B 2014 33[21] New Enterprise Associates
C 2016 60[22] New Enterprise Associates
D 2017 140[23] Andreessen Horowitz
E Feb. 2019 250[24] Andreessen Horowitz
F Oct. 2019 400[25] Andreessen Horowitz
G Ene. 2021 1,000[26] Franklin Templeton Investments
H Ago. 2021 1,600[27] Morgan Stanley

Productos

Databricks desarrolla y vende una plataforma de datos en la nube utilizando el término de marketing "lakehouse", un portmanteau basado en los términos "data warehouse" (almacén de datos) y "data lake" (lago de datos).[28] Lakehouse de Databricks se basa en el framework de código abierto Apache Spark, que permite realizar consultas analíticas contra datos semiestructurados sin un esquema de base de datos tradicional.[29] En octubre de 2022, Lakehouse recibió la autorización FedRAMP para su uso con el gobierno federal y los contratistas estadounidenses.[30]

Delta Engine de Databricks se lanzó en junio de 2020 como un nuevo motor de consulta que se superpone a Delta Lake para aumentar el rendimiento de las consultas.[31] Es compatible con Apache Spark y MLflow, que también son proyectos de código abierto de Databricks.[32]

En noviembre de 2020, Databricks presentó Databricks SQL (antes conocido como SQL Analytics) para ejecutar informes de inteligencia empresarial y analítica sobre lagos de datos. Los analistas pueden consultar conjuntos de datos directamente con SQL estándar o utilizar conectores de productos para integrarlos directamente con herramientas de inteligencia empresarial como Tableau, Qlik, SigmaComputing, Looker y ThoughtSpot.[33]

Databricks ofrece una plataforma para otras cargas de trabajo, incluido el aprendizaje automático, el almacenamiento y procesamiento de datos, la analítica de streaming y la inteligencia empresarial.[34]

La empresa también ha creado Delta Lake, MLflow y Koalas, proyectos de código abierto que abarcan la ingeniería de datos, la ciencia de datos y el aprendizaje automático.[35] Además de construir la plataforma Databricks, la empresa ha coorganizado cursos online masivos y abiertos sobre Spark[36] y una conferencia para la comunidad Spark llamada Data + AI Summit,[37] antes conocida como Spark Summit.

Operaciones

Databricks tiene su sede en San Francisco[38] y está presente en Canadá, Reino Unido, Países Bajos, Singapur, Australia, Alemania, Francia, Japón, China, Corea del Sur, India, Costa Rica y Brasil.[39]

Referencias

  1. Dwoskin, Elizabeth (2016). «Aquí es donde tiene lugar la verdadera acción de la inteligencia artificial.». Washington Post.
  2. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (en inglés estadounidense). 24 de abril de 2019. Consultado el 14 de julio de 2023.
  3. «Matei Zaharia». people.csail.mit.edu. Consultado el 14 de julio de 2023.
  4. «Microsoft convierte Databricks en un servicio propio en Azure». TechCrunch (en inglés). 2017.
  5. «Databricks adquiere Redash, un servicio de visualización para científicos de datos». TechCrunch (en inglés). 2020.
  6. «Databricks lleva su casa del lago a Google Cloud». TechCrunch (en inglés). 2021.
  7. «Databricks». Fortune (en inglés). Consultado el 14 de julio de 2023.
  8. Konrad, Alex. «Databricks Raises $1 Billion At $28 Billion Valuation, With The Cloud’s Elite All Buying In». Forbes (en inglés). Consultado el 14 de julio de 2023.
  9. Mellor, Chris (1 de septiembre de 2021). «Databricks raises data lake of cash at monstrous $38bn valuation». Blocks and Files (en inglés estadounidense). Consultado el 14 de julio de 2023.
  10. Rosenbaum, Eric (6 de octubre de 2021). «$38 billion software start-up Databricks makes acquisition to leave code behind». CNBC (en inglés). Consultado el 14 de julio de 2023.
  11. Hu, Krystal (24 de marzo de 2023). «Databricks pushes open-source chatbot as cheaper ChatGPT alternative». Reuters (en inglés). Consultado el 14 de julio de 2023.
  12. Loten, Angus. «Databricks Launches ‘Dolly,’ Another ChatGPT Rival». WSJ (en inglés estadounidense). Consultado el 14 de julio de 2023.
  13. «Databricks debuts ChatGPT-like Dolly, a clone any enterprise can own». VentureBeat (en inglés estadounidense). 24 de marzo de 2023. Consultado el 14 de julio de 2023.
  14. Palazzolo, Stephanie. «Exclusive: $38 billion data and AI darling Databricks acquires security startup Okera». Business Insider (en inglés estadounidense). Consultado el 14 de julio de 2023.
  15. Datta, Tiyashi (26 de junio de 2023). «Databricks strikes $1.3 billion deal for generative AI startup MosaicML». Reuters (en inglés). Consultado el 14 de julio de 2023.
  16. SFGATE, Stephen Council (26 de junio de 2023). «SF tech firms unite: Databricks to buy MosaicML for $21 million per worker». SFGATE (en inglés estadounidense). Consultado el 14 de julio de 2023.
  17. Harris, Derrick (2013). "Databricks raises $14M from Andreessen Horowitz, wants to take on MapReduce with Spark". Archivado desde el original el 15 de enero de 2022. Consultado el 15 de julio de 2023.
  18. Lorica, Ben. «Databricks aims to build next-generation analytic tools for Big Data - O'Reilly Radar». radar.oreilly.com (en inglés estadounidense). Consultado el 14 de julio de 2023.
  19. «"Databricks raises $250M at a $2.75B valuation for its analytics platform"». TechCrunch (en inglés). 2019.
  20. Novet, Jordan (5 de febrero de 2019). «Microsoft used to scare start-ups but is now an 'outstandingly good partner,' says Silicon Valley investor Ben Horowitz». CNBC (en inglés). Consultado el 14 de julio de 2023.
  21. Miller, Ron (30 de junio de 2014). «Databricks Snags $33M In Series B And Debuts Cloud Platform For Processing Big Data». TechCrunch (en inglés estadounidense). Consultado el 14 de julio de 2023.
  22. Shieber, Jonathan (15 de diciembre de 2016). «Databricks raises $60 million to be big data's next great leap forward». TechCrunch (en inglés estadounidense). Consultado el 14 de julio de 2023.
  23. «Databricks Secures $140 Million to Accelerate Analytics and Artificial Intelligence in the Enterprise». Databricks (en inglés estadounidense). 22 de agosto de 2017. Consultado el 14 de julio de 2023.
  24. «Databricks’ $250 Million Funding Supports Explosive Growth and Global Demand for Unified Analytics; Brings Valuation to $2.75 Billion». Databricks (en inglés estadounidense). 5 de febrero de 2019. Consultado el 14 de julio de 2023.
  25. «Databricks announces $400M round on $6.2B valuation as analytics platform continues to grow». TechCrunch (en inglés). 2019.
  26. Miller, Alex Wilhelm and Ron (1 de febrero de 2021). «Databricks raises $1B at $28B valuation as it reaches $425M ARR». TechCrunch (en inglés estadounidense). Consultado el 14 de julio de 2023.
  27. Miller, Alex Wilhelm and Ron (31 de agosto de 2021). «Databricks raises $1.6B at $38B valuation as it blasts past $600M ARR». TechCrunch (en inglés estadounidense). Consultado el 14 de julio de 2023.
  28. Michael, Armbrust; Ghodsi, Ali; Xin, Reynold; Zaharia, Matei (2021). «Lakehouse: A New Generation of Open Platforms that Unify Data Warehousing and Advanced Analytics». Conference on Innovative Data Systems Research.
  29. «With massive $1B infusion, Databricks takes aim at IPO and rival Snowflake». SiliconANGLE (en inglés estadounidense). 1 de febrero de 2021. Consultado el 15 de julio de 2023.
  30. «Databricks achieves FedRAMP Authorized status». www.kmworld.com. Consultado el 15 de julio de 2023.
  31. Woodie, Alex (24 de junio de 2020). «Databricks Cranks Delta Lake Performance, Nabs Redash for SQL Viz». Datanami. Consultado el 15 de julio de 2023.
  32. «Databricks launches Delta Lake, an open source data lake reliability project». VentureBeat (en inglés estadounidense). 24 de abril de 2019. Consultado el 15 de julio de 2023.
  33. «Databricks launches SQL Analytics». TechCrunch (en inglés). 2020.
  34. «Databricks, champion of data "lakehouse" model, closes $1B series G funding round». ZDNET (en inglés). Consultado el 15 de julio de 2023.
  35. «The Two Sigma Ventures Open Source Index». Two Sigma Ventures (en inglés). Consultado el 15 de julio de 2023.
  36. «%%title%%». Databricks (en inglés estadounidense). 2 de diciembre de 2014. Consultado el 15 de julio de 2023.
  37. «Home - Data + AI Summit 2023 | Databricks». www.databricks.com (en inglés). Consultado el 15 de julio de 2023.
  38. staff, CNBC com (16 de junio de 2020). «36. Databricks». CNBC (en inglés). Consultado el 15 de julio de 2023.
  39. «Office locations». Databricks (en inglés estadounidense). 3 de marzo de 2023. Consultado el 15 de julio de 2023.
Este artículo ha sido escrito por Wikipedia. El texto está disponible bajo la licencia Creative Commons - Atribución - CompartirIgual. Pueden aplicarse cláusulas adicionales a los archivos multimedia.