Apache的冰山——一个隐藏在表面下的架构

   
  • 杰森·休斯Dremio公司产品管理总监

会议摘要

数据湖的建立是为了让数据民主化——让越来越多的人使用数据, 工具, 以及应用程序来利用数据. 实现它所需的一个关键功能是向用户隐藏底层数据结构和物理数据存储的复杂性. 事实上的标准是Hive表格式, Facebook在2009年发布的,解决了其中一些问题, 但数据不足, 用户, 和应用范围. 那么答案是什么呢? Apache的冰山. Apache的冰山表格格式现在正在使用中,Netflix等许多领先的科技公司也对其做出了贡献, 苹果, Airbnb, LinkedIn, Dremio, Expedia, 和AWS.加入杰森·休斯, Dremio的技术总监, 在本次网络研讨会中,十大网赌靠谱网址平台将了解Hive表格式不足以及Iceberg表格式解决这些问题的架构细节, 以及冰山项目所带来的好处.你将学习:

  • 大规模使用Hive表格式时出现的问题,以及为什么十大网赌靠谱网址平台需要一种新的表格式
  • 对表格式结构的简单、优雅的改变如何产生巨大的积极影响
  • Apache的冰山表的底层架构, 对冰山表的查询是如何工作的, 以及在表上执行CRUD操作时表的底层结构如何变化
  • 这种架构设计带来的好处

准备开始? 这里有一些资源可以帮助你

演示

Dremio SQL Lakehouse平台演示与Tomer Shiran

Dremio创始人Tomer Shiran演示了Dremio如何简化你的数据基础设施,并帮助数据民主化.

阅读更多

指南

什么是数据网格?

数据网格是一种分散的数据体系结构,它可以灵活地访问数据. 从本指南开始学习所有关于数据网格的知识.

阅读更多

案例研究

FactSet现代化的应用程序与Dremio,加速数据访问和消除复杂性

财务数据和软件公司FactSet正在使用Dremio实现其应用程序的现代化, 将获取关键财务数据的速度提高20倍,帮助客户做出更好的投资决策.

阅读更多

开始免费

没有时间限制-完全免费-只是你喜欢的方式.

现在报名

观看演示

今天还没准备好开始? 查看运行中的平台.

查看演示
友情链接: 1 2 3 4 5 6 7 8 9 10