CoolBoy编译

数据工程师的衣柜,资源之家

今天,文摘菌要给大家介绍一个数据工程(注:非数据分析)资源超级大列表,你想找的全部在这儿~(Github链接见文末)

这个资料集是由区块链公司POA Network的技术负责人Igor Barinov所制作的。资源本身并没有代码之类的内容,而是为大家总结了数据工程上必要工具的链接,包含了从数据库到并行处理,再到数据集等一系列内容。每一项分类下都有清楚的链接和简介。

这个资源集的目录如下:

着实是很全面的一个列表,从事数据工程的同学应该很熟悉。

这个列表的内容有多详细呢?我们可以看一下关系数据库(relational database)的例子来窥斑见豹:

可以看到,仅仅是关系数据库这一项,作者就总结出了一份很齐全的工具列表,包括了MySQL、PostgreSQL等大家熟悉的工具,也有其它稍微陌生一点的名字。而MySQL下面也附着了基于MySQL协议的相关工具。

在整个数据库(Databases)的大板块下,其他的数据库模型(Key-Value、Column、Document、Graph、Distributed、Timeseries、Others)也被如此详细地总结出来。其他的大板块亦是如此。

此外,列表的最后还有一个社区的板块,包含了论坛、会议和Podcast的链接:

有没有厉害的同学要给这个列表进行补充呢?

Github链接:

https://github.com/igorbarinov/awesome-data-engineering

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

入门MySQL数据工程
4
相关数据
区块链技术

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络, 也称为价值互联网。 中本聪在2008年,于《比特币白皮书》中提出“区块链”概念,并在2009年创立了比特币社会网络,开发出第一个区块,即“创世区块”。

关系数据库技术

关系数据库,是创建在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。关系模型是由埃德加·科德于1970年首先提出的,并配合“科德十二定律”。现如今虽然对此模型有一些批评意见,但它还是数据存储的传统标准。

推荐文章
暂无评论
暂无评论~