NoSQL与SQL:主要区别及选型

477次阅读  |  发布于2年以前

译文开始:


根据是否可以使用结构化查询语言(SQL),可以把数据库分为 SQL 和 NoSQL 两种类型。

本文将探讨 SQL 是什么,它如何使这些数据库与众不同,以及如何确定应该使用哪种数据库。

什么是 SQL 数据库

SQL 数据库 - 也称为关系数据库 - 并以其编写的编程语言命名,结构化查询语言 (SQL)。这是一种更严格、更结构化的数据存储方式。关系数据库管理系统 (RDBMS) 通过更新、删除或创建新记录来执行查询、检索数据(retrieves data)和编辑数据。SQL 是一种轻量级的声明性语言,它充当数据库版本的服务器端脚本,以此为关系数据库完成繁重的工作。

SQL 数据库至今仍然很受欢迎,因为它们天然适合许多经典的技术栈,例如:LAMP 和基于 Ruby 的技术栈。这些数据库得到了很好的支持,应用也非常广泛,在使用中遇到问题时更容易找到解决办法。SQL 的一个特殊优势是其简单而强大的 JOIN 子句,允许开发人员使用单个命令检索存储在多个表中的相关数据。(补充:JOIN 虽然方便,但是使用要慎重,尤其是在一些并发要求高的场景中。)

什么是 NoSQL 数据库

NoSQL 数据库——也称为 “non SQL” 或者 “not only SQL”,以关系表以外的格式存储数据。如果您的数据需求在一开始不够清楚或者您正在处理大量非结构化数据,您最好选择非关系型数据库,因为它们更加灵活。

NoSQL 数据库如何工作?NoSQL 数据库不是表,而是面向文档的。它们更像是文件夹,汇集了所有类型的相关信息,但不一定对数据进行分类。

注意,NoSQL 数据库提供了更大的灵活性,这使得它们更加直观。NoSQL 数据库根据其数据模型分为多种类型。主要类型有 document、key-value、wide-column 和 graph 。

NoSQL 数据库的常见类型有哪些?

NoSQL 数据库常见的有四种类型,分别是:

  1. 「Key-value store model:」最简单的 NoSQL 类型,它以索引键和值组成的无schema(schema-less)方式存储数据。示例:Cassandra、Azure、LevelDB和Riak。
  2. 「Column store:」wide-column 以列的形式存储数据,而不是行。它不仅仅是一张行列变换的表--按列存储可实现出色的可伸缩性和高性能。例如:HBase, BigTable, HyperTable。
  3. 「Document database:」采用 key-value 的概念,并经过更加复杂的设计;在这种类型的数据库中每一个文档都有它自己的数据,而且有一个唯一 ID 和数据对应。它是存储、检索和管理面向文档但仍是半结构化数据的绝佳选择。例如:MongoDB, CouchDB。
  4. 「Graph database:」互相关联的数据,最好是可以用图表示。这种存储方式复杂性比较高。例如:Polyglot, Neo4J。

SQL 和 NoSQL 数据库之间的差异

当决定使用 SQL 还是 NoSQL 数据库时,你需要了解他们的一些关键差异。

数据结构或模型

请记住, SQL 和 NoSQL 数据库的一个关键区别在于数据的结构。SQL 数据库是基于表的, NoSQL 数据库是非关系型的。这意味着 SQL 数据库包含结构化数据,并且可以使用关系模型执行分析。NoSQL 数据库包含非结构化数据,这意味着无法通过预定义的模型对其进行分析。

SQL

SQL 或关系模型更适用于结构化数据。这是因为结构化数据易于搜索和分析,就像在具有列和行的表中布置的数据一样。

NoSQL

NoSQL 模型适用于结构化程度较低的数据集,因为它不依赖预定义的模型来分析数据。

扩展性

当存储的数据量大幅增加时,请考虑扩展您的数据库。您可以通过向数据库添加额外的服务器来水平扩展,也可以通过增加现有服务器的存储大小来垂直扩展。但是,对于 SQL 数据库和 NoSQL 数据库,有不同的扩展方式。

SQL

大多数 SQL 数据库都是垂直可扩展的,这意味着您可以向现有的单个服务器添加更多 RAM 或 CPU 以增加存储空间。(补充:这里只考虑数据库自身支持的扩展,没有考虑分库、分表的扩展方式)

NoSQL

绝大多数 NoSQL 数据库是支持水平扩展的,这意味着您只需向数据库中添加更多服务器即可获得更多存储空间。因为能通过添加服务器来扩容, NoSQL 数据库更接近分布式数据库。水平扩展数据库的一种流行方法是分片(sharding)。分片是指将数据库拆分为多个组件部署在多个服务器上的概念。

数据查询

在查询数据时,SQL 数据库往往能够执行比 NoSQL 数据库更复杂的查询,但无论您使用哪种数据集,您运行查询的方式取决于相关数据库。

SQL

SQL 系统在数据查询方面很简单,因为它们依赖于一种语言。因为它已经存在了很长时间,所以很多东西也比较稳定,这使不太懂技术的团队成员更容易掌握这种语言。

NoSQL

NoSQL 系统在运行查询时要复杂一些。由于没有固定的查询语言,您的团队可能需要与开发人员或信息技术知识更丰富的人合作来进行数据查询。

数据存储

在数据存储方面,SQL 更直接,而 NoSQL 提供更复杂的数据存储解决方案。

SQL

SQL 存储模型是具有固定行和列的表,程序员将其称为关系数据库。

NoSQL

NoSQL数据库有多种存储模型,包括键值模型、列存储、文档数据库和图数据库。

性能

为了性能,程序员开发了 NoSQL 数据库来解决传统的 SQL 数据库面临的一些性能问题——特别是在可扩展性方面。

SQL

如果您的 SQL 数据库遇到性能问题,您可能需要更高配的服务器来容纳不断增长的数据量。但是,更高配置的服务器并不是管理数据,最节约成本的方式。

NoSQL

NoSQL 数据库无需购买具有更多内存的大型服务器,而是可以水平扩展,这意味着您可以根据需要向已有的集群添加新服务器。

受欢迎程度和易用性

最后,在流行度和易用性方面很大程度上取决于您将要处理的数据类型。

SQL

SQL 数据库往往适合复杂查询。

NoSQL

当您使用非结构化数据时,NoSQL 数据库往往是最佳选择。

SQL 数据库示例

以下是一些流行的 SQL 数据库或 RDBMS

NoSQL 数据库示例

以下是一些流行的 NoSQL 数据库

何时选择 NoSQL 或 SQL 数据库

何时选用 SQL 数据库

谈到数据库技术,没有万能的解决方案。这就是为什么许多企业同时依赖关系数据库和非关系数据库来完成不同任务的原因。尽管 NoSQL 数据库因其速度和可扩展性而广受欢迎,但在某些情况下,高度结构化的 SQL 数据库可能更受欢迎。以下是您可能选择 SQL 数据库的几个原因:

何时选用 NoSQL 数据库

当服务器端应用程序的所有其他组件都需要快速、无缝的设计时,NoSQL 数据库可以防止数据成为瓶颈。大数据是这里真正的 NoSQL 动力,它可以做传统关系数据库无法做到的事情。它推动了 MongoDB、CouchDB、Cassandra 和 HBase 等 NoSQL 数据库的普及。

结论

使用 SQL 和 NoSQL 数据库的方式有很多种,而决定哪种数据库最适合您使用的最大因素之一很大程度上取决于您存储的数据类型。如果您正在处理不会随时间发生太大变化的结构化数据,您将需要使用 SQL 数据库。如果您正在处理非结构化或半结构化的大量数据,您将需要考虑使用 NoSQL 数据库。


译文结束。

New SQL

随着数据库技术的发展,除了 SQL 和 NoSQL 数据库,新型的 New SQL 数据库往往能具备二者的优点。既能为线上事务处理 (OLTP) 工作提供 NoSQL 系统的可扩展性,同时保持传统数据库系统的 ACID 的特性。

总结

数据库的选择对一个系统来说非常关键,往往影响系统能承载的数据量,影响系统的可扩展性、稳定性。在选型时需要对具体的数据库做功能分析、性能分析、可用性分析,评比数据库和系统数据的适配性;需要了解数据库的存储结构、索引类型、ACID、分片、持久化等多个特性。当一种数据库无法满足系统需求时,需要多种数据库一起使用。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8