1.什么是MongoDB?

MongoDB 是目前 NoSQL 数据库中使用最广泛的数据库之一,MongoDB 是一个开源文档数据库,提供高性能、高可用性和自动扩展的功能。MongoDB 是用 C++ 语言编写的非关系型数据库。
MongoDB 可以存储具有更加复杂的数据结构的数据,具有很强的数据描述能力。

2.特点

主要特性有:面向集合存储,易于存储对象类型的数据,模式自由,支持动态查询,支持完全索引,支持复制和故障恢复,使用高效的二进制数据存储,文件存储格式为 BSON ( 一种 JSON 的扩展)等。
MongoDB 的存储逻辑结构为文档,文档中采用键值对结构,文档中的 _id 为主键,默认创建主键索引。

BSON 在 JSON 的基础上增加了很多额外的类型,BSON 增加了“byte array”数据类型。这使得二进制的存储不再需要先进行 base64 转换再存为 JSON,减少了计算开销。

3.BSON 支持的数据类型

类型描述示例
NULL表示空值或者不存在的字段,{“x” : null}
Boolean布尔型有 true 和 false,{“x” : true}
Number数值:客户端默认使用 64 位浮点型数值。{“x” : 3.14} 或 {“x” : 3}。对于整型值,包括 NumberInt(4 字节符号整数)或 NumberLong(8 字节符号整数),用户可以指定数值类型,{“x” : NumberInt(“3”)}
String字符串:BSON 字符串是 UTF-8,{“x” : “中文”}
Regular Expression正则表达式:语法与 JavaScript 的正则表达式相同,{“x” : /[cba]/}
Array数组:使用“[]”表示,{“x” : [“a”, “b”, “c”]}
Object内嵌文档:文档的值是嵌套文档,{“a” : {“b” : 3}}
ObjectId对象 id:对象 id 是一个 12 字节的字符串,是文档的唯一标识,{“x” : objectId()}
BinaryData二进制数据:二进制数据是一个任意字节的字符串。它不能直接在 Shell 中使用。如果要将非 UTF-8 字符保存到数据库中,二进制数据是唯一的方式
JavaScript代码:查询和文档中可以包括任何 JavaScript 代码,{“x” : function(){//}}
Data日期:{“x” : new Date()}
Timestamp时间戳:var a = new Timestamp()

4.数据库命名注意事项

序号注意事项
1不能是空串
2不得含有 /、\、?、$、空格、空字符等,基本只能使用 ASCII 中的字母和数字
3区分大小写,建议全部小写
4名称最多为 64 字节
5不得使用保留的数据库名,如:admin、local、config
注意:数据库最终会成为文件,数据库名就是文件的名称。
由于数据库名称在 MongoDB 中不区分大小写,因此数据库名称不能仅仅区别于字符。
对于在 Windows 上运行的 MongoDB,数据库名称不能包含以下字符:/、\、“、$、*、< >、:、|、? 。
对于在 UNIX 和 Linux 系统上运行的 MongoDB,数据库名称不能包含以下字符:/、\、。、"、$。
虽然 UTF-8 可以提供很多国家的语言的命名格式,在 MongoDB 数据库命名时也可以使用汉字作为数据库名,但是最好尽量采用英文字母、数字、字符等为主的命名格式。

5.保留数据库

库名作用
admin权限数据库,添加用户到该数据库中,该用户会自动继承数据库的所有权限
local数据库中的数据永远不会被复制
config分片时,config 数据库在内部使用,保存分子信息
test默认数据库,可以用来做各种测试等

6.索引

索引可以提升文档的查询速度,但建立索引的过程需要使用计算与存储资源,在已经建立索引的前提下,插入新的文档会引起索引顺序的重排。

MongoDB 的索引是基于 B-tree 数据结构及对应算法形成的。树索引存储特定字段或字段集的值,按字段值排序。索引条目的排序支持有效的等式匹配和基于范围的查询操作。

MongoDB 在创建集合时,会默认在 _id 字段上创建唯一索引。该索引可防止客户端插入具有相同字段的两个文档,_id 字段上的索引不能被删除。

MongoDB 中索引的类型大致包含单键索引、复合索引、多键值索引、地理索引、全文索引、 散列索引等,下面简单介绍各类索引的用法。