查看“PySpark实战:MongoDB基本操作”的源代码
←
PySpark实战:MongoDB基本操作
跳转至:
导航
,
搜索
因为以下原因,您没有权限编辑本页:
您所请求的操作仅限于该用户组的用户使用:
用户
您可以查看与复制此页面的源代码。
==背景== *通过[[PySpark实战:安装MongoDB]]安装并启动MongoDB == Mongodb 后台管理== 如果你需要进入 mongodb 后台管理,你需要先打开 mongodb 装目录的下的 bin 目录,然后执行 mongo 命令文件。 MongoDB Shell 是 MongoDB 自带的交互式 Javascript shell,用来对 MongoDB 进行操作和管理的交互式环境。 ===Linux下进入=== 当你进入 mongoDB 后台后,它默认会链接到 test 文档(数据库): $ cd /usr/local/mongodb4/bin $ ./mongo <nowiki>MongoDB shell version v4.2.8 connecting to: mongodb://127.0.0.1:27017/?compressors=disabled&gssapiServiceName=mongodb Implicit session: session { "id" : UUID("2cfdafc4-dd56-4cfc-933a-187b887119b3") } MongoDB server version: 4.2.8 Welcome to the MongoDB shell.</nowiki> …… ===Windows下进入=== 命令行下输入 mongo ==常用操作== ===算术运算=== 由于它是一个JavaScript shell,您可以运行一些简单的算术运算: <nowiki>> 2+2 4 > 3+6 9</nowiki> ===查看操作=== <nowiki>#操作符db表示当前库使用use [库名],完成库切换。 >use mytest #查看有哪些库 >show dbs #查看有哪些集合 >show collections</nowiki> ===插入数据=== 现在让我们插入一些简单的数据,并对插入的数据进行检索: > db.runoob.insert({x:10}) WriteResult({ "nInserted" : 1 }) > db.runoob.find() { "_id" : ObjectId("5f069bdb4e02f8baf90f1184"), "x" : 10 } 第一个命令将数字 10 插入到 runoob 集合的 x 字段中。 如果要停止 mongodb 可以使用以下命令: mongod --dbpath /var/lib/mongo --logpath /var/log/mongodb/mongod.log --shutdown 也可以在 mongo 的命令出口中实现: > use admin switched to db admin > db.shutdownServer() 更多安装方法可以参考官网:https://docs.mongodb.com/manual/administration/install-on-linux/ ==基本操作== ===创建数据库=== 以下实例我们创建了数据库 runoob: <nowiki>> use runoob switched to db runoob > db runoob ></nowiki> 如果你想查看所有数据库,可以使用 show dbs 命令: <nowiki>> show dbs admin 0.000GB config 0.000GB local 0.000GB</nowiki> > 可以看到,我们刚创建的数据库 runoob 并不在数据库的列表中, 要显示它,我们需要向 runoob 数据库插入一些数据。 <nowiki>> db.runoob.insert({"name":"菜鸟教程"}) WriteResult({ "nInserted" : 1 }) > show dbs admin 0.000GB config 0.000GB local 0.000GB runoob 0.000GB</nowiki> MongoDB 中默认的数据库为 test,如果你没有创建新的数据库,集合将存放在 test 数据库中。 注意: 在 MongoDB 中,集合只有在内容插入后才会创建! 就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。 ===增加数据=== >db.user.insertOne({name:"wf"}) 当collection不存在时,产生相应的数据库集,并插入相应数据 此过程会分配内存,并产生相应的文件,同时插入数据,所以第一次插入的速度会相对较慢 >db.user.insertMany([{"name":"wf many1"},{"name":"wf many2"}]) 添加多条记录,写入的数据需要使用数组。 ===删除数据=== remove() 方法的基本语法格式如下所示: <nowiki>db.collection.remove( <query>, <justOne> )</nowiki> 如果你的 MongoDB 是 2.6 版本以后的,语法格式如下: <nowiki>db.collection.remove( <query>, { justOne: <boolean>, writeConcern: <document> } )</nowiki> 参数说明: *query :(可选)删除的文档的条件。 *justOne : (可选)如果设为 true 或 1,则只删除一个文档,如果不设置该参数,或使用默认值 false,则删除所有匹配条件的文档。 *writeConcern :(可选)抛出异常的级别。 实例 以下文档我们执行两次插入操作: <nowiki>>db.col.insert({title: 'MongoDB 教程', description: 'MongoDB 是一个 Nosql 数据库', by: '菜鸟教程', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 100 })</nowiki> 使用 find() 函数查询数据: <nowiki>> db.col.find() { "_id" : ObjectId("56066169ade2f21f36b03137"), "title" : "MongoDB 教程", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "菜鸟教程", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 100 } { "_id" : ObjectId("5606616dade2f21f36b03138"), "title" : "MongoDB 教程", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "菜鸟教程", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 100 }</nowiki> 接下来我们移除 title 为 'MongoDB 教程' 的文档: <nowiki>>db.col.remove({'title':'MongoDB 教程'}) WriteResult({ "nRemoved" : 2 }) # 删除了两条数据 db.col.remove({'title':'MongoDB 教程'},1) WriteResult({ "nRemoved" : 2 }) # 删除了两条数据 >db.col.find() …… # 没有数据</nowiki> 如果你只想删除第一条找到的记录可以设置 justOne 为 1,如下所示: >db.COLLECTION_NAME.remove(DELETION_CRITERIA,1) 如果你想删除所有数据,可以使用以下方式(类似常规 SQL 的 truncate 命令): <nowiki>>db.col.remove({}) >db.col.find() ></nowiki> ===更新文档=== MongoDB 使用 update() 和 save() 方法来更新集合中的文档。接下来让我们详细来看下两个函数的应用及其区别。 update() 方法 update() 方法用于更新已存在的文档。语法格式如下: <nowiki>db.collection.update( <query>, <update>, { upsert: <boolean>, multi: <boolean>, writeConcern: <document> } )</nowiki> 参数说明: <nowiki>query : update的查询条件,类似sql update查询内where后面的。 update : update的对象和一些更新的操作符(如$,$inc...)等,也可以理解为sql update查询内set后面的 upsert : 可选,这个参数的意思是,如果不存在update的记录,是否插入objNew,true为插入,默认是false,不插入。 multi : 可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。 writeConcern :可选,抛出异常的级别。</nowiki> 实例 我们在集合 col 中插入如下数据: <nowiki>>db.col.insert({ title: 'MongoDB 教程', description: 'MongoDB 是一个 Nosql 数据库', by: '菜鸟教程', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 100 })</nowiki> 接着我们通过 update() 方法来更新标题(title): <nowiki>>db.col.update({'title':'MongoDB 教程'},{$set:{'title':'MongoDB'}}) WriteResult({ "nMatched" : 1, "nUpserted" : 0, "nModified" : 1 }) # 输出信息 > db.col.find().pretty() { "_id" : ObjectId("56064f89ade2f21f36b03136"), "title" : "MongoDB", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "菜鸟教程", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 100 } ></nowiki> 可以看到标题(title)由原来的 "MongoDB 教程" 更新为了 "MongoDB"。 以上语句只会修改第一条发现的文档,如果你要修改多条相同的文档,则需要设置 multi 参数为 true。 >db.col.update({'title':'MongoDB 教程'},{$set:{'title':'MongoDB'}},{multi:true}) ====save() 方法==== save() 方法通过传入的文档来替换已有文档,_id 主键存在就更新,不存在就插入。语法格式如下: <nowiki>db.collection.save( <document>, { writeConcern: <document> } )</nowiki> 参数说明: document : 文档数据。 writeConcern :可选,抛出异常的级别。 实例 以下实例中我们替换了 _id 为 56064f89ade2f21f36b03136 的文档数据: <nowiki>>db.col.save({ "_id" : ObjectId("56064f89ade2f21f36b03136"), "title" : "MongoDB", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "Runoob", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "NoSQL" ], "likes" : 110 })</nowiki> 替换成功后,我们可以通过 find() 命令来查看替换后的数据 <nowiki>>db.col.find().pretty() { "_id" : ObjectId("56064f89ade2f21f36b03136"), "title" : "MongoDB", "description" : "MongoDB 是一个 Nosql 数据库", "by" : "Runoob", "url" : "http://www.runoob.com", "tags" : [ "mongodb", "NoSQL" ], "likes" : 110 } ></nowiki> 更多实例 只更新第一条记录: db.col.update( { "count" : { $gt : 1 } } , { $set : { "test2" : "OK"} } ); 全部更新: db.col.update( { "count" : { $gt : 3 } } , { $set : { "test2" : "OK"} },false,true ); 只添加第一条: db.col.update( { "count" : { $gt : 4 } } , { $set : { "test5" : "OK"} },true,false ); 全部添加进去: db.col.update( { "count" : { $gt : 5 } } , { $set : { "test5" : "OK"} },true,true ); 全部更新: db.col.update( { "count" : { $gt : 15 } } , { $inc : { "count" : 1} },false,true ); 只更新第一条记录: db.col.update( { "count" : { $gt : 10 } } , { $inc : { "count" : 1} },false,false ); ===查看文档=== 使用find来进行查询.查询就是返回一个集合中文档的子集,子集合的范围从0个文档到整个集合。 #查询一组文档 >db.user.find() 注意:js shell中find()会返回游标,如果不赋值的话显示前一页文档。 #查询获取第一个文档 >db.user.findOne()
返回至
PySpark实战:MongoDB基本操作
。
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
页面信息