300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > python mongodb 随机抽取数据

python mongodb 随机抽取数据

时间:2020-12-02 09:15:30

相关推荐

python mongodb  随机抽取数据

import sysimport importlibimportlib.reload(sys)#需要xlwt库的支持from xlwt import *#指定file以utf-8的格式打开file = Workbook(encoding='utf-8')#指定打开的文件名table = file.add_sheet('data')ldata = []from pymongo import MongoClient#建立MongoDB数据库连接client = MongoClient('10.255.73.102', 27017)#用户验证db = client.admindb.authenticate("mongoadmin", "secret")#连接所用集合,也就是我们通常所说的表collection=db.posti=0#接下里就可以用collection来完成对数据库表的一些操作#接下来可实现提取想要的字段内的数据# 写入到excel# 随机取出数据for item in collection.aggregate([ {'$sample': {'size':2000}}]):# print(item['post_content'])if 'post_content' in item:# 取取出空格,回车键content = str(item['post_content']).strip().replace(' ','').replace('\r\n','')#写入excel 第1列和第二列try:table.write(i,1,content)table.write(i, 0, item['post_time'])i += 1except:print('')file.save('F:\\work\\week11\\data\\data2.xls')# 写入到txt中#接下里就可以用collection来完成对数据库表的一些操作with open ('F:/work/week11/data/data1.txt', 'wb') as f:#接下来可实现提取想要的字段内的数据for item in collection.find({},{'post_content':1,'_id':0}):# print(item['post_content'])if 'post_content' in item:content =bytes(item['post_content'],encoding='utf-8')f.write(content)f.write('\r\n'.encode(encoding='utf-8'))

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。