[南开大学]21秋学期《网络爬虫与信息提取》在线作业
答案来历:熊猫奥鹏(www.188open.com)网络爬虫与信息获取-[南开大学]21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息获取》在线作业
试卷总分:100 得分:100
第1题,Python中线程池map()方法第二个参数是()
A、列表
B、元组
C、字典
D、调集
正确答案:
第2题,经过()爬取假装成异步加载的后端烘托数据
A、正则表达式
B、Json字符串
C、JavaScript
D、Get
正确答案:
第3题,下面Python代码输出为():
def default_para_without_trap(para=[], value=0):if not para:para = []para.append(value)return para
print(\'榜首步:{}\'.format(default_para_trap(value=100)))print(\'第二步:{}\'.format(default_para_trap(value=50)))
A、榜首步:[100]
第二步:[100,50]
B、榜首步:[100]
第二步:[50]
C、榜首步:[100]
第二步:[]
D、榜首步:[100]
第二步:[100]
正确答案:
第4题,Python中若界说object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A、12
B、123
C、23
D、234
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在Scrapy的目录下,哪个文件担任数据抓取今后的处理工作?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:
第6题,阅读器用来记载用户状况信息的数据叫
A、session
B、cookies
C、moonpies
D、selenium
正确答案:
第7题,PyMongo中查询一切age29的记载是()
A、collection.find({\'age\': {\'$gt\': 29}})
B、collection.find({\'age\'29})
C、collection.find_all({\'age\': {\'$gt\': 29}})
D、collection.find_all({\'age\'29})
正确答案:
第8题,Redis中往调集中增加数据,运用关键词()
A、sadd
B、add
C、append
D、sappend
正确答案:
第9题,Redis中假如不删去列表中的数据,又要把数据读出来,就需求运用关键词()
A、range
B、lrange
C、srange
D、pop
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在Python中,为了运用XPath,需求装置一个第三方库()
A、lxml
B、xml
C、xpath
D、path
正确答案:
第11题,Python操作CSV文件可经过()容器的方法操作单元格
A、列表
B、元组
C、字典
D、调集
正确答案:
答案来历:熊猫奥鹏(www.188open.com),某些网站在建议Ajax恳求时会带着()字符串用于身份验证
A、Token
B、Cookie
C、ReqTime
D、sum
正确答案:
第13题,PyMongo中逻辑查询表明不等于的符号是()
A、$gt
B、$lt
C、$eq
D、$ne
正确答案:
第14题,下列说法错误的是()
A、Charles只能截获HTTP和HTTPS的数据包,假如网站运用的是websocket或许是flashsocket,那么Charles就力不从心。
B、有一些App会自带证书,运用其他证书都无法正常拜访后台接口。在这种状况下,Charles自带的证书就不能正常运用,也就没有方法抓取这种App的数据
C、有一些App的数据通过加密,App接纳到数据今后在其内部进行解密。Charles无法获取这种App的数据
D、关于上述状况,Charles能抓取到通过加密的数据。可是假如无法晓得数据的详细加密方法,就没有方法解读Charles抓取到的数据。
正确答案:
答案来历:熊猫奥鹏(www.188open.com),运用Xpath获取文本运用()
A、text
B、text()
C、content
D、content()
正确答案:
第16题,发动MongoDB运用指令mongod --() usr/local/etc/mongod.conf
A、config
B、install
C、start
D、begin
正确答案:
第17题,Redis中检查一个列表长度,运用关键词()
A、len
B、length
C、llen
D、count
正确答案:
第18题,Python中若界说object="12345",则print(object[::-1])输出()
A、1
B、5
C、54321
D、程序报错
正确答案:
第19题,在Scrapy的目录下,哪个文件担任寄存爬虫的各种装备信息?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:
答案来历:熊猫奥鹏(www.188open.com),当爬虫运转到yield scrapy.Request()或许yield item的时分,下列哪个爬虫中心件的方法被调用?
A、process_spider_output()
B、process_spider_exception()
C、process_spider_input()
D、process_start_ requests()
正确答案:
第21题,在装备ios运用Charles的操作中,正确的有()
A、关于苹果设备,首要要确保计算机和苹果设备联在同一个Wi-Fi上。
B、挑选"HTTP署理"下面的"手动"选项卡,在"效劳器"处输入计算机的IP地址,在"端口"处输入8888
C、输入完结署理今后按下苹果设备的Home键,设置就会自动保留。
D、装置完结证书今后,在设置中翻开"关于本机",找到最下面的"证信件任设置",并在里边发动对Charles证书的彻底信赖
正确答案:,B,C,D
第22题,下载器中心件的效果有哪些?
A、替换署理IP
B、替换Cookies
C、替换User-Agent
D、自动重试
正确答案:,B,C,D
第23题,下列关于在IOS上装备charles的说法正确的是()
A、不一样ios设备之间会有对比大的不同,所以装备的时分需求找到对应的装置证书的进口。
B、手机和电脑需求在同一个局域网下。
C、HTTP署理能够运用"自动"选项。
D、装置好证书今后,翻开iOS设备上的任何一个App,能够看到Charles中稀有据包在活动
正确答案:,D
第24题,假如爬虫爬取的是商业网站,而且方针网站运用了反爬虫机制,那么强行打破反爬虫机制能够构成()
A、不合法侵入计算机系统罪
B、不合法获取计算机信息系统数据罪
C、不合法获取计算机数据罪
D、不合法获取系统罪
正确答案:,B
答案来历:熊猫奥鹏(www.188open.com),Python中一个函数没有回来值则能够写()
A、没有return
B、return
C、return None
D、return NULL
正确答案:,B,C
第26题,运用BeautifulSoup对象后能够运用()来查找内容
A、find_all
B、find
C、search
D、search_all
正确答案:,B
第27题,PyMongo删去操作有()
A、delete
B、delete_all
C、delete_one
D、delete_many
正确答案:,D
第28题,以下哪些方法归于Python写CSV文件的方法()
A、writeheaders
B、writeheader
C、writerrows
D、writerow
正确答案:,C,D
第29题,MongoDB中获取姓名为db的库的句子为()
A、client.db
B、client(\'db\')
C、client[\'db\']
D、client{\'db\'}
正确答案:,C
答案来历:熊猫奥鹏(www.188open.com),Python中()容器有推导式
A、列表
B、元组
C、字典
D、调集
正确答案:,C,D
第31题,中心人进犯也是抓包的一种。
T、对
F、错
正确答案:F
第32题,在恳求头中设置User-Agent即可正常恳求网站
T、对
F、错
正确答案:F
第33题,UI Automator Viewer与Python uiautomator能够一起运用
T、对
F、错
正确答案:F
第34题,device.sleep()方法是运用UI Automatorr封闭屏幕的指令
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第35题,爬虫的源代码经过揭露不会对被爬虫网站形成影响
T、对
F、错
正确答案:F
第36题,尽管MongoDB比较于MySQL来说,速度马上许多,可是频频读写MongoDB仍是会严峻拖慢程序的履行速度。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,打码渠道都是靠机器运用OCR技术辨认图像上的文字。
T、对
F、错
正确答案:F
第38题,Python中包括字典的列表页能够变换成JSON字符串
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第39题,需求实名认证的打码网站愈加安全牢靠。
T、对
F、错
正确答案:F
第40题,MongoDB URI的格局为:
mongodb://效劳器IP或域名:端口@用户名:暗码
T、对
F、错
正确答案:F
第41题,MongoDB中ObjectId能够反向康复为时刻
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第42题,验证码有必要经过手动填充辨认。
T、对
F、错
正确答案:F
第43题,运用UI Automatorr操作实体键的指令为device.press.实体按键称号()
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,在MacOS下若要运转Redis能够运转解压今后的文件夹下面的src文件夹中的redis-server文件发动redis效劳
src/redis-server
T、对
F、错
正确答案:F
第45题,开源库pytesseract的效果是将图画中文字变换为文本。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第46题,Redis的调集与Python的调集相同,没有次序,值不重复
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第47题,mitmproxy的强壮之处在于它还自带一个mitmdump指令。这个指令能够用来运转契合必定规矩的Python脚本
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,process_spider_input(response, spider)是在爬虫运转yield item或许yield scrapy.Request()的时分调用
T、对
F、错
正确答案:F
第49题,上课传纸条。A要把纸条传给B,可是A与B间隔太远,所以让C来转交纸条。此刻,C先篡改纸条的内容再传给B,这是一品种似抓包的方法。
T、对
F、错
正确答案:F
答案来历:熊猫奥鹏(www.188open.com),在装置Scarpy的依靠库时,因为Visual C++ Build Tools的装置速度很慢,为了节约时刻,能够和装置Twisted一起进行
T、对
F、错
正确答案:F
试卷总分:100 得分:100
第1题,Python中线程池map()方法第二个参数是()
A、列表
B、元组
C、字典
D、调集
正确答案:
第2题,经过()爬取假装成异步加载的后端烘托数据
A、正则表达式
B、Json字符串
C、JavaScript
D、Get
正确答案:
第3题,下面Python代码输出为():
def default_para_without_trap(para=[], value=0):if not para:para = []para.append(value)return para
print(\'榜首步:{}\'.format(default_para_trap(value=100)))print(\'第二步:{}\'.format(default_para_trap(value=50)))
A、榜首步:[100]
第二步:[100,50]
B、榜首步:[100]
第二步:[50]
C、榜首步:[100]
第二步:[]
D、榜首步:[100]
第二步:[100]
正确答案:
第4题,Python中若界说object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A、12
B、123
C、23
D、234
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在Scrapy的目录下,哪个文件担任数据抓取今后的处理工作?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:
第6题,阅读器用来记载用户状况信息的数据叫
A、session
B、cookies
C、moonpies
D、selenium
正确答案:
第7题,PyMongo中查询一切age29的记载是()
A、collection.find({\'age\': {\'$gt\': 29}})
B、collection.find({\'age\'29})
C、collection.find_all({\'age\': {\'$gt\': 29}})
D、collection.find_all({\'age\'29})
正确答案:
第8题,Redis中往调集中增加数据,运用关键词()
A、sadd
B、add
C、append
D、sappend
正确答案:
第9题,Redis中假如不删去列表中的数据,又要把数据读出来,就需求运用关键词()
A、range
B、lrange
C、srange
D、pop
正确答案:
答案来历:熊猫奥鹏(www.188open.com),在Python中,为了运用XPath,需求装置一个第三方库()
A、lxml
B、xml
C、xpath
D、path
正确答案:
第11题,Python操作CSV文件可经过()容器的方法操作单元格
A、列表
B、元组
C、字典
D、调集
正确答案:
答案来历:熊猫奥鹏(www.188open.com),某些网站在建议Ajax恳求时会带着()字符串用于身份验证
A、Token
B、Cookie
C、ReqTime
D、sum
正确答案:
第13题,PyMongo中逻辑查询表明不等于的符号是()
A、$gt
B、$lt
C、$eq
D、$ne
正确答案:
第14题,下列说法错误的是()
A、Charles只能截获HTTP和HTTPS的数据包,假如网站运用的是websocket或许是flashsocket,那么Charles就力不从心。
B、有一些App会自带证书,运用其他证书都无法正常拜访后台接口。在这种状况下,Charles自带的证书就不能正常运用,也就没有方法抓取这种App的数据
C、有一些App的数据通过加密,App接纳到数据今后在其内部进行解密。Charles无法获取这种App的数据
D、关于上述状况,Charles能抓取到通过加密的数据。可是假如无法晓得数据的详细加密方法,就没有方法解读Charles抓取到的数据。
正确答案:
答案来历:熊猫奥鹏(www.188open.com),运用Xpath获取文本运用()
A、text
B、text()
C、content
D、content()
正确答案:
第16题,发动MongoDB运用指令mongod --() usr/local/etc/mongod.conf
A、config
B、install
C、start
D、begin
正确答案:
第17题,Redis中检查一个列表长度,运用关键词()
A、len
B、length
C、llen
D、count
正确答案:
第18题,Python中若界说object="12345",则print(object[::-1])输出()
A、1
B、5
C、54321
D、程序报错
正确答案:
第19题,在Scrapy的目录下,哪个文件担任寄存爬虫的各种装备信息?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:
答案来历:熊猫奥鹏(www.188open.com),当爬虫运转到yield scrapy.Request()或许yield item的时分,下列哪个爬虫中心件的方法被调用?
A、process_spider_output()
B、process_spider_exception()
C、process_spider_input()
D、process_start_ requests()
正确答案:
第21题,在装备ios运用Charles的操作中,正确的有()
A、关于苹果设备,首要要确保计算机和苹果设备联在同一个Wi-Fi上。
B、挑选"HTTP署理"下面的"手动"选项卡,在"效劳器"处输入计算机的IP地址,在"端口"处输入8888
C、输入完结署理今后按下苹果设备的Home键,设置就会自动保留。
D、装置完结证书今后,在设置中翻开"关于本机",找到最下面的"证信件任设置",并在里边发动对Charles证书的彻底信赖
正确答案:,B,C,D
第22题,下载器中心件的效果有哪些?
A、替换署理IP
B、替换Cookies
C、替换User-Agent
D、自动重试
正确答案:,B,C,D
第23题,下列关于在IOS上装备charles的说法正确的是()
A、不一样ios设备之间会有对比大的不同,所以装备的时分需求找到对应的装置证书的进口。
B、手机和电脑需求在同一个局域网下。
C、HTTP署理能够运用"自动"选项。
D、装置好证书今后,翻开iOS设备上的任何一个App,能够看到Charles中稀有据包在活动
正确答案:,D
第24题,假如爬虫爬取的是商业网站,而且方针网站运用了反爬虫机制,那么强行打破反爬虫机制能够构成()
A、不合法侵入计算机系统罪
B、不合法获取计算机信息系统数据罪
C、不合法获取计算机数据罪
D、不合法获取系统罪
正确答案:,B
答案来历:熊猫奥鹏(www.188open.com),Python中一个函数没有回来值则能够写()
A、没有return
B、return
C、return None
D、return NULL
正确答案:,B,C
第26题,运用BeautifulSoup对象后能够运用()来查找内容
A、find_all
B、find
C、search
D、search_all
正确答案:,B
第27题,PyMongo删去操作有()
A、delete
B、delete_all
C、delete_one
D、delete_many
正确答案:,D
第28题,以下哪些方法归于Python写CSV文件的方法()
A、writeheaders
B、writeheader
C、writerrows
D、writerow
正确答案:,C,D
第29题,MongoDB中获取姓名为db的库的句子为()
A、client.db
B、client(\'db\')
C、client[\'db\']
D、client{\'db\'}
正确答案:,C
答案来历:熊猫奥鹏(www.188open.com),Python中()容器有推导式
A、列表
B、元组
C、字典
D、调集
正确答案:,C,D
第31题,中心人进犯也是抓包的一种。
T、对
F、错
正确答案:F
第32题,在恳求头中设置User-Agent即可正常恳求网站
T、对
F、错
正确答案:F
第33题,UI Automator Viewer与Python uiautomator能够一起运用
T、对
F、错
正确答案:F
第34题,device.sleep()方法是运用UI Automatorr封闭屏幕的指令
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第35题,爬虫的源代码经过揭露不会对被爬虫网站形成影响
T、对
F、错
正确答案:F
第36题,尽管MongoDB比较于MySQL来说,速度马上许多,可是频频读写MongoDB仍是会严峻拖慢程序的履行速度。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第37题,打码渠道都是靠机器运用OCR技术辨认图像上的文字。
T、对
F、错
正确答案:F
第38题,Python中包括字典的列表页能够变换成JSON字符串
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第39题,需求实名认证的打码网站愈加安全牢靠。
T、对
F、错
正确答案:F
第40题,MongoDB URI的格局为:
mongodb://效劳器IP或域名:端口@用户名:暗码
T、对
F、错
正确答案:F
第41题,MongoDB中ObjectId能够反向康复为时刻
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第42题,验证码有必要经过手动填充辨认。
T、对
F、错
正确答案:F
第43题,运用UI Automatorr操作实体键的指令为device.press.实体按键称号()
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第44题,在MacOS下若要运转Redis能够运转解压今后的文件夹下面的src文件夹中的redis-server文件发动redis效劳
src/redis-server
T、对
F、错
正确答案:F
第45题,开源库pytesseract的效果是将图画中文字变换为文本。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第46题,Redis的调集与Python的调集相同,没有次序,值不重复
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第47题,mitmproxy的强壮之处在于它还自带一个mitmdump指令。这个指令能够用来运转契合必定规矩的Python脚本
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)
第48题,process_spider_input(response, spider)是在爬虫运转yield item或许yield scrapy.Request()的时分调用
T、对
F、错
正确答案:F
第49题,上课传纸条。A要把纸条传给B,可是A与B间隔太远,所以让C来转交纸条。此刻,C先篡改纸条的内容再传给B,这是一品种似抓包的方法。
T、对
F、错
正确答案:F
答案来历:熊猫奥鹏(www.188open.com),在装置Scarpy的依靠库时,因为Visual C++ Build Tools的装置速度很慢,为了节约时刻,能够和装置Twisted一起进行
T、对
F、错
正确答案:F