南开21春学期《网络爬虫与信息提取》在线作业100分

作者:奥鹏周老师 分类: 南开大学 发布时间: 2021-04-19 23:53
答案来历:熊猫奥鹏(www.188open.com)-[南开大学]21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息获取》在线作业
试卷总分:100 得分:100
第1题,下列说法错误的是()
A、小程序的恳求极端简略,根本上没有验证信息
B、用Python来恳求小程序的后台接口然后获取数据,比恳求异步加载网页的后台接口要杂乱许多。
C、假如方针网站有微信小程序,那么必定要优先查询能否经过小程序的接口来抓取数据。
D、小程序的反爬虫才能比网页版的低许多。运用小程序的接口来爬数据,能极大进步爬虫的开发功率。
正确答案:


第2题,()是一个传递信息的通道。它担任将爬取博文列表页获取到的信息传递给担任爬取正文页的方法中。
A、meta
B、head
C、header
D、body
正确答案:


第3题,发动MongoDB运用指令mongod --() usr/local/etc/mongod.conf
A、config
B、install
C、start
D、begin
正确答案:


第4题,HTTP常用状况码标明效劳器不答应拜访那个资源的是()
A、500
B、503
C、403
D、405
正确答案:


答案来历:熊猫奥鹏(www.188open.com),Python正则表达式模块的findall方法假如没有匹配到成果,则回来成果为()
A、空
B、空列表
C、空元组
D、不回来
正确答案:


第6题,Scrapy中运用Xpath取得的成果调用了.extract方法,成果以()方式生成
A、列表
B、元组
C、字典
D、调集
正确答案:


第7题,在Scrapy的目录下,哪个文件担任数据抓取今后的处理工作?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:


第8题,Python在Windows途径字符串左引号的左面加()符号来防止反斜杠疑问
A、s
B、c
C、d
D、r
正确答案:


第9题,python中能够用来将图像中的文字变换为文本的第三方类库是
A、lxml
B、requests
C、beautifulsoup
D、pytesseract
正确答案:


答案来历:熊猫奥鹏(www.188open.com),在Linux中哪个指令是增加权限的()
A、chmod
B、sudo
C、cp
D、mkdir
正确答案:


第11题,运用python定制mitmproxy,下面的句子恳求的是()。{req.headers["User-Agent"]}
A、headers
B、文本内容
C、方针网站
D、user-agent
正确答案:


答案来历:熊猫奥鹏(www.188open.com),PyMongo中逻辑查询表明小于等于的符号是()
A、$gt
B、$lt
C、$gte$$lte
正确答案:


第13题,Python中若界说object=[1, 2, 3, 4, 5],则print(object[-4])输出()
A、NULL
B、2
C、4
D、程序报错
正确答案:


第14题,Python中Object={\'obj_1\':\'1\',\'obj_2\':\'2\'},则Objcet.get(\'boj_3\',\'3\')是()
A、1
B、2
C、3
D、无输出
正确答案:


答案来历:熊猫奥鹏(www.188open.com),PyMongo中的查找方法的参数是哪种数据结构()
A、列表
B、元组
C、字典
D、调集
正确答案:


第16题,Python正则表达式模块的findall方法获取内容包括多个,则回来成果的列表中会包括()
A、列表
B、元组
C、字典
D、调集
正确答案:


第17题,Redis是一个开源的运用()语言编写
A、ANSI C
B、C++
C、JAVA
D、Python
正确答案:


第18题,下面关于Charles运用说法错误的是()
A、在数据包十分多的状况下,运用Charles的过滤功用来对数据包进行过滤然后削减搅扰。
B、经过单击图中方框框住的各个选项卡,能够十分直观地调查到恳求和回来的各种信息。
C、假如阅读器是Chrome,在没有装置第三方署理插件的状况下,Chrome的HTTP流量都会通过Charles。
D、Charles无法撑持计算机上除了阅读器之外的其他软件。
正确答案:


第19题,以下哪个指令是使用URL语法在指令行下工作的文件传输东西()
A、curl
B、tar -zxvf
C、mkdir
D、cp
正确答案:


答案来历:熊猫奥鹏(www.188open.com),Python中Object=[1, 2, 3, 4, 5],则Objcet是()
A、列表
B、元组
C、字典
D、调集
正确答案:


第21题,下列关于mitmproxy的运用说法正确的是()
A、mitmproxy的端口为8080端口。
B、设置好署理今后,在手机上翻开一个App或许翻开一个网页,能够看到mitmproxy上面稀有据翻滚。
C、用鼠标在终端窗口上单击其间的恣意一个恳求,能够显现这个数据包的概况信息。
D、假如要拜访HTTPS网站,还需求装置mitmproxy的证书
正确答案:,B,C,D


第22题,cookies的缺陷是
A、完成自动登录
B、盯梢用户状况
C、http中明文传输
D、添加http恳求的流量
正确答案:,D


第23题,以下哪些能够独立变成Python编译器()
A、Pycharm
B、IDLE
C、Eclipse
D、Visual Studio 2010
正确答案:,B


第24题,Python中()容器有推导式
A、列表
B、元组
C、字典
D、调集
正确答案:,C,D


答案来历:熊猫奥鹏(www.188open.com),运用Selennium获取网页中元素的方法有
A、find_element_by_name
B、find_element_by_id
C、find_elements_by_name
D、find_elements_by_id
正确答案:,B,C,D


第26题,Python中一个函数没有回来值则能够写()
A、没有return
B、return
C、return None
D、return NULL
正确答案:,B,C


第27题,Python中一个函数能够有()个return句子
A、0
B、1
C、多个
D、2
正确答案:,B,C,D


第28题,以下哪些方法归于Python写CSV文件的方法()
A、writeheaders
B、writeheader
C、writerrows
D、writerow
正确答案:,C,D


第29题,Python中经过Key来从字典object中读取对应的Value的方法有()
A、object[key]
B、object.get(key)
C、object.pop(key)
D、object.pop()
正确答案:,B


答案来历:熊猫奥鹏(www.188open.com),BS4能够用来从()中获取数据
A、HTML
B、XML
C、数据库
D、JSON
正确答案:,B


第31题,scrapy与selenium结合能够完成直接处理需求异步加载的页面
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第32题,运用UI Automatorr让屏幕向右翻滚的操作是得到相应控件后运用指令scroll.horiz.forward()
T、对
F、错
正确答案:F


第33题,Python能够将列表或字典变换成Json字符串
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第34题,Python中列表生成今后还能够往里边继续增加数据,也能够从里边删去数据;
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第35题,cookies在http恳求中是明文传输的。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第36题,Python中条件句子在运用or衔接的多个表达式中,只需有一个表达式为真,那么后边的表达式就不会履行。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第37题,在装置Scarpy的依靠库时,因为Visual C++ Build Tools的装置速度很慢,为了节约时刻,能够和装置Twisted一起进行
T、对
F、错
正确答案:F


第38题,HTTP状况码503表明效劳器内部毛病。
T、对
F、错
正确答案:


第39题,在有spiders何setting.py这两项的状况下,能够写出爬虫而且保留数据,items.py和pipelines.py文件是原作者的失误而致使的冗余文件。
T、对
F、错
正确答案:


第40题,在Windows中下若要运转Redis能够运转redis-server /usr/local/etc/redis.conf
T、对
F、错
正确答案:F


第41题,Scrapyd能够一起管理多个Scrapy工程里边的多个爬虫的多个版别
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第42题,装置mitmdump之前,运转sudo apt-get install python3-dev python3-pip libffi-dev libssl-dev是为了装置必要的运转环境。
T、对
F、错
正确答案:


第43题,PyMongoDB中排序方法sort第二个参数1表明降序
T、对
F、错
正确答案:F


第44题,charles装备中,装置完结证书今后,在设置中翻开"关于本机",找到最下面的"证信件任设置",并在里边发动对Charles证书的彻底信赖。
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第45题,为了确保数据刺进功率,在内存答应的状况下,大概一次性把数据读入内存,尽量削减对MongoDB的读取操作。
T、对
F、错
正确答案:


第46题,Redis的列表是一个单向行列
T、对
F、错
正确答案:


第47题,数据抓包即是中心人爬虫的一个简略应用。所以运用Charles也是一种中心人进犯
T、对
F、错
答案联系QQ:3326650399 微信:cs80188 熊猫奥鹏(www.188open.com)


第48题,假如把网络上发送与接纳的数据包了解为快递包裹,那么在快递运送的过程中取出检查更改里边的内容,即是相似抓包的过程
T、对
F、错
正确答案:F


第49题,MongoDB 是一个根据散布式文件存储的数据库,,速度远快过Redis
A、对
B、错
正确答案:


答案来历:熊猫奥鹏(www.188open.com),对Charles设置署理时,Ip能够设置为127.0.0.1,端口为8888.
T、对
F、错
正确答案:

作业答案 联系QQ:3326650399 微信:cs80188