Python 自动化指南(繁琐工作自动化)第二版:附录 C:练习题的答案

发布时间 2023-04-03 16:03:59作者: ApacheCN

原文:https://automateboringuff.com/2e/appendixc/

Image

本附录包含每章末尾练习题的答案。我强烈建议你花时间解决这些问题。编程不仅仅是记住语法和一系列函数名。就像学习一门外语一样,你投入的练习越多,收获就越多。也有很多网站有练习编程的问题。你可以在/nostarch.com/automatestuff2的找到这些的列表。

当谈到实践项目时,没有一个正确的程序。只要你的程序执行了项目所要求的,你就可以认为它是正确的。然而,如果你想看已完成项目的例子,可以在的“下载书中使用的文件”链接中找到。

第一章

  1. 运算符有+-*/。这些值是'hello'-88.85

  2. 变量是spam;字符串是'spam'。字符串总是以引号开始和结束。

  3. 本章介绍的三种数据类型是整数、浮点数和字符串。

  4. 表达式是值和运算符的组合。所有表达式都计算(即归约)为一个值。

  5. 表达式计算为单个值。语句不会。

  6. bacon变量被设置为20bacon + 1表达式不重新分配bacon中的值(那需要一个赋值语句:bacon = bacon + 1)。

  7. 两个表达式的计算结果都是字符串'spamspamspam'

  8. 变量名不能以数字开头。

  9. int()float()str(函数将计算传递给它们的值的整数、浮点数和字符串版本。

  10. 该表达式会导致错误,因为99是一个整数,只有字符串可以用+运算符连接到其他字符串。正确的做法是I have eaten ' + str(99) + ' burritos.'

第二章

  1. TrueFalse,用大写的TF,其余的单词用小写

  2. andornot

  3. True and True就是True

    True and False就是False

    False and True就是False

    False and False就是False

    True or True就是True

    True or False就是True

    False or True就是True

    False or False就是False

    not True就是False

    not False就是True

  4. False

    False

    True

    False

    False

    True

  5. ==``!=``<``>``<=``>=

  6. ==是比较两个值并计算出布尔值的等于运算符,而=是将值存储在变量中的赋值运算符。

  7. 条件是在流程控制语句中使用的表达式,其计算结果为布尔值。

  8. 这三个块是if语句和行print('bacon')print('ham')中的所有内容。

    print('eggs')
    if spam > 5:
        print('bacon')
    else:
        print('ham')
    print('spam')
    
  9. 代码:

    if spam == 1:
        print('Hello')
    elif spam == 2:
        print('Howdy')
    else:
        print('Greetings!')
    
  10. 按下CTRL-C停止陷入无限循环的程序。

  11. break语句将把执行移到一个循环之外,就在一个循环之后。continue语句将把执行移到循环的开始。

  12. 他们都做同样的事情。range(10)调用范围从0到(但不包括)10range(0, 10)显式地告诉循环从0开始,range(0, 10, 1)显式地告诉循环在每次迭代中增加变量1

  13. 代码:

    for i in range(1, 11):
        print(i)
    

    以及:

    i = 1
    while i <= 10:
        print(i)
        i = i + 1
    
  14. 这个函数可以用spam.bacon()调用。

第三章

  1. 函数减少了对重复代码的需求。这使得程序更短,更容易阅读,更容易更新。

  2. 函数中的代码在调用函数时执行,而不是在定义函数时执行。

  3. def语句定义(即创建)一个函数。

  4. 函数由def语句及其def子句中的代码组成。函数调用是将程序执行转移到函数中,函数调用计算函数的返回值。

  5. 有一个全局作用域,每当调用一个函数时就会创建一个局部作用域。

  6. 当函数返回时,局部作用域被破坏,其中的所有变量都被遗忘。

  7. 返回值是函数调用计算得出的值。像任何值一样,返回值可以用作表达式的一部分。

  8. 如果一个函数没有返回语句,那么它的返回值就是None

  9. 一个global语句将强制函数中的一个变量引用全局变量。

  10. None的数据类型为NoneType

  11. 那个import语句导入了一个名为areallyourpetsnamederic的模块。(顺便说一下,这不是真正的 Python 模块。)

  12. 这个函数可以用spam.bacon()调用。

  13. 将可能导致错误的代码行放在try子句中。

  14. 可能导致错误的代码放在try子句中。发生错误时执行的代码放在except子句中。

第四章

  1. 空列表值,即不包含任何项目的列表值。这类似于''是空字符串值。

  2. spam[2] = 'hello'(注意,列表中的第三个值位于索引2,因为第一个索引是0。)

  3. 'd'(注意'3' * 2是字符串'33',在被11除之前传递给int()。这最终求值为3。只要使用值,就可以使用表达式。)

  4. 'd'(负数索引从末尾算起。)

  5. ['a', 'b']

  6. 1

  7. [3.14, 'cat', 11, 'cat', True, 99]

  8. [3.14, 11, 'cat', True]

  9. 列表连接的操作符是+,而复制的操作符是*。(这与字符串相同。)

  10. 虽然append()只会将值添加到列表的末尾,但是insert()可以将它们添加到列表中的任何位置。

  11. del语句和remove()列表方法是从列表中删除值的两种方法。

  12. 列表和字符串都可以传递给len(),有索引和切片,可以在for循环中使用,可以连接或复制,可以与innot in操作符一起使用。

  13. 列表是可变的;它们可以添加、删除或更改值。元组是不可变的;它们根本无法改变。同样,元组使用圆括号、()编写,而列表使用方括号、[]

  14. (42,)(尾部逗号是强制的。)

  15. 分别是tuple()list()函数

  16. 它们包含对列表值的引用。

  17. copy.copy()函数将做一个列表的浅层拷贝,而copy.deepcopy()函数将做一个列表的深层拷贝。也就是说,只有copy.deepcopy()会复制列表中的任何列表。

第五章

  1. 两个花括号:{}

  2. {'foo': 42}

  3. 存储在字典中的条目是无序的,而列表中的条目是有序的。

  4. 您会得到一个KeyError错误。

  5. 没有区别。in操作符检查一个值是否作为一个键存在于字典中。

  6. 'cat' in spam检查字典中是否有一个'cat'键,而'cat' in spam.values()检查spam中是否有一个键的值'cat'

  7. spam.setdefault('color', 'black')

  8. pprint.pprint()

第六章

  1. 转义字符表示字符串值中的字符,否则很难或不可能键入代码中。

  2. \n是换行符;\t是一个制表符。

  3. \\转义字符将代表反斜杠字符。

  4. Howl's中的单引号很好,因为你已经用双引号标记了字符串的开始和结束。

  5. 多行字符串允许您在不带\n转义字符的字符串中使用换行符。

  6. 这些表达式的计算结果如下:

    • 'e'
    • 'Hello'
    • 'Hello'
    • 'lo, world!
  7. 这些表达式的计算结果如下:

    • 'HELLO'
    • True
    • 'hello'
  8. 这些表达式的计算结果如下:

    • ['Remember,', 'remember,', 'the', 'fifth', 'of', 'November.']
    • 'There-can-be-only-one.'
  9. 分别是rjust()ljust()center()字符串方法

  10. lstrip()rstrip()方法分别从字符串的左端和右端删除空白。

第七章

  1. re.compile()函数返回Regex对象。

  2. 使用原始字符串是为了避免对反斜杠进行转义。

  3. search()方法返回Match对象。

  4. group()方法返回匹配文本的字符串。

  5. 0是整个匹配,组1包含第一组括号,组2包含第二组括号。

  6. 句点和括号可以用反斜杠进行转义:\.\(\)

  7. 如果正则表达式没有组,则返回字符串列表。如果正则表达式有组,则返回字符串元组的列表。

  8. |字符表示两个组之间的“非此即彼”匹配。

  9. ?字符可以表示“匹配零个或前面组中的一个”,也可以用来表示非贪婪匹配。

  10. +匹配一个或多个。*匹配零个或更多。

  11. {3}恰好匹配前一组的三个实例。{3,5}匹配三到五个实例。

  12. \d\w\s速记字符类分别匹配单个数字、单词或空格字符。

  13. \D\W\S速记字符类分别匹配不是数字、单词或空格字符的单个字符。

  14. .*执行贪婪匹配,.*?执行非贪婪匹配。

  15. [0-9a-z][a-z0-9]

  16. re.Ire.IGNORECASE作为第二个参数传递给re.compile()会使匹配不区分大小写。

  17. .字符通常匹配除换行符之外的任何字符。如果re.DOTALL作为第二个参数传递给re.compile(),那么点号也将匹配换行符。

  18. 调用sub()将返回字符串'X drummers, X pipers, five rings, X hens'

  19. re.VERBOSE参数允许您向传递给re.compile()的字符串添加空白和注释。

  20. re.compile(r'^\d{1,3}(,\d{3})*$')将创建这个正则表达式,但是其他正则表达式字符串可以产生一个类似的正则表达式。

  21. re.compile(r'[A-Z][a-z]*\sWatanabe')

  22. re.compile(r'(Alice|Bob|Carol)\s(eats|pets|throws)\s(apples|cats|baseballs)\.', re.IGNORECASE)

第八章

  1. 不可以。PyInputPlus 是第三方模块,不附带 Python 标准库。

  2. 这可以使你的代码更短:你可以输入pyip.inputStr()而不是pyinputplus.inputStr()

  3. inputInt()函数返回一个 int 值,而inputFloat()函数返回一个 float 值。这就是返回44.0的区别。

  4. 调用pyip.inputint(min=0, max=99)

  5. 明确允许或拒绝的正则表达式字符串列表

  6. 该函数将引发RetryLimitException

  7. 该函数返回值'hello'

第九章

  1. 相对路径是相对于当前工作目录的。

  2. 绝对路径以根文件夹开始,比如/或者C:\

  3. 在 Windows 上,它计算为WindowsPath('C:/Users/Al')。在其他操作系统上,它求值为不同种类的Path对象,但是具有相同的路径。

  4. 表达式'C:/Users' / 'Al'会导致错误,因为您不能使用/操作符来连接两个字符串。

  5. os.getcwd()函数返回当前工作目录。os.chdir()函数改变当前工作目录。

  6. .文件夹是当前文件夹,..是父文件夹。

  7. C:\bacon\eggs是目录名,而spam.txt是基本名。

  8. 字符串'r'表示读取模式,'w'表示写入模式,'a'表示附加模式

  9. 以写入模式打开的现有文件将被擦除并完全覆盖。

  10. read()方法将文件的全部内容作为一个字符串值返回。readlines()方法返回一个字符串列表,其中每个字符串都是文件内容中的一行。

  11. 架子值类似于字典值;它有键和值,以及类似于同名字典方法的keys()values()方法。

第十章

  1. shutil.copy()函数将复制单个文件,而shutil.copytree()将复制整个文件夹及其所有内容。

  2. shutil.move()函数用于重命名和移动文件。

  3. send2trash函数将文件或文件夹移动到回收站,而shutil函数将永久删除文件和文件夹。

  4. zipfile.ZipFile()函数等同于open()函数;第一个参数是文件名,第二个参数是打开 ZIP 文件的模式(读、写或附加)。

第十一章

  1. assert spam >= 10, 'The spam variable is less than 10.'

  2. assert eggs.lower() != bacon.lower() 'The eggs and bacon variables are the same!'assert eggs.upper() != bacon.upper(), 'The eggs and bacon variables are the same!'

  3. assert False, 'This assertion always triggers.'

  4. 为了能够调用logging.debug(),在程序的开始必须有这两行代码:

    import logging
    logging.basicConfig(level=logging.DEBUG, format=' %(asctime)s -
    %(levelname)s -  %(message)s')
    
  5. 为了能够用logging.debug()将日志消息发送到一个名为programLog.txt的文件中,在程序的开始必须有这两行:

    import logging
    >>> logging.basicConfig(filename='programLog.txt', level=logging.DEBUG,
    format=' %(asctime)s -  %(levelname)s -  %(message)s')
    
  6. 调试、信息、警告、错误和严重

  7. logging.disable(logging.CRITICAL)

  8. 您可以在不删除日志记录函数调用的情况下禁用日志记录消息。您可以有选择地禁用低级别的日志消息。您可以创建日志消息。记录消息提供了时间戳。

  9. “单步执行”按钮会将调试器移动到函数调用中。“单步执行”按钮将快速执行函数调用,而无需单步执行。“跳出”按钮将快速执行剩余的代码,直到它跳出当前所在的函数。

  10. 单击“继续”后,调试器将在到达程序结尾或带有断点的一行时停止。

  11. 断点是一行代码上的设置,当程序执行到该行时,它会导致调试器暂停。

  12. 要在 Mu 中设置断点,请单击行号,使其旁边出现一个红点。

第十二章

  1. webbrowser模块有一个open()方法,它将启动一个 Web 浏览器到一个特定的 URL,就是这样。requests模块可以从网上下载文件和网页。BeautifulSoup模块解析 HTML。最后,selenium模块可以启动和控制浏览器。

  2. requests.get()函数返回一个Response对象,该对象具有一个text属性,该属性以字符串形式包含下载的内容。

  3. 如果下载有问题,raise_for_status()方法会引发一个异常,如果下载成功则不做任何事情。

  4. Response对象的status_code属性包含 HTTP 状态代码。

  5. 在你的计算机上以'wb'“写二进制”模式打开新文件后,使用一个for循环迭代Response对象的iter_content()方法,将块写出到文件中。这里有一个例子:

    saveFile = open('filename.html', 'wb')
    for chunk in res.iter_content(100000):
        saveFile.write(chunk)
    
  6. F12在 Chrome 中调出开发者工具。按下CTRL-SHIFT-C (在 Windows 和 Linux 上)或Cmd-OPTION-C(在 OS X 上)调出 Firefox 中的开发者工具。

  7. 右键单击页面中的元素,从菜单中选择 检查元素

  8. '#main'

  9. '.highlight'

  10. 'div div'

  11. 'button[value="favorite"]'

  12. spam.getText()

  13. linkElem.attrs

  14. selenium模块用from selenium import webdriver导入。

  15. find_element_*方法返回第一个匹配元素作为一个WebElement对象。find_elements_*方法返回所有匹配元素的列表作为WebElement对象。

  16. click()send_keys()方法分别模拟鼠标点击和键盘按键。

  17. 对表单中的任何元素调用submit()方法都会提交表单。

  18. forward()back()refresh()对象方法模拟这些浏览器按钮。

第十三章

  1. openpyxl.load_workbook()函数返回一个Workbook对象。

  2. sheetnames属性包含一个Worksheet对象。

  3. 运行wb['Sheet1']

  4. 使用wb.active

  5. sheet['C5'].valuesheet.cell(row=5, column=3).value

  6. sheet['C5'] = 'Hello'sheet.cell(row=5, column=3).value = 'Hello'

  7. cell.rowcell.column

  8. 它们分别将工作表中最高的列和行的值保存为整数值。

  9. openpyxl.cell.column_index_from_string('M')

  10. openpyxl.cell.get_column_letter(14)

  11. sheet['A1':'F1']

  12. wb.save('example.xlsx')

  13. 公式的设置方式与任何值相同。将单元格的value属性设置为公式文本的字符串。请记住,公式以=符号开始。

  14. 调用load_workbook()时,为data_only关键字参数传递True

  15. sheet.row_dimensions[5].height = 100

  16. sheet.column_dimensions['C'].hidden = True

  17. 冻结窗格是总是出现在屏幕上的行和列。它们对标题很有用。

  18. openpyxl.chart.Reference()openpyxl.chart.Series()openpyxl.chart.BarChart()chartObj.append(seriesObj)add_chart()

第十四章

  1. 要访问谷歌表格,您需要一个证书文件、一个谷歌表格的令牌文件和一个谷歌网盘的令牌文件。

  2. EZSheets 有ezsheets.Spreadsheetezsheets.Sheet对象。

  3. 调用downloadAsExcel() Spreadsheet方法。

  4. 调用ezsheets.upload()函数并传递 Excel 文件的文件名。

  5. 访问ss['Students']['B2']

  6. 调用ezsheets.getColumnLetterOf(999)

  7. 访问Sheet对象的rowCountcolumnCount属性。

  8. 调用delete() Sheet方法。只有当你传递了permanent=True关键字参数,这才是永久的。

  9. createSpreadsheet()函数和createSheet() Spreadsheet方法将分别创建SpreadsheetSheet对象。

  10. EZSheets 将抑制您的方法调用。

第十五章

  1. open()返回的File对象

  2. PdfFileReader()读二进制('rb')和PdfFileWriter()写二进制('wb'

  3. 调用getPage(4)将为第 5 页返回一个Page对象,因为第 0 页是第一页。

  4. numPages变量存储了PdfFileReader对象中页数的整数。

  5. 调用decrypt('swordfish')

  6. rotateClockwise()rotateCounterClockwise()方法。要旋转的度数作为整数参数传递。

  7. docx.Document('demo.docx')

  8. 一个文档包含多个段落。段落从新行开始,包含多个段落。游程是段落中连续的字符组。

  9. 使用doc.paragraphs

  10. Run对象有这些变量(不是段落)。

  11. True总是使Run对象加粗,False总是不加粗,不管样式的加粗设置是什么。None将使Run对象只使用样式的加粗设置。

  12. 调用docx.Document()函数。

  13. doc.add_paragraph('Hello there!')

  14. 整数01234

第十六章

  1. 在 Excel 中,电子表格可以有字符串以外的数据类型的值;单元格可以有不同的字体、大小或颜色设置。单元格可以有不同的宽度和高度;相邻单元格可以合并;你可以嵌入图片和图表。

  2. 您传递一个从对open()的调用中获得的File对象。

  3. 对于reader对象,需要以读二进制('rb')打开对象,对于writer对象,需要以写二进制('wb')打开对象。

  4. writerow()方法

  5. delimiter参数改变用于分隔一行中单元格的字符串。lineterminator参数改变用于分隔行的字符串。

  6. json.loads()

  7. json.dumps()

第十七章

  1. 许多日期和时间程序使用的参考时刻。此刻是世界协调时 1970 年 1 月 1 日。

  2. time.time()

  3. time.sleep(5)

  4. 它返回与传递的参数最接近的整数。例如,round(2.4)返回2

  5. 一个datetime物体代表一个特定的时刻。一个timedelta对象代表一段时间。

  6. 运行datetime.datetime(2019, 1, 7).weekday(),返回0。这意味着周一,因为datetime模块使用0表示周一,1表示周二,依此类推,直到6表示周日。

  7. threadObj = threading.Thread(target=spam) threadObj.start()

  8. 确保在一个线程中运行的代码不会读取或写入与在另一个线程中运行的代码相同的变量。

第十八章

  1. 分别是 SMTP 和 IMAP

  2. smtplib.SMTP()smtpObj.ehlo()smptObj.starttls()smtpObj.login()

  3. imapclient.IMAPClient()imapObj.login()

  4. IMAP 关键字的字符串列表,如'BEFORE <date>''FROM <string>''SEEN'

  5. 给变量imaplib._MAXLINE赋一个大的整数值,比如10000000

  6. pyzmail模块读取下载的电子邮件。

  7. credentials.jsontoken.json文件告诉 EZGmail 模块在访问 Gmail 时使用哪个谷歌账户。

  8. 一条消息代表一封邮件,而涉及多封邮件的来回对话就是一个线程。

  9. 在传递给search()的字符串中包含'has:attachment'文本。

  10. 您将需要 Twilio 帐户 SID 号、认证令牌号和您的 Twilio 电话号码。

第十九章

  1. RGBA 值是一个由 4 个整数组成的元组,每个整数的范围从 0 到 255。这四个整数对应于颜色中红色、绿色、蓝色和 alpha(透明度)的数量。

  2. ImageColor.getcolor('CornflowerBlue', 'RGBA')的函数调用将返回该颜色的 RGBA 值(100, 149, 237, 255)

  3. 盒子元组是四个整数的元组值:左边的 x 坐标、上边的 y 坐标、宽度和高度。

  4. Image.open('zophie.png')

  5. imageObj.size是两个整数的元组,宽度和高度。

  6. imageObj.crop((0, 50, 50, 50))。注意,您传递给crop()的是一个盒子元组,而不是四个独立的整数参数。

  7. 调用Image对象的imageObj.save('new_filename.png')方法。

  8. 模块包含了在图像上绘图的代码。

  9. ImageDraw物体有point()line()rectangle()等形状绘制方法。它们通过将Image对象传递给ImageDraw.Draw()函数来返回。

第二十章

  1. 将鼠标移动到屏幕的左上角,即(0, 0)坐标。

  2. pyautogui.size()返回一个包含两个整数的元组,表示屏幕的宽度和高度。

  3. pyautogui.position()返回一个带有两个整数的元组,代表鼠标光标的 x 和 y 坐标。

  4. moveTo()函数将鼠标移动到屏幕上的绝对坐标,而move()函数相对于鼠标的当前位置移动鼠标。

  5. pyautogui.dragTo()pyautogui.drag()

  6. pyautogui.typewrite('Hello, world!')

  7. 要么将一列键盘按键串传递给pyautogui.write()(比如'left'),要么将一个单独的键盘按键串传递给pyautogui.press()

  8. pyautogui.screenshot('screenshot.png')

  9. pyautogui.PAUSE = 2

  10. 您应该使用 Selenium 来控制 Web 浏览器,而不是 PyAutoGUI。

  11. PyAutoGUI 盲目地点击和输入,不容易发现它是否点击和输入了正确的窗口。意外的弹出窗口或错误会使脚本偏离轨道,并要求您将其关闭。

  12. 调用pyautogui.getWindowsWithTitle('Notepad')函数。

  13. 运行w = pyatuogui.getWindowsWithTitle('Firefox'),然后运行w.activate()