From 442b6cfe832b046b79b2881a70b656ae88901bc4 Mon Sep 17 00:00:00 2001 From: clchyj Date: Thu, 7 Mar 2024 20:32:05 +0800 Subject: [PATCH 1/3] =?UTF-8?q?docs:=20=E6=96=B0=E5=A2=9E=E6=96=87?= =?UTF-8?q?=E6=A1=A3=20=E5=88=A9=E7=94=A8python=E5=AE=9E=E7=8E=B0=E5=B0=8F?= =?UTF-8?q?=E8=AF=B4=E8=87=AA=E7=94=B1?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit 新增文档 利用python实现小说自由 --- ...17\350\257\264\350\207\252\347\224\261.md" | 91 +++++++++++++++++++ 1 file changed, 91 insertions(+) create mode 100644 "Python/\347\210\254\350\231\253/\345\210\251\347\224\250python\345\256\236\347\216\260\345\260\217\350\257\264\350\207\252\347\224\261.md" diff --git "a/Python/\347\210\254\350\231\253/\345\210\251\347\224\250python\345\256\236\347\216\260\345\260\217\350\257\264\350\207\252\347\224\261.md" "b/Python/\347\210\254\350\231\253/\345\210\251\347\224\250python\345\256\236\347\216\260\345\260\217\350\257\264\350\207\252\347\224\261.md" new file mode 100644 index 0000000000..deb2f6262f --- /dev/null +++ "b/Python/\347\210\254\350\231\253/\345\210\251\347\224\250python\345\256\236\347\216\260\345\260\217\350\257\264\350\207\252\347\224\261.md" @@ -0,0 +1,91 @@ +### 利用python实现小说自由 + +#### 一、用到的相关模块 + +1.reuqests模块 + +安装reuqest模块,命令行输入: + +``` +pip install requests +``` + +2.xpath解析 + +​ XPath 即为 XML 路径语言,它是一种用来确定 XML (标准通用标记语言子集)文档中某部分位置的语言。XPath 基于 XML 的树状结构,提供在数据结构树中找寻节点的能力。起初 XPath 的提出的初衷是将其作为一个通用的、介于 XPointer 与 XSL 间的语法模型。但是 XPath 很快的被开发者采用来当作小型查询语言。 + +​ 简单的来说:Xpath(XML Path Language)是一门在 XML 和 HTML 文档中查找信息的语言,可用来在 XML 和 HTML 文档中对元素和属性进行遍历。 + +​ xml 是 一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML 数据。 + +安装xml: + +``` +pip install lxml +``` + + + +#### 二、实现步骤 + +1.首先我们打开一个小说的网址:https://www.qu-la.com/booktxt/17437775116/ + +2.右击“检查” 查看下这个网页的相关代码情况 + + + +我们可以发现所有的内容都被包裹在