1 option
Python : Chinese Edition / Nitin Hardeniya.
- Format:
- Book
- Author/Creator:
- Hardeniya, Nitin, author.
- Series:
- Yi bu tu shu.
- Yi bu tu shu
- Standardized Title:
- Natural language processing : Python and NLTK. Chinese
- Language:
- English
- Subjects (All):
- Python (Computer program language).
- Natural language processing (Computer science).
- Physical Description:
- 1 online resource (649 pages)
- Edition:
- First edition.
- Place of Publication:
- Birmingham, England : Packt Publishing, [2019]
- Biography/History:
- Press Posts & Telecom: ,195310, ,, ,, ,, ,, ,, ,, ,, 10, ,30, ,, ,, Hardeniya Nitin: Nitin Hardeniya, PythonNLTK, ,5
- Summary:
- Detailed summary in vernacular field.
- Contents:
- 封
- 版权声明
- 内容提
- 序
- 前
- 源与支持
- 目录
- 模块 1 NLTK 基础知
- 第1章 然 处理简介
- 1.1 为什么 学习NLP
- 1.2 从Python 的基本知 开始
- 1.2.1 列
- 1.2.2 助
- 1.2.3 正则 式
- 1.2.4 典
- 1.2.5 编写函数
- 1.3 NLTK
- 1.4 一
- 1.5 本章小结
- 第2章 文本的整理和清洗
- 2.1 文本整理
- 2.2 文本清洗
- 2.3 句子拆分器
- 2.4 标 析
- 2.5 干提取
- 2.6 形 原
- 2.7 停用 删
- 2.8 生僻字删
- 2.9 拼写校正
- 2.10 一
- 2.11 本章小结
- 第3章 性标注
- 3.1 什么是 性标注
- 3.1.1 斯坦福标注器
- 3.1.2 深入了 标注器
- 3.1.3 序列标注器
- 1 N元标注器
- 2 正则 式标注器
- 3.1.4 布 尔标注器
- 3.1.5 基于标注器的机器学习
- 3.2 命名实体 别
- NER标注器
- 3.3 一
- 3.4 本章小结
- 第4章 对文本的结构 法分析
- 4.1 浅层 法分析与深层 法分析
- 4.2 法分析的两种方法
- 4.3 为什么 法分析
- 4.4 不同类型的 法分析器
- 4.4.1 归下 的 法分析器
- 4.4.2 移位归约 法分析器
- 4.4.3 图 法分析器
- 4.4.4 正则 式 法分析器
- 4.5 依存分析
- 4.6 组块化
- 4.7 信息抽取
- 4.7.1 命名实体 别
- 4.7.2 关系抽取
- 4.8 本章小结
- 第5章 NLP应用
- 5.1 构建第一个NLP 应用
- 5.2 其他的NLP 应用
- 5.2.1 机器翻
- 5.2.2 统 机器翻
- 5.2.3 信息检索
- 5.2.4 别
- 5.2.5 文本分类
- 5.2.6 信息提取
- 5.2.7 答系统
- 5.2.8 对 系统
- 5.2.9 义消歧
- 5.2.10 主 建模
- 5.2.11 检测
- 5.2.12 光学字符 别
- 5.3 本章小结
- 第6章 文本分类
- 6.1 机器学习
- 6.2 文本分类
- 6.3 样
- 6.3.1 朴素 叶斯
- 6.3.2 决策树
- 6.3.3 机梯度下
- 6.3.4 回归
- 6.3.5 支持向 机
- 6.4 机森林算法
- 6.5 文本 类
- K均值算法
- 6.6 文本的主 建模
- 安 gensim
- 6.7 参 料
- 6.8 本章小结
- 第7章 网络爬取
- 7.1 网络爬
- 7.2 编写第一个爬 程序
- 7.3 Scrapy 中的数据流
- 7.3.1 Scrapy 命令 界
- 7.3.2
- 7.4 站点地图
- 7.5 管
- 7.6 外 参
- 7.7 本章小结
- 第8章 与其他Python库一同使用NLTK
- 8.1 NumPy
- 8.1.1 ndarray
- 8.1.2 基本操作
- 8.1.3 从数组中提取数据
- 8.1.4 复杂的矩 算
- 8.2 SciPy
- 8.2.1 线性代数
- 8.2.2 特征值和特征向
- 8.2.3 稀疏矩
- 8.2.4 优化
- 8.3 Pandas
- 8.3.1 取数据
- 8.3.2 时序数据
- 8.3.3 列 换
- 8.3.4 噪声数据
- 8.4 Matplotlib
- 8.4.1 subplot
- 8.4.2 添加
- 8.4.3 散点图
- 8.4.4 柱状图
- 8.4.5 3D图
- 8.5 外 参
- 8.6 本章小结
- 第9章 使用Python 社交媒体挖掘
- 9.1 数据收
- 推特.
- 9.2 数据提取
- 热
- 9.3 地理可 化
- 9.3.1 影响 检测
- 9.3.2 Facebook
- 9.3.3 影响 的朋友
- 9.4 本章小结
- 第10章 大 模的文本挖掘
- 10.1 在Hadoop 上使用Python 的不同方法
- 10.1.1 Python的流
- 10.1.2 Hive/Pig UDF
- 10.1.3 流包 器
- 10.2 在Hadoop 上 NLTK
- 10.2.1 UDF
- 10.2.2 Python流
- 10.3 在Hadoop 上 scikit-learn
- 10.4 PySpark
- 10.5 本章小结
- 模块 2 使用Python 3的NLTK 3 文本处理
- 第1章 标 文本和WordNet的基础
- 1.1 引
- 1.2 将文本标 成句子
- 1.2.1 准备工作
- 1.2.2 工作方式
- 1.2.3 工作原理
- 1.2.4 更多信息
- 1.2.5 参
- 1.3 将句子标 成单
- 1.3.1 工作方式
- 1.3.2 工作原理
- 1.3.3 更多信息
- 1.3.4 参
- 1.4 使用正则 式标 句
- 1.4.1 准备工作
- 1.4.2 工作方式
- 1.4.3 工作原理
- 1.4.4 更多信息
- 1.4.5 参
- 1.5 练 句标 生成器
- 1.5.1 准备工作
- 1.5.2 工作方式
- 1.5.3 工作原理
- 1.5.4 更多信息
- 1.5.5 参
- 1.6 在已标 的 句中 滤停用
- 1.6.1 准备工作
- 1.6.2 工作方式
- 1.6.3 工作原理
- 1.6.4 更多信息
- 1.6.5 参
- 1.7 查找WordNet 中单 的Synset
- 1.7.1 准备工作
- 1.7.2 工作方式
- 1.7.3 工作原理
- 1.7.4 更多信息
- 1.7.5 参
- 1.8 在WordNet 中查找 元和同义
- 1.8.1 工作方式
- 1.8.2 工作原理
- 1.8.3 更多信息
- 1.8.4 参
- 1.9 算WordNet 和Synset 的相似度
- 1.9.1 工作方式
- 1.9.2 工作原理
- 1.9.3 更多信息
- 1.9.4 参
- 1.10 发现单 搭
- 1.10.1 准备工作
- 1.10.2 工作方式
- 1.10.3 工作原理
- 1.10.4 更多信息
- 1.10.5 参
- 第2章 替换和校正单
- 2.1 引
- 2.2 干提取
- 2.2.1 工作方式
- 2.2.2 工作原理
- 2.2.3 更多信息
- 2.2.4 参
- 2.3 使用WordNet 形 原
- 2.3.1 准备工作
- 2.3.2 工作方式
- 2.3.3 工作原理
- 2.3.4 更多信息
- 2.3.5 参
- 2.4 基于匹 的正则 式替换单
- 2.4.1 准备工作
- 2.4.2 工作方式
- 2.4.3 工作原理
- 2.4.4 更多信息
- 2.4.5 参
- 2.5 移 复字符
- 2.5.1 准备工作
- 2.5.2 工作方式
- 2.5.3 工作原理
- 2.5.4 更多信息
- 2.5.5 参
- 2.6 使用Enchant 拼写校正
- 2.6.1 准备工作
- 2.6.2 工作方式
- 2.6.3 工作原理
- 2.6.4 更多信息
- 2.6.5 参
- 2.7 替换同义
- 2.7.1 准备工作
- 2.7.2 工作方式
- 2.7.3 工作原理
- 2.7.4 更多信息
- 2.7.5 参
- 2.8 使用反义 替换否定形式
- 2.8.1 工作方式
- 2.8.2 工作原理
- 2.8.3 更多信息
- 2.8.4 参
- 第3章 创建 料库
- 3.1 引.
- 3.2 建立 定义 料库
- 3.2.1 准备工作
- 3.2.2 工作方式
- 3.2.3 工作原理
- 3.2.4 更多信息
- 3.2.5 参
- 3.3 创建 汇 料库
- 3.3.1 准备工作
- 3.3.2 工作方式
- 3.3.3 工作原理
- 3.3.4 更多信息
- 3.3.5 参
- 3.4 创建已标 性单 的 料库
- 3.4.1 准备工作
- 3.4.2 工作方式
- 3.4.3 工作原理
- 3.4.4 更多信息
- 3.4.5 参
- 3.5 创建已组块短 的 料库
- 3.5.1 准备工作
- 3.5.2 工作方式
- 3.5.3 工作原理
- 3.5.4 更多信息
- 3.5.5 参
- 3.6 创建已分类文本的 料库
- 3.6.1 准备工作
- 3.6.2 工作方式
- 3.6.3 工作原理
- 3.6.4 更多信息
- 3.6.5 参
- 3.7 创建已分类组块 料库 取器
- 3.7.1 准备工作
- 3.7.2 工作方式
- 3.7.3 工作原理
- 3.7.4 更多信息
- 3.7.5 参
- 3.8 懒惰 料库加
- 3.8.1 工作方式
- 3.8.2 工作原理
- 3.8.3 更多信息
- 3.9 创建 定义 料库 图
- 3.9.1 工作方式
- 3.9.2 工作原理
- 3.9.3 更多信息
- 3.9.4 参
- 3.10 创建基于MongoDB 的 料库 取器
- 3.10.1 准备工作
- 3.10.2 工作方式
- 3.10.3 工作原理
- 3.10.4 更多信息
- 3.10.5 参
- 3.11 在加 文件的情况下编 料库
- 3.11.1 准备工作
- 3.11.2 工作方式
- 3.11.3 工作原理
- 第4章 性标注
- 4.1 引
- 4.2 标注
- 4.2.1 准备工作
- 4.2.2 工作方式
- 4.2.3 工作原理
- 4.2.4 更多信息
- 4.2.5 参
- 4.3 练一元组 性标注器
- 4.3.1 工作方式
- 4.3.2 工作原理
- 4.3.3 更多信息
- 4.3.4 参
- 4.4 回 标注的组合标注器
- 4.4.1 工作方式
- 4.4.2 工作原理
- 4.4.3 更多信息
- 4.4.4 参
- 4.5 练和组合N元标注器
- 4.5.1 准备工作
- 4.5.2 工作方式
- 4.5.3 工作原理
- 4.5.4 更多信息
- 4.5.5 参
- 4.6 创建似然单 标签的模型
- 4.6.1 工作方式
- 4.6.2 工作原理
- 4.6.3 更多信息
- 4.6.4 参
- 4.7 使用正则 式标注
- 4.7.1 准备工作
- 4.7.2 工作方式
- 4.7.3 工作原理
- 4.7.4 更多信息
- 4.7.5 参
- 4.8 缀标签
- 4.8.1 工作方式
- 4.8.2 工作原理
- 4.8.3 更多信息
- 4.8.4 参
- 4.9 练布 尔标注器
- 4.9.1 工作方式
- 4.9.2 工作原理
- 4.9.3 更多信息
- 4.9.4 参
- 4.10 练TnT 标注器
- 4.10.1 工作方式
- 4.10.2 工作原理
- 4.10.3 更多信息
- 4.10.4 参
- 4.11 使用WordNet 标注
- 4.11.1 准备工作
- 4.11.2 工作方式
- 4.11.3 工作原理
- 4.11.4 参
- 4.12 标注专有名
- 4.12.1 工作方式
- 4.12.2 工作原理
- 4.12.3 参
- 4.13 基于分类器的标注
- 4.13.1 工作方式
- 4.13.2 工作原理
- 4.13.3 更多信息
- 4.13.4 参
- 4.14 使用NLTK 练器 练标注器.
- 4.14.1 工作方式
- 4.14.2 工作原理
- 4.14.3 更多信息
- 4.14.4 参
- 第5章 提取组块
- 5.1 引
- 5.2 使用正则 式组块和 断
- 5.2.1 准备工作
- 5.2.2 工作方式
- 5.2.3 工作原理
- 5.2.4 更多信息
- 5.2.5 参
- 5.3 使用正则 式合并和拆分组块
- 5.3.1 工作方式
- 5.3.2 工作原理
- 5.3.3 更多信息
- 5.3.4 参
- 5.4 使用正则 式扩展和删 组块
- 5.4.1 工作方式
- 5.4.2 工作原理
- 5.4.3 更多信息
- 5.4.4 参
- 5.5 使用正则 式 分 析
- 5.5.1 工作方式
- 5.5.2 工作原理
- 5.5.3 更多信息
- 5.5.4 参
- 5.6 练基于标注器的组块器
- 5.6.1 工作方式
- 5.6.2 工作原理
- 5.6.3 更多信息
- 5.6.4 参
- 5.7 基于分类的分块
- 5.7.1 工作方式
- 5.7.2 工作原理
- 5.7.3 更多信息
- 5.7.4 参
- 5.8 提取命名实体
- 5.8.1 工作方式
- 5.8.2 工作原理
- 5.8.3 更多信息
- 5.8.4 参
- 5.9 提取专有名 组块
- 5.9.1 工作方式
- 5.9.2 工作原理
- 5.9.3 更多信息
- 5.10 提取 位组块
- 5.10.1 工作方式
- 5.10.2 工作原理
- 5.10.3 更多信息
- 5.10.4 参
- 5.11 练命名实体组块器
- 5.11.1 工作方式
- 5.11.2 工作原理
- 5.11.3 更多信息
- 5.11.4 参
- 5.12 使用NLTK 练器 练组块器
- 5.12.1 工作方式
- 5.12.2 工作原理
- 5.12.3 更多信息
- 5.12.4 参
- 第6章 换组块与树
- 6.1 引
- 6.2 滤句子中无意义的单
- 6.2.1 准备工作
- 6.2.2 工作方式
- 6.2.3 工作原理
- 6.2.4 更多信息
- 6.2.5 参
- 6.3 纠正动 形式
- 6.3.1 准备工作
- 6.3.2 工作方式
- 6.3.3 工作原理
- 6.3.4 参
- 6.4 交换动 短
- 6.4.1 工作方式
- 6.4.2 工作原理
- 6.4.3 更多信息
- 6.4.4 参
- 6.5 交换名 基数
- 6.5.1 工作方式
- 6.5.2 工作原理
- 6.5.3 参
- 6.6 交换不定式短
- 6.6.1 工作方式
- 6.6.2 工作原理
- 6.6.3 更多信息
- 6.6.4 参
- 6.7 单数化复数名
- 6.7.1 工作方式
- 6.7.2 工作原理
- 6.7.3 参
- 6.8 接组块变换
- 6.8.1 工作方式
- 6.8.2 工作原理
- 6.8.3 更多信息
- 6.8.4 参
- 6.9 将组块树 换为文本
- 6.9.1 工作方式
- 6.9.2 工作原理
- 6.9.3 更多信息
- 6.9.4 参
- 6.10 平展深度树
- 6.10.1 准备工作
- 6.10.2 工作方式
- 6.10.3 工作原理
- 6.10.4 更多信息
- 6.10.5 参
- 6.11 创建浅树
- 6.11.1 工作方式
- 6.11.2 工作原理
- 6.11.3 参
- 6.12 换树标签
- 6.12.1 准备工作
- 6.12.2 工作方式
- 6.12.3 工作原理
- 6.12.4 参
- 第7章 文本分类
- 7.1 引
- 7.2 特征提取
- 7.2.1 工作方式
- 7.2.2 工作原理
- 7.2.3 更多信息
- 7.2.4 参.
- 7.3 练朴素 叶斯分类器
- 7.3.1 准备工作
- 7.3.2 工作方式
- 7.3.3 工作原理
- 7.3.4 更多信息
- 7.3.5 参
- 7.4 练决策树分类器
- 7.4.1 工作方式
- 7.4.2 工作原理
- 7.4.3 更多信息
- 7.4.4 参
- 7.5 练最大熵分类器
- 7.5.1 准备工作
- 7.5.2 工作方式
- 7.5.3 工作原理
- 7.5.4 更多信息
- 7.5.5 参
- 7.6 练scikit-learn 分类器
- 7.6.1 准备工作
- 7.6.2 工作方式
- 7.6.3 工作原理
- 7.6.4 更多信息
- 7.6.5 参
- 7.7 分类器的精准率和召回率
- 7.7.1 工作方式
- 7.7.2 工作原理
- 7.7.3 更多信息
- 7.7.4 参
- 7.8 算 信息 单
- 7.8.1 工作方式
- 7.8.2 工作原理
- 7.8.3 更多信息
- 7.8.4 参
- 7.9 使用投票组合分类器
- 7.9.1 准备工作
- 7.9.2 工作方式
- 7.9.3 工作原理
- 7.9.4 参
- 7.10 使用多个二元分类器分类
- 7.10.1 准备工作
- 7.10.2 工作方式
- 7.10.3 工作原理
- 7.10.4 更多信息
- 7.10.5 参
- 7.11 使用NLTK 练器 练分类器
- 7.11.1 工作方式
- 7.11.2 工作原理
- 7.11.3 更多信息
- 7.11.4 参
- 第8章 分布式 程和大型数据 的处理
- 8.1 引
- 8.2 使用execnet 分布式标注
- 8.2.1 准备工作
- 8.2.2 工作方式
- 8.2.3 工作原理
- 8.2.4 更多内容
- 8.2.5 参
- 8.3 使用execnet 分布式组块
- 8.3.1 准备工作
- 8.3.2 工作方式
- 8.3.3 工作原理
- 8.3.4 更多内容
- 8.3.5 参
- 8.4 使用execnet 并 处理列
- 8.4.1 工作方式
- 8.4.2 工作原理
- 8.4.3 更多内容
- 8.4.4 参
- 8.5 在Redis 中存储 率分布
- 8.5.1 准备工作
- 8.5.2 工作方式
- 8.5.3 工作原理
- 8.5.4 更多内容
- 8.5.5 参
- 8.6 在Redis 中存储条件 率分布
- 8.6.1 准备工作
- 8.6.2 工作方式
- 8.6.3 工作原理
- 8.6.4 更多内容
- 8.6.5 参
- 8.7 在Redis 中存储有序字典
- 8.7.1 准备工作
- 8.7.2 工作方式
- 8.7.3 工作原理
- 8.7.4 更多内容
- 8.7.5 参
- 8.8 使用Redis 和execnet 分布式单 分
- 8.8.1 准备工作
- 8.8.2 工作方式
- 8.8.3 工作原理
- 8.8.4 更多内容
- 8.8.5 参
- 第9章 析特定的数据类型
- 9.1 引
- 9.2 使用dateutil 析日期和时
- 9.2.1 准备工作
- 9.2.2 工作方式
- 9.2.3 工作原理
- 9.2.4 更多信息
- 9.2.5 参
- 9.3 时区的查找和 换
- 9.3.1 准备工作
- 9.3.2 工作方式
- 9.3.3 工作原理
- 9.3.4 更多信息
- 9.3.5 参
- 9.4 使用lxml 从HTML 中提取URL
- 9.4.1 准备工作
- 9.4.2 工作方式
- 9.4.3 工作原理
- 9.4.4 更多信息
- 9.4.5 参
- 9.5 清理和剥离HTML
- 9.5.1 准备工作
- 9.5.2 工作方式
- 9.5.3 工作原理
- 9.5.4 更多信息.
- 9.5.5 参.
- Notes:
- Ben shu you Yingguo Packt Publishing gong si shou quan Ren min you dian chu ban she chu ban.
- Description based on publisher supplied metadata and other sources.
- Description based on print version record.
- ISBN:
- 9781837639168
- 1837639167
- OCLC:
- 1425142849
The Penn Libraries is committed to describing library materials using current, accurate, and responsible language. If you discover outdated or inaccurate language, please fill out this feedback form to report it and suggest alternative language.